使用 grep 在一行中匹配两个字符串

2024-10-11 08:36:00
admin
原创
81
摘要:问题描述:我尝试使用grep来匹配包含两个不同字符串的行。我尝试了以下方法,但这匹配了包含string1 或 string2 的行,这不是我想要的。grep 'string1|string2' filename 那么我该如何匹配仅包含两个字符串grep的行呢?解决方案 1:...

问题描述:

我尝试使用grep来匹配包含两个不同字符串的行。我尝试了以下方法,但这匹配了包含string1 string2 的行,这不是我想要的。

grep 'string1|string2' filename

那么我该如何匹配仅包含两个字符串grep的行呢?


解决方案 1:

您可以使用

grep 'string1' filename | grep 'string2'

这将在同一行上搜索字符串 1 和字符串 2,或者在同一行上搜索字符串 2 和字符串 1;但它并不回答这个问题:

grep 'string1.*string2|string2.*string1' filename

解决方案 2:

在文件名中搜索字符串 1 或字符串 2:

grep -E "string1|string2" filename

在 filename 中搜索 string1 和 string2 在同一行上的行,或者 string2 和 string1 在同一行上的行:

grep 'string1.*string2|string2.*string1' filename

请注意,这些都不能回答这个问题。

解决方案 3:

要在任意位置搜索包含任何顺序的所有单词的文件:

grep -ril 'action' | xargs grep -il 'model' | xargs grep -il 'view_type'

第一个 grep 启动递归搜索 ( r),忽略大小写 ( ) 并列出(打印出)与文件中任何位置出现的一个术语(带有单引号)i匹配的文件的名称( )。l`'action'`

后续的 grep 搜索其他术语,保留不区分大小写并列出匹配的文件。

您最终将获得的文件列表将包含这些术语,且以文件中的任何位置的任意顺序排列。

解决方案 4:

如果你有一个有限正则grep表达式的选项,你可以使用-P`perl`

grep -P '(?=.*string1)(?=.*string2)'

它的优点是可以处理重叠字符串。使用perlas更为直接grep,因为您可以更直接地指定 and 逻辑:

perl -ne 'print if /string1/ && /string2/'

解决方案 5:

你的方法几乎很好,只缺少-w

grep -w 'string1|string2' filename

解决方案 6:

不要尝试使用 grep 来实现这一点,而应使用 awk。要在 grep 中匹配 2 个正则表达式 R1 和 R2,您会认为应该这样做:

grep 'R1.*R2|R2.*R1'

而在 awk 中则是:

awk '/R1/ && /R2/'

但是如果R2与重叠或为子集怎么办R1? grep 命令根本不起作用,而 awk 命令可以。假设您要查找包含the和的行heat

$ echo 'theatre' | grep 'the.*heat|heat.*the'
$ echo 'theatre' | awk '/the/ && /heat/'
theatre

为此你必须使用 2 个 grep 和一个管道:

$ echo 'theatre' | grep 'the' | grep 'heat'
theatre

当然,如果您确实需要将它们分开,您可以始终在 awk 中写入与在 grep 中使用的相同的正则表达式,并且还有其他 awk 解决方案,不涉及在每个可能的序列中重复正则表达式。

除此之外,如果你想扩展你的解决方案以匹配 3 个正则表达式 R1、R2 和 R3,该怎么办?在 grep 中,这将是以下糟糕的选择之一:

grep 'R1.*R2.*R3|R1.*R3.*R2|R2.*R1.*R3|R2.*R3.*R1|R3.*R1.*R2|R3.*R2.*R1' file
grep R1 file | grep R2 | grep R3

而在 awk 中,它是简洁,明显,简单,高效的:

awk '/R1/ && /R2/ && /R3/'

现在,如果您实际上想要匹配文字字符串 S1 和 S2,而不是正则表达式 R1 和 R2,该怎么办?您无法在一次调用 grep 中做到这一点,您必须在调用 grep 之前编写代码来转义所有 RE 元字符:

S1=$(sed 's/[^^]/[&]/g; s/^/\^/g' <<< 'R1')
S2=$(sed 's/[^^]/[&]/g; s/^/\^/g' <<< 'R2')
grep 'S1.*S2|S2.*S1'

或者再次使用 2 个 grep 和一个管道:

grep -F 'S1' file | grep -F 'S2'

这又是糟糕的选择,而使用 awk 只需使用字符串运算符而不是正则表达式运算符:

awk 'index($0,S1) && index($0.S2)'

现在,如果你想在一个段落而不是一行中匹配 2 个正则表达式,该怎么办?在 grep 中无法完成,在 awk 中很简单:

awk -v RS='' '/R1/ && /R2/'

那么对整个文件进行操作呢?同样,在 grep 中无法完成,在 awk 中也很简单(这次我使用 GNU awk 进行多字符 RS 以简化操作,但任何 awk 中的代码都不会太多,或者您可以选择一个您知道不会出现在 RS 输入中的控制字符来执行相同操作):

awk -v RS='^$' '/R1/ && /R2/'

所以 - 如果您想在一行、一段或一个文件中查找多个正则表达式或字符串,那么不要使用 grep,而要使用 awk。

解决方案 7:

您可以尝试这样的事情:

(pattern1.*pattern2|pattern2.*pattern1)

解决方案 8:

正如人们建议使用 perl 和 python 以及复杂的 shell 脚本一样,这里有一个简单的awk方法:

awk '/string1/ && /string2/' filename

看了对已接受答案的评论:不,这不具有多行功能;但这也不是问题作者所要求的。

解决方案 9:

正则表达式中的运算|符表示或。也就是说,string1 或 string2 都会匹配。您可以这样做:

grep 'string1' filename | grep 'string2'

这会将第一个命令的结果导入第二个 grep。这样你只会得到与两个命令都匹配的行。

解决方案 10:

git grep

git grep以下是使用多种模式的语法:

git grep --all-match --no-index -l -e string1 -e string2 -e string3 file

您还可以将模式与布尔表达式相结合,例如--and--or--not

寻求man git-grep帮助。


--all-match当给出多个模式表达式时,指定此标志以将匹配限制为具有与所有模式表达式匹配的行的文件

--no-index 搜索当前目录中不受 Git 管理的文件。

-l//仅--files-with-matches显示--name-only文件的名称。

-e下一个参数是模式。默认使用基本正则表达式。

其他需要考虑的参数:

--threads要使用的 grep 工作线程的数量。

-q//不--quiet输出--silent匹配的行;匹配时以状态 0 退出。

要更改图案类型,您还可以使用-G/ --basic-regexp(默认)、-F/ --fixed-strings-E/ --extended-regexp-P/ --perl-regexp-f file和其他。

有关的:

  • 如何 grep 同一行上的两个单词?

  • 检查文件中是否存在多个字符串或正则表达式

  • 如何使用多个 AND 模式运行 grep? &一次匹配文件中的所有模式

对于OR运算,请参阅:

  • 我如何使用带有管道字符的模式来 grep 多个模式?

  • Grep:如何添加“OR”条件?

解决方案 11:

grep ‘string1|string2’ FILENAME 

GNU grep 版本 3.1

解决方案 12:

找到仅以 6 个空格开头并以此结尾的行:

 cat my_file.txt | grep
 -e '^      .*(.c$|.cpp$|.h$|.log$|.out$)' # .c or .cpp or .h or .log or .out
 -e '^      .*[0-9]{5,9}$' # numers between 5 and 9 digist
 > nolog.txt

解决方案 13:

假设我们需要在文件 testfile 中查找多个单词的数量。有两种方法可以实现

1)使用正则表达式匹配模式的 grep 命令

grep -c '<(DOG|CAT)>' testfile

2)使用 egrep 命令

egrep -c 'DOG|CAT' testfile 

使用 egrep 时您不需要担心表达,只需用管道分隔符分隔单词即可。

解决方案 14:

将要 grep 的字符串放入文件中

echo who    > find.txt
echo Roger >> find.txt
echo [44][0-9]{9,} >> find.txt

然后使用 -f 搜索

grep -f find.txt BIG_FILE_TO_SEARCH.txt 

解决方案 15:

grep '(string1.*string2 | string2.*string1)' filename

将获得以任意顺序包含 string1 和 string2 的行

解决方案 16:

grep -i -w 'string1|string2' filename

这适用于精确匹配单词和匹配不区分大小写的单词,为此使用 -i

解决方案 17:

对于多行匹配:

echo -e "test1
test2
test3" |tr -d '
' |grep "test1.*test3"

或者

echo -e "test1
test5
test3" >tst.txt
cat tst.txt |tr -d '
' |grep "test1.*test3|test3.*test1"

我们只需要删除换行符就可以了!

解决方案 18:

你应该grep像这样:

$ grep 'string1' file | grep 'string2'

解决方案 19:

我经常遇到和你一样的问题,我刚写了一段脚本:

function m() { # m means 'multi pattern grep'

    function _usage() {
    echo "usage: COMMAND [-inH] -p<pattern1> -p<pattern2> <filename>"
    echo "-i : ignore case"
    echo "-n : show line number"
    echo "-H : show filename"
    echo "-h : show header"
    echo "-p : specify pattern"
    }

    declare -a patterns
    # it is important to declare OPTIND as local
    local ignorecase_flag  filename linum header_flag colon result OPTIND

    while getopts "iHhnp:" opt; do
    case $opt in
        i)
        ignorecase_flag=true ;;
        H)
        filename="FILENAME," ;;
        n)
        linum="NR," ;;
        p)
        patterns+=( "$OPTARG" ) ;;
        h)
        header_flag=true ;;
        ?)
        _usage
        return ;;
    esac
    done

    if [[ -n $filename || -n $linum ]]; then
    colon="":","
    fi

    shift $(( $OPTIND - 1 ))

    if [[ $ignorecase_flag == true ]]; then
    for s in "${patterns[@]}"; do
            result+=" && s~/${s,,}/"
    done
    result=${result# && }
    result="{s=tolower($0)} $result"
    else
    for s in "${patterns[@]}"; do
            result="$result && /$s/"
    done
    result=${result# && }
    fi

    result+=" { print "$filename$linum$colon"$0 }"

    if [[ ! -t 0 ]]; then       # pipe case
    cat - | awk "${result}"
    else
    for f in "$@"; do
        [[ $header_flag == true ]] && echo "########## $f ##########"
        awk "${result}" $f
    done
    fi
}

用法:

echo "a b c" | m -p A 
echo "a b c" | m -i -p A # a b c

如果你愿意的话,可以将其放在.bashrc 中。

解决方案 20:

当两个字符串按顺序排列时,在grep命令中放置一个模式:

$ grep -E "string1(?.*)string2" file

例如,如果名为的文件中含有以下几行Dockerfile

FROM python:3.8 as build-python
FROM python:3.8-slim

要获取包含字符串的行:FROM python然后as build-python使用:

$ grep -E "FROM python:(?.*) as build-python" Dockerfile

然后输出将仅显示包含两个字符串的行:

FROM python:3.8 as build-python

解决方案 21:

如果 git 已初始化并添加到分支,那么最好使用 git grep,因为它速度超快并且会在整个目录中搜索。

git grep 'string1.*string2.*string3'

解决方案 22:

String仅搜索两个并突出string1显示string2

grep -E 'string1.*string2|string2.*string1' filename | grep -E 'string1|string2'
  • 或者

grep 'string1.*string2|string2.*string1' filename | grep -E 'string1|string2'

解决方案 23:

对两个字符串进行 grep 的命令要简单得多:

(cat file | grep 'phrase_1') && (cat file | grep 'phrase_2')

解决方案 24:

ripgrep

以下是使用的示例rg

rg -N '(?P<p1>.*string1.*)(?P<p2>.*string2.*)' file.txt

它是最快的 grepping 工具之一,因为它建立在Rust 的正则表达式引擎之上,该引擎使用有限自动机、SIMD 和积极的文字优化来使搜索非常快。

使用它,特别是当你处理大量数据时。

另请参阅GH-875的相关功能请求。

相关推荐
  为什么项目管理通常仍然耗时且低效?您是否还在反复更新电子表格、淹没在便利贴中并参加每周更新会议?这确实是耗费时间和精力。借助软件工具的帮助,您可以一目了然地全面了解您的项目。如今,国内外有足够多优秀的项目管理软件可以帮助您掌控每个项目。什么是项目管理软件?项目管理软件是广泛行业用于项目规划、资源分配和调度的软件。它使项...
项目管理软件   601  
  华为IPD与传统研发模式的8大差异在快速变化的商业环境中,产品研发模式的选择直接决定了企业的市场响应速度和竞争力。华为作为全球领先的通信技术解决方案供应商,其成功在很大程度上得益于对产品研发模式的持续创新。华为引入并深度定制的集成产品开发(IPD)体系,相较于传统的研发模式,展现出了显著的差异和优势。本文将详细探讨华为...
IPD流程是谁发明的   7  
  如何通过IPD流程缩短产品上市时间?在快速变化的市场环境中,产品上市时间成为企业竞争力的关键因素之一。集成产品开发(IPD, Integrated Product Development)作为一种先进的产品研发管理方法,通过其结构化的流程设计和跨部门协作机制,显著缩短了产品上市时间,提高了市场响应速度。本文将深入探讨如...
华为IPD流程   9  
  在项目管理领域,IPD(Integrated Product Development,集成产品开发)流程图是连接创意、设计与市场成功的桥梁。它不仅是一个视觉工具,更是一种战略思维方式的体现,帮助团队高效协同,确保产品按时、按质、按量推向市场。尽管IPD流程图可能初看之下显得错综复杂,但只需掌握几个关键点,你便能轻松驾驭...
IPD开发流程管理   8  
  在项目管理领域,集成产品开发(IPD)流程被视为提升产品上市速度、增强团队协作与创新能力的重要工具。然而,尽管IPD流程拥有诸多优势,其实施过程中仍可能遭遇多种挑战,导致项目失败。本文旨在深入探讨八个常见的IPD流程失败原因,并提出相应的解决方法,以帮助项目管理者规避风险,确保项目成功。缺乏明确的项目目标与战略对齐IP...
IPD流程图   8  
热门文章
项目管理软件有哪些?
云禅道AD
禅道项目管理软件

云端的项目管理软件

尊享禅道项目软件收费版功能

无需维护,随时随地协同办公

内置subversion和git源码管理

每天备份,随时转为私有部署

免费试用