如何“grep”连续流?

2024-09-30 14:02:00
admin
原创
244
摘要:问题描述:grep可以在连续流中使用吗?我的意思是一种tail -f <file>命令,但是grep在输出中只保留我感兴趣的行。我试过了tail -f <file> | grep pattern但是似乎grep只能执行一次tail完成,也就是说永远不会。解决方案 1:使...

问题描述:

grep可以在连续流中使用吗?

我的意思是一种tail -f <file>命令,但是grep在输出中只保留我感兴趣的行。

我试过了tail -f <file> | grep pattern但是似乎grep只能执行一次tail完成,也就是说永远不会。


解决方案 1:

使用 BSD grep (FreeBSD、Mac OS X 等) 时打开grep的行缓冲模式

tail -f file | grep --line-buffered my_pattern

不久前,--line-bufferedGNU grep(几乎可用于任何 Linux)似乎没有问题,因为它默认会刷新(对于其他类 Unix,例如 SmartOS、AIX 或 QNX,情况可能有所不同)。但是,截至 2020 年 11 月,--line-buffered需要(至少在 openSUSE 中 GNU grep 3.5 需要,但根据下面的评论,似乎通常需要)。

解决方案 2:

tail -f <file> | grep <pattern>一直都在使用它。

它将等到 grep 刷新,而不是等到它完成(我正在使用 Ubuntu)。

解决方案 3:

我认为你的问题是 grep 使用了一些输出缓冲。尝试

tail -f file | stdbuf -o0 grep my_pattern

它将把 grep 的输出缓冲模式设置为无缓冲。

解决方案 4:

如果你想在整个文件(而不仅仅是尾部)中查找匹配项,并且希望它等待任何新的匹配项,那么这样做很好:

tail -c +0 -f <file> | grep --line-buffered <pattern>

-c +0标志表示输出应从文件开头0()开始字节()。-c`+`

解决方案 5:

在大多数情况下,您可以tail -f /var/log/some.log |grep foo并且它会正常工作。

如果您需要在正在运行的日志文件上使用多个 grep,但发现没有输出,则可能需要将开关--line-buffered插入中间的grep,如下所示:

tail -f /var/log/some.log | grep --line-buffered foo | grep bar

解决方案 6:

您可能会认为这个答案是一种增强。通常我使用

tail -F <fileName> | grep --line-buffered  <pattern> -A 3 -B 5

如果文件旋转,-F 效果会更好(如果文件旋转,-f 将无法正常工作)

-A 和 -B 有助于获取模式出现之前和之后的线条。这些块将出现在虚线分隔符之间

但对我来说,我更喜欢做以下事情

tail -F <file> | less

如果你想在流日志中搜索,这非常有用。我的意思是来回查看并深入查看

解决方案 7:

没有看到任何人提供我通常的做法:

less +F <file>
ctrl + c
/<search term>
<enter>
shift + f

我更喜欢这个,因为您可以ctrl + c随时使用它来停止和浏览文件,然后只需点击shift + f即可返回实时流式搜索。

解决方案 8:

sed会是一个更好的选择(编辑器)

tail -n0 -f <file> | sed -n '/search string/p'

然后,如果您希望 tail 命令在找到特定字符串后退出:

tail --pid=$(($BASHPID+1)) -n0 -f <file> | sed -n '/search string/{p; q}'

显然是 bashism:$BASHPID 将是 tail 命令的进程 ID。sed 命令在管道中位于 tail 之后,因此 sed 进程 ID 将是 $BASHPID+1。

解决方案 9:

这个问题问得有些晚了,考虑到这类工作是监控工作的重要组成部分,这是我的(不太简短的)回答...

使用以下日志狂欢

  1. 命令tail


这个命令比已经发布的答案更详细一些

  1. follow选项tail -fman 页tail -F中的 ,之间的区别:

   -f, --follow[={name|descriptor}]
          output appended data as the file grows;
...
   -F     same as --follow=name --retry
...
   --retry
          keep trying to open a file if it is inaccessible

这意味着:通过使用-F而不是-ftail将在删除时重新打开文件(例如,在日志轮换时)。

这对于查看多天的日志文件很有用。

  1. 我已经使用过同时关注多个文件的能力:

tail -F /var/www/clients/client*/web*/log/{error,access}.log /var/log/{mail,auth}.log \n           /var/log/apache2/{,ssl_,other_vhosts_}access.log \n           /var/log/pure-ftpd/transfer.log

通过数百个文件跟踪事件...(考虑这个答案的其余部分以了解如何使其可读......;)

  1. 使用开关-n(不要-c用于行缓冲!)。
    默认情况下tail将显示最后 10 行。这可以调整:

tail -n 0 -F file

将跟踪文件,但只会打印新行

tail -n +0 -F file

在跟踪他的进展之前将打印整个文件。

2.管道传输时的缓冲问题:

如果您计划过滤输出,请考虑缓冲!请参阅-u选项sed--line-buffered或命令grepstdbuf

tail -F /some/files | sed -une '/Regular Expression/p'

比使用更有效率,比在命令中不使用 switchgrep更灵敏。-u`sed`

tail -F /some/files |
    sed -une '/Regular Expression/p' |
    stdbuf -i0 -o0 tee /some/resultfile
  1. 最近日志系统


在最近的系统上,tail -f /var/log/syslog您不必journalctl -xf以几乎相同的方式运行......

journalctl -axf | sed -une '/Regular Expression/p'

但请阅读man page,这个工具是为日志分析而构建的!

  1. 将其整合到狂欢脚本


  1. 两个文件(或更多)的彩色输出

下面是监视多个文件的脚本示例,第一个文件的输出颜色与其他文件不同:

#!/bin/bash

tail -F "$@" |
    sed -une "
        /^==> /{h;};
        //!{
            G;
            s/^\(.*\)\n==>.*${1////\/}.*<==/\o33[47m\1\o33[0m/;
            s/^\(.*\)\n==> .* <==/\o33[47;31m\1\o33[0m/;
            p;}"

它们在我的主机上运行良好,运行:

sudo ./myColoredTail /var/log/{kern.,sys}log
  1. 交互式脚本

您可能正在观察对事件做出反应的日志?

这里有一个小脚本,当某些 USB 设备出现或消失时会播放一些声音,但相同的脚本可以发送邮件或进行任何其他交互,例如打开咖啡机......

#!/bin/bash

exec {tailF}< <(tail -F /var/log/kern.log)
tailPid=$!

while :;do
    read -rsn 1 -t .3 keyboard
    [ "${keyboard,}" = "q" ] && break
    if read -ru $tailF -t 0 _ ;then
        read -ru $tailF line
        case $line in
            *New USB device found* ) play /some/sound.ogg ;;
            *USB disconnect* ) play /some/othersound.ogg ;;
        esac
        printf "
%se[K" "$line"
    fi
done

echo
exec {tailF}<&-
kill $tailPid

您可以按键退出Q

解决方案 10:

是的,这确实可以正常工作。Grep大多数 Unix 命令每次对流进行一行操作。tail 输出的每一行都会被分析,如果匹配,则传递。

解决方案 11:

这个命令对我有用(Suse):

mail-srv:/var/log # tail -f /var/log/mail.info |grep --line-buffered LOGIN  >> logins_to_mail

收集邮件服务的登录信息

解决方案 12:

你肯定不会成功

tail -f /var/log/foo.log |grep --line-buffered string2search

当您使用“colortail”作为 tail 的别名时,例如在 bash 中

alias tail='colortail -n 30'

您可以通过类型别名进行检查,如果输出类似 tail isan alias of 的内容colortail -n 30,则说明您找到了罪魁祸首:)

解决方案:

删除别名

unalias tail

确保你正在通过此命令使用“真正的” tail 二进制文件

type tail

输出内容如下:

tail is /usr/bin/tail

然后你可以运行你的命令

tail -f foo.log |grep --line-buffered something

祝你好运。

解决方案 13:

在没有行缓冲选项的情况下,使用 awk(另一个很棒的 bash 实用程序)代替 grep!它将连续从 tail 流式传输数据。

这就是你使用 grep 的方式

tail -f <file> | grep pattern

这是你使用 awk 的方式

tail -f <file> | awk '/pattern/{print $0}'
相关推荐
  为什么项目管理通常仍然耗时且低效?您是否还在反复更新电子表格、淹没在便利贴中并参加每周更新会议?这确实是耗费时间和精力。借助软件工具的帮助,您可以一目了然地全面了解您的项目。如今,国内外有足够多优秀的项目管理软件可以帮助您掌控每个项目。什么是项目管理软件?项目管理软件是广泛行业用于项目规划、资源分配和调度的软件。它使项...
项目管理软件   1043  
  IPD(Integrated Product Development,集成产品开发)是一种系统化的产品开发方法论,旨在通过跨职能团队的协作,优化产品开发的效率和质量。IPD流程强调从市场需求出发,通过并行工程、跨部门协作和阶段性评审,确保产品从概念到上市的每个环节都高效且可控。随着敏捷开发方法的普及,越来越多的企业开始...
华为IPD流程   41  
  随着企业产品开发复杂度的提升以及市场需求的快速变化,传统的产品开发模式逐渐显现出局限性。集成产品开发(IPD)流程与敏捷开发(Agile Development)作为两种主流的开发方法论,分别从系统化管理和快速响应需求的角度为企业提供了解决方案。然而,单独使用其中一种方法往往无法完全满足企业在效率、质量和创新上的多重需...
华为IPD流程   35  
  华为IPD(Integrated Product Development,集成产品开发)流程是华为公司成功的关键因素之一。它不仅帮助华为在技术上实现了快速创新,还通过市场导向确保了产品的商业成功。IPD流程通过整合技术与市场双驱动,实现了从需求定义到产品交付的全生命周期管理。这种模式不仅提高了产品的开发效率,还降低了市...
IPD流程中PDCP是什么意思   32  
  在研发领域,集成产品开发(IPD)流程已经成为企业提升创新效率和市场竞争力的重要手段。然而,资源分配的不合理往往是制约IPD流程效率的关键因素之一。无论是人力资源、财务资源还是技术资源,如何高效分配直接关系到项目的成功与否。优化资源分配不仅能够缩短产品开发周期,还能降低研发成本,提升产品的市场竞争力。因此,掌握资源分配...
IPD流程中CDCP   34  
热门文章
项目管理软件有哪些?
云禅道AD
禅道项目管理软件

云端的项目管理软件

尊享禅道项目软件收费版功能

无需维护,随时随地协同办公

内置subversion和git源码管理

每天备份,随时转为私有部署

免费试用