如何“grep”连续流?

2024-09-30 14:02:00
admin
原创
139
摘要:问题描述:grep可以在连续流中使用吗?我的意思是一种tail -f <file>命令,但是grep在输出中只保留我感兴趣的行。我试过了tail -f <file> | grep pattern但是似乎grep只能执行一次tail完成,也就是说永远不会。解决方案 1:使...

问题描述:

grep可以在连续流中使用吗?

我的意思是一种tail -f <file>命令,但是grep在输出中只保留我感兴趣的行。

我试过了tail -f <file> | grep pattern但是似乎grep只能执行一次tail完成,也就是说永远不会。


解决方案 1:

使用 BSD grep (FreeBSD、Mac OS X 等) 时打开grep的行缓冲模式

tail -f file | grep --line-buffered my_pattern

不久前,--line-bufferedGNU grep(几乎可用于任何 Linux)似乎没有问题,因为它默认会刷新(对于其他类 Unix,例如 SmartOS、AIX 或 QNX,情况可能有所不同)。但是,截至 2020 年 11 月,--line-buffered需要(至少在 openSUSE 中 GNU grep 3.5 需要,但根据下面的评论,似乎通常需要)。

解决方案 2:

tail -f <file> | grep <pattern>一直都在使用它。

它将等到 grep 刷新,而不是等到它完成(我正在使用 Ubuntu)。

解决方案 3:

我认为你的问题是 grep 使用了一些输出缓冲。尝试

tail -f file | stdbuf -o0 grep my_pattern

它将把 grep 的输出缓冲模式设置为无缓冲。

解决方案 4:

如果你想在整个文件(而不仅仅是尾部)中查找匹配项,并且希望它等待任何新的匹配项,那么这样做很好:

tail -c +0 -f <file> | grep --line-buffered <pattern>

-c +0标志表示输出应从文件开头0()开始字节()。-c`+`

解决方案 5:

在大多数情况下,您可以tail -f /var/log/some.log |grep foo并且它会正常工作。

如果您需要在正在运行的日志文件上使用多个 grep,但发现没有输出,则可能需要将开关--line-buffered插入中间的grep,如下所示:

tail -f /var/log/some.log | grep --line-buffered foo | grep bar

解决方案 6:

您可能会认为这个答案是一种增强。通常我使用

tail -F <fileName> | grep --line-buffered  <pattern> -A 3 -B 5

如果文件旋转,-F 效果会更好(如果文件旋转,-f 将无法正常工作)

-A 和 -B 有助于获取模式出现之前和之后的线条。这些块将出现在虚线分隔符之间

但对我来说,我更喜欢做以下事情

tail -F <file> | less

如果你想在流日志中搜索,这非常有用。我的意思是来回查看并深入查看

解决方案 7:

没有看到任何人提供我通常的做法:

less +F <file>
ctrl + c
/<search term>
<enter>
shift + f

我更喜欢这个,因为您可以ctrl + c随时使用它来停止和浏览文件,然后只需点击shift + f即可返回实时流式搜索。

解决方案 8:

sed会是一个更好的选择(编辑器)

tail -n0 -f <file> | sed -n '/search string/p'

然后,如果您希望 tail 命令在找到特定字符串后退出:

tail --pid=$(($BASHPID+1)) -n0 -f <file> | sed -n '/search string/{p; q}'

显然是 bashism:$BASHPID 将是 tail 命令的进程 ID。sed 命令在管道中位于 tail 之后,因此 sed 进程 ID 将是 $BASHPID+1。

解决方案 9:

这个问题问得有些晚了,考虑到这类工作是监控工作的重要组成部分,这是我的(不太简短的)回答...

使用以下日志狂欢

  1. 命令tail


这个命令比已经发布的答案更详细一些

  1. follow选项tail -fman 页tail -F中的 ,之间的区别:

   -f, --follow[={name|descriptor}]
          output appended data as the file grows;
...
   -F     same as --follow=name --retry
...
   --retry
          keep trying to open a file if it is inaccessible

这意味着:通过使用-F而不是-ftail将在删除时重新打开文件(例如,在日志轮换时)。

这对于查看多天的日志文件很有用。

  1. 我已经使用过同时关注多个文件的能力:

tail -F /var/www/clients/client*/web*/log/{error,access}.log /var/log/{mail,auth}.log \n           /var/log/apache2/{,ssl_,other_vhosts_}access.log \n           /var/log/pure-ftpd/transfer.log

通过数百个文件跟踪事件...(考虑这个答案的其余部分以了解如何使其可读......;)

  1. 使用开关-n(不要-c用于行缓冲!)。
    默认情况下tail将显示最后 10 行。这可以调整:

tail -n 0 -F file

将跟踪文件,但只会打印新行

tail -n +0 -F file

在跟踪他的进展之前将打印整个文件。

2.管道传输时的缓冲问题:

如果您计划过滤输出,请考虑缓冲!请参阅-u选项sed--line-buffered或命令grepstdbuf

tail -F /some/files | sed -une '/Regular Expression/p'

比使用更有效率,比在命令中不使用 switchgrep更灵敏。-u`sed`

tail -F /some/files |
    sed -une '/Regular Expression/p' |
    stdbuf -i0 -o0 tee /some/resultfile
  1. 最近日志系统


在最近的系统上,tail -f /var/log/syslog您不必journalctl -xf以几乎相同的方式运行......

journalctl -axf | sed -une '/Regular Expression/p'

但请阅读man page,这个工具是为日志分析而构建的!

  1. 将其整合到狂欢脚本


  1. 两个文件(或更多)的彩色输出

下面是监视多个文件的脚本示例,第一个文件的输出颜色与其他文件不同:

#!/bin/bash

tail -F "$@" |
    sed -une "
        /^==> /{h;};
        //!{
            G;
            s/^\(.*\)\n==>.*${1////\/}.*<==/\o33[47m\1\o33[0m/;
            s/^\(.*\)\n==> .* <==/\o33[47;31m\1\o33[0m/;
            p;}"

它们在我的主机上运行良好,运行:

sudo ./myColoredTail /var/log/{kern.,sys}log
  1. 交互式脚本

您可能正在观察对事件做出反应的日志?

这里有一个小脚本,当某些 USB 设备出现或消失时会播放一些声音,但相同的脚本可以发送邮件或进行任何其他交互,例如打开咖啡机......

#!/bin/bash

exec {tailF}< <(tail -F /var/log/kern.log)
tailPid=$!

while :;do
    read -rsn 1 -t .3 keyboard
    [ "${keyboard,}" = "q" ] && break
    if read -ru $tailF -t 0 _ ;then
        read -ru $tailF line
        case $line in
            *New USB device found* ) play /some/sound.ogg ;;
            *USB disconnect* ) play /some/othersound.ogg ;;
        esac
        printf "
%se[K" "$line"
    fi
done

echo
exec {tailF}<&-
kill $tailPid

您可以按键退出Q

解决方案 10:

是的,这确实可以正常工作。Grep大多数 Unix 命令每次对流进行一行操作。tail 输出的每一行都会被分析,如果匹配,则传递。

解决方案 11:

这个命令对我有用(Suse):

mail-srv:/var/log # tail -f /var/log/mail.info |grep --line-buffered LOGIN  >> logins_to_mail

收集邮件服务的登录信息

解决方案 12:

你肯定不会成功

tail -f /var/log/foo.log |grep --line-buffered string2search

当您使用“colortail”作为 tail 的别名时,例如在 bash 中

alias tail='colortail -n 30'

您可以通过类型别名进行检查,如果输出类似 tail isan alias of 的内容colortail -n 30,则说明您找到了罪魁祸首:)

解决方案:

删除别名

unalias tail

确保你正在通过此命令使用“真正的” tail 二进制文件

type tail

输出内容如下:

tail is /usr/bin/tail

然后你可以运行你的命令

tail -f foo.log |grep --line-buffered something

祝你好运。

解决方案 13:

在没有行缓冲选项的情况下,使用 awk(另一个很棒的 bash 实用程序)代替 grep!它将连续从 tail 流式传输数据。

这就是你使用 grep 的方式

tail -f <file> | grep pattern

这是你使用 awk 的方式

tail -f <file> | awk '/pattern/{print $0}'
相关推荐
  为什么项目管理通常仍然耗时且低效?您是否还在反复更新电子表格、淹没在便利贴中并参加每周更新会议?这确实是耗费时间和精力。借助软件工具的帮助,您可以一目了然地全面了解您的项目。如今,国内外有足够多优秀的项目管理软件可以帮助您掌控每个项目。什么是项目管理软件?项目管理软件是广泛行业用于项目规划、资源分配和调度的软件。它使项...
项目管理软件   601  
  华为IPD与传统研发模式的8大差异在快速变化的商业环境中,产品研发模式的选择直接决定了企业的市场响应速度和竞争力。华为作为全球领先的通信技术解决方案供应商,其成功在很大程度上得益于对产品研发模式的持续创新。华为引入并深度定制的集成产品开发(IPD)体系,相较于传统的研发模式,展现出了显著的差异和优势。本文将详细探讨华为...
IPD流程是谁发明的   7  
  如何通过IPD流程缩短产品上市时间?在快速变化的市场环境中,产品上市时间成为企业竞争力的关键因素之一。集成产品开发(IPD, Integrated Product Development)作为一种先进的产品研发管理方法,通过其结构化的流程设计和跨部门协作机制,显著缩短了产品上市时间,提高了市场响应速度。本文将深入探讨如...
华为IPD流程   9  
  在项目管理领域,IPD(Integrated Product Development,集成产品开发)流程图是连接创意、设计与市场成功的桥梁。它不仅是一个视觉工具,更是一种战略思维方式的体现,帮助团队高效协同,确保产品按时、按质、按量推向市场。尽管IPD流程图可能初看之下显得错综复杂,但只需掌握几个关键点,你便能轻松驾驭...
IPD开发流程管理   8  
  在项目管理领域,集成产品开发(IPD)流程被视为提升产品上市速度、增强团队协作与创新能力的重要工具。然而,尽管IPD流程拥有诸多优势,其实施过程中仍可能遭遇多种挑战,导致项目失败。本文旨在深入探讨八个常见的IPD流程失败原因,并提出相应的解决方法,以帮助项目管理者规避风险,确保项目成功。缺乏明确的项目目标与战略对齐IP...
IPD流程图   8  
热门文章
项目管理软件有哪些?
云禅道AD
禅道项目管理软件

云端的项目管理软件

尊享禅道项目软件收费版功能

无需维护,随时随地协同办公

内置subversion和git源码管理

每天备份,随时转为私有部署

免费试用