如何“grep”连续流?

2024-09-30 14:02:00
admin
原创
308
摘要:问题描述:grep可以在连续流中使用吗?我的意思是一种tail -f <file>命令,但是grep在输出中只保留我感兴趣的行。我试过了tail -f <file> | grep pattern但是似乎grep只能执行一次tail完成,也就是说永远不会。解决方案 1:使...

问题描述:

grep可以在连续流中使用吗?

我的意思是一种tail -f <file>命令,但是grep在输出中只保留我感兴趣的行。

我试过了tail -f <file> | grep pattern但是似乎grep只能执行一次tail完成,也就是说永远不会。


解决方案 1:

使用 BSD grep (FreeBSD、Mac OS X 等) 时打开grep的行缓冲模式

tail -f file | grep --line-buffered my_pattern

不久前,--line-bufferedGNU grep(几乎可用于任何 Linux)似乎没有问题,因为它默认会刷新(对于其他类 Unix,例如 SmartOS、AIX 或 QNX,情况可能有所不同)。但是,截至 2020 年 11 月,--line-buffered需要(至少在 openSUSE 中 GNU grep 3.5 需要,但根据下面的评论,似乎通常需要)。

解决方案 2:

tail -f <file> | grep <pattern>一直都在使用它。

它将等到 grep 刷新,而不是等到它完成(我正在使用 Ubuntu)。

解决方案 3:

我认为你的问题是 grep 使用了一些输出缓冲。尝试

tail -f file | stdbuf -o0 grep my_pattern

它将把 grep 的输出缓冲模式设置为无缓冲。

解决方案 4:

如果你想在整个文件(而不仅仅是尾部)中查找匹配项,并且希望它等待任何新的匹配项,那么这样做很好:

tail -c +0 -f <file> | grep --line-buffered <pattern>

-c +0标志表示输出应从文件开头0()开始字节()。-c`+`

解决方案 5:

在大多数情况下,您可以tail -f /var/log/some.log |grep foo并且它会正常工作。

如果您需要在正在运行的日志文件上使用多个 grep,但发现没有输出,则可能需要将开关--line-buffered插入中间的grep,如下所示:

tail -f /var/log/some.log | grep --line-buffered foo | grep bar

解决方案 6:

您可能会认为这个答案是一种增强。通常我使用

tail -F <fileName> | grep --line-buffered  <pattern> -A 3 -B 5

如果文件旋转,-F 效果会更好(如果文件旋转,-f 将无法正常工作)

-A 和 -B 有助于获取模式出现之前和之后的线条。这些块将出现在虚线分隔符之间

但对我来说,我更喜欢做以下事情

tail -F <file> | less

如果你想在流日志中搜索,这非常有用。我的意思是来回查看并深入查看

解决方案 7:

没有看到任何人提供我通常的做法:

less +F <file>
ctrl + c
/<search term>
<enter>
shift + f

我更喜欢这个,因为您可以ctrl + c随时使用它来停止和浏览文件,然后只需点击shift + f即可返回实时流式搜索。

解决方案 8:

sed会是一个更好的选择(编辑器)

tail -n0 -f <file> | sed -n '/search string/p'

然后,如果您希望 tail 命令在找到特定字符串后退出:

tail --pid=$(($BASHPID+1)) -n0 -f <file> | sed -n '/search string/{p; q}'

显然是 bashism:$BASHPID 将是 tail 命令的进程 ID。sed 命令在管道中位于 tail 之后,因此 sed 进程 ID 将是 $BASHPID+1。

解决方案 9:

这个问题问得有些晚了,考虑到这类工作是监控工作的重要组成部分,这是我的(不太简短的)回答...

使用以下日志狂欢

  1. 命令tail


这个命令比已经发布的答案更详细一些

  1. follow选项tail -fman 页tail -F中的 ,之间的区别:

   -f, --follow[={name|descriptor}]
          output appended data as the file grows;
...
   -F     same as --follow=name --retry
...
   --retry
          keep trying to open a file if it is inaccessible

这意味着:通过使用-F而不是-ftail将在删除时重新打开文件(例如,在日志轮换时)。

这对于查看多天的日志文件很有用。

  1. 我已经使用过同时关注多个文件的能力:

tail -F /var/www/clients/client*/web*/log/{error,access}.log /var/log/{mail,auth}.log \n           /var/log/apache2/{,ssl_,other_vhosts_}access.log \n           /var/log/pure-ftpd/transfer.log

通过数百个文件跟踪事件...(考虑这个答案的其余部分以了解如何使其可读......;)

  1. 使用开关-n(不要-c用于行缓冲!)。
    默认情况下tail将显示最后 10 行。这可以调整:

tail -n 0 -F file

将跟踪文件,但只会打印新行

tail -n +0 -F file

在跟踪他的进展之前将打印整个文件。

2.管道传输时的缓冲问题:

如果您计划过滤输出,请考虑缓冲!请参阅-u选项sed--line-buffered或命令grepstdbuf

tail -F /some/files | sed -une '/Regular Expression/p'

比使用更有效率,比在命令中不使用 switchgrep更灵敏。-u`sed`

tail -F /some/files |
    sed -une '/Regular Expression/p' |
    stdbuf -i0 -o0 tee /some/resultfile
  1. 最近日志系统


在最近的系统上,tail -f /var/log/syslog您不必journalctl -xf以几乎相同的方式运行......

journalctl -axf | sed -une '/Regular Expression/p'

但请阅读man page,这个工具是为日志分析而构建的!

  1. 将其整合到狂欢脚本


  1. 两个文件(或更多)的彩色输出

下面是监视多个文件的脚本示例,第一个文件的输出颜色与其他文件不同:

#!/bin/bash

tail -F "$@" |
    sed -une "
        /^==> /{h;};
        //!{
            G;
            s/^\(.*\)\n==>.*${1////\/}.*<==/\o33[47m\1\o33[0m/;
            s/^\(.*\)\n==> .* <==/\o33[47;31m\1\o33[0m/;
            p;}"

它们在我的主机上运行良好,运行:

sudo ./myColoredTail /var/log/{kern.,sys}log
  1. 交互式脚本

您可能正在观察对事件做出反应的日志?

这里有一个小脚本,当某些 USB 设备出现或消失时会播放一些声音,但相同的脚本可以发送邮件或进行任何其他交互,例如打开咖啡机......

#!/bin/bash

exec {tailF}< <(tail -F /var/log/kern.log)
tailPid=$!

while :;do
    read -rsn 1 -t .3 keyboard
    [ "${keyboard,}" = "q" ] && break
    if read -ru $tailF -t 0 _ ;then
        read -ru $tailF line
        case $line in
            *New USB device found* ) play /some/sound.ogg ;;
            *USB disconnect* ) play /some/othersound.ogg ;;
        esac
        printf "
%se[K" "$line"
    fi
done

echo
exec {tailF}<&-
kill $tailPid

您可以按键退出Q

解决方案 10:

是的,这确实可以正常工作。Grep大多数 Unix 命令每次对流进行一行操作。tail 输出的每一行都会被分析,如果匹配,则传递。

解决方案 11:

这个命令对我有用(Suse):

mail-srv:/var/log # tail -f /var/log/mail.info |grep --line-buffered LOGIN  >> logins_to_mail

收集邮件服务的登录信息

解决方案 12:

你肯定不会成功

tail -f /var/log/foo.log |grep --line-buffered string2search

当您使用“colortail”作为 tail 的别名时,例如在 bash 中

alias tail='colortail -n 30'

您可以通过类型别名进行检查,如果输出类似 tail isan alias of 的内容colortail -n 30,则说明您找到了罪魁祸首:)

解决方案:

删除别名

unalias tail

确保你正在通过此命令使用“真正的” tail 二进制文件

type tail

输出内容如下:

tail is /usr/bin/tail

然后你可以运行你的命令

tail -f foo.log |grep --line-buffered something

祝你好运。

解决方案 13:

在没有行缓冲选项的情况下,使用 awk(另一个很棒的 bash 实用程序)代替 grep!它将连续从 tail 流式传输数据。

这就是你使用 grep 的方式

tail -f <file> | grep pattern

这是你使用 awk 的方式

tail -f <file> | awk '/pattern/{print $0}'
相关推荐
  政府信创国产化的10大政策解读一、信创国产化的背景与意义信创国产化,即信息技术应用创新国产化,是当前中国信息技术领域的一个重要发展方向。其核心在于通过自主研发和创新,实现信息技术应用的自主可控,减少对外部技术的依赖,并规避潜在的技术制裁和风险。随着全球信息技术竞争的加剧,以及某些国家对中国在科技领域的打压,信创国产化显...
工程项目管理   2230  
  为什么项目管理通常仍然耗时且低效?您是否还在反复更新电子表格、淹没在便利贴中并参加每周更新会议?这确实是耗费时间和精力。借助软件工具的帮助,您可以一目了然地全面了解您的项目。如今,国内外有足够多优秀的项目管理软件可以帮助您掌控每个项目。什么是项目管理软件?项目管理软件是广泛行业用于项目规划、资源分配和调度的软件。它使项...
项目管理软件   1482  
  医疗设备的生命周期管理(PLM)对于医疗机构的高效运作和患者的安全至关重要。在PLM过程中,风险管理是确保设备质量和控制成本的关键环节。随着医疗行业的不断发展,到2025年,质量成本控制成为了重中之重,而一系列审计指标则为实现这一目标提供了有力的衡量标准。设备采购阶段的审计指标设备采购是PLM的起点,这一阶段的决策直接...
plm项目   0  
  PLM(产品生命周期管理)项目管理在当今复杂多变的商业环境中面临着诸多挑战,其中时间管理尤为关键。有效的时间管理不仅能确保项目按时交付,还能提升产品质量、降低成本,并增强企业的竞争力。随着 2025 年的临近,PLM 项目管理需要探索新的优化策略来更好地应对时间管理挑战。精准规划项目时间表精准规划项目时间表是 PLM ...
plm工业软件   0  
  PLM(产品生命周期管理)系统在企业的产品研发、生产与管理过程中扮演着至关重要的角色。而PLM系统供应商作为这一关键技术的提供者,其管理成效直接影响着企业能否充分发挥PLM系统的优势,实现长期稳定的发展。有效的供应商管理并非简单的交易关系维护,而是构建一种深度合作、互利共赢的战略伙伴关系,以应对不断变化的市场环境和企业...
国产plm软件   0  
热门文章
项目管理软件有哪些?
云禅道AD
禅道项目管理软件

云端的项目管理软件

尊享禅道项目软件收费版功能

无需维护,随时随地协同办公

内置subversion和git源码管理

每天备份,随时转为私有部署

免费试用