如何在 UNIX 中删除文件的最后一个字符?

2024-10-25 08:42:00
admin
原创
197
摘要:问题描述:假设我有一些任意的多行文本文件:sometext moretext lastline 我怎样才能删除文件的最后一个字符(e,而不是换行符或空字符)而不使文本文件无效?解决方案 1:一种更简单的方法(输出到 stdout,不更新输入文件):sed '$ s/.$//&#039...

问题描述:

假设我有一些任意的多行文本文件:

sometext
moretext
lastline

我怎样才能删除文件的最后一个字符(e,而不是换行符或空字符)而不使文本文件无效?


解决方案 1:

一种更简单的方法(输出到 stdout,不更新输入文件):

sed '$ s/.$//' somefile
  • $是仅与最后一行输入匹配的 Sed 地址,从而导致以下函数调用(s/.$//)仅在最后一行执行。

  • s/.$//用空字符串替换行(在本例中为最后一行)的最后一个字符;即有效地删除行上的最后一个字符(换行符之前)。

+ 注意:如果文件以*两个或更多*换行符结尾,则该命令为*无操作*。

.匹配行中的任意字符,并在其后跟上将$匹配锚定到行尾;请注意,$正则表达式$中的使用在概念上是相关的,但在技术上与之前作为 Sed地址的用法不同。

  • 带有 stdin 输入的示例(假设是 Bash、Ksh 或 Zsh):

  $ sed '$ s/.$//' <<< $'line one
line two'
  line one
  line tw

也更新输入文件(如果输入文件是符号链接则不要使用):

sed -i '$ s/.$//' somefile

笔记:

  • 在 macOS 上,您必须使用-i ''而不是仅仅使用-i;有关与之相关的陷阱的概述,请参阅此答案-i的下半部分。

  • 如果您需要处理非常大的输入文件和/或性能/磁盘使用情况令人担忧,并且您正在使用GNU实用程序(Linux),请参阅ImHere 的有用答案。

解决方案 2:

truncate

truncate -s-1 file

从同一文件末尾删除一个 (-1) 个字符。与>>将附加到同一文件完全相同。

这种方法的问题在于,如果存在尾随换行符,它不会保留它。

解决方案是:

if     [ -n "$(tail -c1 file)" ]    # if the file has not a trailing new line.
then
       truncate -s-1 file           # remove one char as the question request.
else
       truncate -s-2 file           # remove the last two characters
       echo "" >> file              # add the trailing new line back
fi

这是有效的,因为 tail 占用的是最后一个字节(而不是字符)。

即使文件很大,也几乎不需要时间。

为什么不sed

类似 sed 解决方案的问题sed '$ s/.$//' file在于它首先读取整个文件(对于大文件需要很长时间),然后需要一个临时文件(与原始文件大小相同):

sed '$ s/.$//' file  > tempfile
rm file; mv tempfile file

然后移动临时文件来替换该文件。

解决方案 3:

这是另一种使用方法ex,我发现它并不像 sed 解决方案那么神秘:

 printf '%s
' '$' 's/.$//' wq | ex somefile

转到$最后一行,s删除最后一个字符,这wq就是众所周知的(对于 vi 用户而言)写入 + 退出。

解决方案 4:

经过大量尝试不同的策略(并避免使用 sed -i 或 perl)之后,我发现最好的方法是:

sed '$! { P; D; }; s/.$//' somefile

解决方案 5:

如果目标是删除最后一行的最后一个字符,则awk应该这样做:

awk '{a[NR]=$0} END {for (i=1;i<NR;i++) print a[i];sub(/.$/,"",a[NR]);print a[NR]}' file
sometext
moretext
lastlin

它将所有数据存储到一个数组中,然后将其打印出来并更改最后一行。

解决方案 6:

需要注意的是:sed 将暂时删除该文件。因此,如果您正在拖尾该文件,您将收到“没有这样的文件或目录”警告,直到您重新发出 tail 命令为止。

解决方案 7:

编辑答案

我创建了一个脚本并将您的文本放在我的桌面上。此测试文件保存为“old_file.txt”

sometext
moretext
lastline

后来我写了一个小脚本来获取旧文件并删除最后一行的最后一个字符

#!/bin/bash
no_of_new_line_characters=`wc  '/root/Desktop/old_file.txt'|cut -d ' ' -f2`
let "no_of_lines=no_of_new_line_characters+1"
sed -n 1,"$no_of_new_line_characters"p  '/root/Desktop/old_file.txt' > '/root/Desktop/my_new_file'
sed -n "$no_of_lines","$no_of_lines"p '/root/Desktop/old_file.txt'|sed 's/.$//g' >> '/root/Desktop/my_new_file'

打开我创建的 new_file,显示的输出如下:

sometext
moretext
lastlin

我为之前的回答道歉(没有仔细阅读)

解决方案 8:

sed 's/.$//' filename | tee newFilename

这应该可以完成你的工作。

解决方案 9:

几个 perl 解决方案,用于比较/参考:

(echo 1a; echo 2b) | perl -e '$_=join("",<>); s/.$//; print'

(echo 1a; echo 2b) | perl -e 'while(<>){ if(eof) {s/.$//}; print }'

我发现第一种将整个文件读入内存的方法通常非常有用(对于这个特定问题则不那么有用)。您现在可以执行跨越多行的正则表达式,例如将每 3 行某种格式合并为 1 个摘要行。

对于这个问题,版本truncate会更快,sed输入起来也更短。请注意,truncate需要操作文件,而不是流。通常我发现sed它缺乏 perl 的功能,我更喜欢扩展正则表达式/perl-regex 语法。但这个问题有一个很好的sed解决方案。

相关推荐
  政府信创国产化的10大政策解读一、信创国产化的背景与意义信创国产化,即信息技术应用创新国产化,是当前中国信息技术领域的一个重要发展方向。其核心在于通过自主研发和创新,实现信息技术应用的自主可控,减少对外部技术的依赖,并规避潜在的技术制裁和风险。随着全球信息技术竞争的加剧,以及某些国家对中国在科技领域的打压,信创国产化显...
工程项目管理   1565  
  为什么项目管理通常仍然耗时且低效?您是否还在反复更新电子表格、淹没在便利贴中并参加每周更新会议?这确实是耗费时间和精力。借助软件工具的帮助,您可以一目了然地全面了解您的项目。如今,国内外有足够多优秀的项目管理软件可以帮助您掌控每个项目。什么是项目管理软件?项目管理软件是广泛行业用于项目规划、资源分配和调度的软件。它使项...
项目管理软件   1354  
  信创国产芯片作为信息技术创新的核心领域,对于推动国家自主可控生态建设具有至关重要的意义。在全球科技竞争日益激烈的背景下,实现信息技术的自主可控,摆脱对国外技术的依赖,已成为保障国家信息安全和产业可持续发展的关键。国产芯片作为信创产业的基石,其发展水平直接影响着整个信创生态的构建与完善。通过不断提升国产芯片的技术实力、产...
国产信创系统   21  
  信创生态建设旨在实现信息技术领域的自主创新和安全可控,涵盖了从硬件到软件的全产业链。随着数字化转型的加速,信创生态建设的重要性日益凸显,它不仅关乎国家的信息安全,更是推动产业升级和经济高质量发展的关键力量。然而,在推进信创生态建设的过程中,面临着诸多复杂且严峻的挑战,需要深入剖析并寻找切实可行的解决方案。技术创新难题技...
信创操作系统   27  
  信创产业作为国家信息技术创新发展的重要领域,对于保障国家信息安全、推动产业升级具有关键意义。而国产芯片作为信创产业的核心基石,其研发进展备受关注。在信创国产芯片的研发征程中,面临着诸多复杂且艰巨的难点,这些难点犹如一道道关卡,阻碍着国产芯片的快速发展。然而,科研人员和相关企业并未退缩,积极探索并提出了一系列切实可行的解...
国产化替代产品目录   28  
热门文章
项目管理软件有哪些?
云禅道AD
禅道项目管理软件

云端的项目管理软件

尊享禅道项目软件收费版功能

无需维护,随时随地协同办公

内置subversion和git源码管理

每天备份,随时转为私有部署

免费试用