是否可以就地修改文件中的行?
- 2024-12-12 08:41:00
- admin 原创
- 168
问题描述:
是否可以逐行解析文件,并在浏览行的同时就地编辑行?
解决方案 1:
是否可以逐行解析文件,并在浏览行的同时就地编辑行?
fileinput
它可以像 stdlib 的模块一样使用备份文件进行模拟。
some_condition
这是一个示例脚本,它从命令行或给出的文件中删除不满足要求的行stdin
:
#!/usr/bin/env python
# grep_some_condition.py
import fileinput
for line in fileinput.input(inplace=True, backup='.bak'):
if some_condition(line):
print line, # this goes to the current file
例子:
$ python grep_some_condition.py first_file.txt second_file.txt
完成后first_file.txt
,second_file.txt
文件将只包含满足some_condition()
谓词的行。
解决方案 2:
fileinput
模块有非常丑陋的 API,我为这个任务找到了漂亮的模块 - in_place,Python 3 的示例:
import in_place
with in_place.InPlace('data.txt') as file:
for line in file:
line = line.replace('test', 'testZ')
file.write(line)
file.close()
与 fileinput 的主要区别:
不是劫持
sys.stdout
,而是返回一个新的文件句柄进行写入。文件句柄支持所有标准 I/O 方法,而不仅仅是
readline()
。
重要提示:
如果您不使用行重写,此解决方案将删除文件中的每一行
file.write()
。此外,如果该过程中断,您将丢失文件中尚未重写的任何行。
解决方案 3:
不可以。您无法安全地写入您正在读取的文件,因为您对文件所做的任何更改都可能覆盖您尚未读取的内容。要安全地执行此操作,您必须将文件读入缓冲区,根据需要更新所有行,然后重新写入文件。
如果您逐字节替换文件中的内容(即,如果您要替换的文本与要替换的新字符串的长度相同),那么您可以摆脱它,但这是一个马蜂窝,所以我会省去麻烦,只需读取整个文件,替换内存中的内容(或通过临时文件),然后再次将其写出。
解决方案 4:
如果您只打算执行不改变文件修改部分的长度的本地化更改(例如,将所有字符更改为小写),那么您实际上可以动态覆盖文件的旧内容。
为此,您可以使用对象seek()
的方法进行随机文件访问file
。
或者,您可以使用mmap
对象将整个文件视为可变字符串。请记住,mmap
对象可能会在 32 位 CPU 上施加 2-4 GB 范围内的最大文件大小限制,具体取决于您的操作系统及其配置。
解决方案 5:
您必须按行的字符大小进行备份。假设您使用了readline
,那么您可以获取行的长度并使用以下方法进行备份:
file.seek(offset[, whence])
将起点设置为SEEK_CUR
,将偏移量设置为-length
。
请参阅Python 文档或查看手册页seek
。