没有 fsync() 的 rename() 是否安全?

2024-11-08 08:43:00
admin
原创
27
摘要:问题描述:rename(tmppath, path)如果不先打电话就直接拨打电话是否安全fsync(tmppath_fd)?我希望路径始终指向一个完整的文件。我主要关心Ext4。rename() 是否保证在所有未来的 Linux 内核版本中都是安全的?Python 中的使用示例:def store_atomi...

问题描述:

rename(tmppath, path)如果不先打电话就直接拨打电话是否安全fsync(tmppath_fd)

我希望路径始终指向一个完整的文件。我主要关心Ext4。rename() 是否保证在所有未来的 Linux 内核版本中都是安全的?

Python 中的使用示例:

def store_atomically(path, data):
    tmppath = path + ".tmp"
    output = open(tmppath, "wb")
    output.write(data)

    output.flush()
    os.fsync(output.fileno())  # The needed fsync().
    output.close()
    os.rename(tmppath, path)

解决方案 1:

不。

查看 libeatmydata 和此演示文稿:

吃掉我的数据:每个人都犯了文件 IO 错误

http://www.oscon.com/oscon2008/public/schedule/detail/3172

由 MySql 的 Stewart Smith 撰写。

如果它处于离线状态/不再可用,我会保留它的副本:

  • 视频在这里

  • 演示幻灯片(在线版幻灯片)

解决方案 2:

来自ext4 文档:

When mounting an ext4 filesystem, the following option are accepted:
(*) == default

auto_da_alloc(*)    Many broken applications don't use fsync() when 
noauto_da_alloc     replacing existing files via patterns such as
                    fd = open("foo.new")/write(fd,..)/close(fd)/
                    rename("foo.new", "foo"), or worse yet,
                    fd = open("foo", O_TRUNC)/write(fd,..)/close(fd).
                    If auto_da_alloc is enabled, ext4 will detect
                    the replace-via-rename and replace-via-truncate
                    patterns and force that any delayed allocation
                    blocks are allocated such that at the next
                    journal commit, in the default data=ordered
                    mode, the data blocks of the new file are forced
                    to disk before the rename() operation is
                    committed.  This provides roughly the same level
                    of guarantees as ext3, and avoids the
                    "zero-length" problem that can happen when a
                    system crashes before the delayed allocation
                    blocks are forced to disk.

从“损坏的应用程序”这一措辞来看,ext4 开发人员肯定认为这是不好的做法,但实际上,这种方法被广泛使用,因此在 ext4 本身中就对其进行了修补。

因此,如果您的使用符合模式,那么您应该是安全的。

如果没有,我建议你进一步调查,而不是fsync为了安全起见到处插入。这可能不是一个好主意,因为fsync会对 ext3 造成重大性能影响(阅读)。

另一方面,在非日志文件系统上,重命名前刷新是执行替换的正确方法。也许这就是为什么 ext4 最初期望程序有这种行为,auto_da_alloc后来添加了该选项作为修复。此外,这个针对写回(非日志)模式的 ext3 补丁试图通过在重命名时异步刷新来帮助粗心的程序,以降低数据丢失的可能性。

您可以在此处阅读有关 ext4 问题的更多信息。

解决方案 3:

如果您只关心 ext4 而不关心 ext3,那么我建议在重命名之前对新文件使用 fsync。ext4 上的 fsync 性能似乎比 ext3 上的好得多,而且没有很长的延迟。或者可能是因为 writeback 是默认模式(至少在我的 Linux 系统上)。

如果您只关心文件是否完整,而不关心目录中哪个文件的名称,则只需 fsync 新文件即可。无需 fsync 目录,因为它将指向包含完整数据的新文件或旧文件。

相关推荐
  为什么项目管理通常仍然耗时且低效?您是否还在反复更新电子表格、淹没在便利贴中并参加每周更新会议?这确实是耗费时间和精力。借助软件工具的帮助,您可以一目了然地全面了解您的项目。如今,国内外有足够多优秀的项目管理软件可以帮助您掌控每个项目。什么是项目管理软件?项目管理软件是广泛行业用于项目规划、资源分配和调度的软件。它使项...
项目管理软件   601  
  华为IPD与传统研发模式的8大差异在快速变化的商业环境中,产品研发模式的选择直接决定了企业的市场响应速度和竞争力。华为作为全球领先的通信技术解决方案供应商,其成功在很大程度上得益于对产品研发模式的持续创新。华为引入并深度定制的集成产品开发(IPD)体系,相较于传统的研发模式,展现出了显著的差异和优势。本文将详细探讨华为...
IPD流程是谁发明的   7  
  如何通过IPD流程缩短产品上市时间?在快速变化的市场环境中,产品上市时间成为企业竞争力的关键因素之一。集成产品开发(IPD, Integrated Product Development)作为一种先进的产品研发管理方法,通过其结构化的流程设计和跨部门协作机制,显著缩短了产品上市时间,提高了市场响应速度。本文将深入探讨如...
华为IPD流程   9  
  在项目管理领域,IPD(Integrated Product Development,集成产品开发)流程图是连接创意、设计与市场成功的桥梁。它不仅是一个视觉工具,更是一种战略思维方式的体现,帮助团队高效协同,确保产品按时、按质、按量推向市场。尽管IPD流程图可能初看之下显得错综复杂,但只需掌握几个关键点,你便能轻松驾驭...
IPD开发流程管理   8  
  在项目管理领域,集成产品开发(IPD)流程被视为提升产品上市速度、增强团队协作与创新能力的重要工具。然而,尽管IPD流程拥有诸多优势,其实施过程中仍可能遭遇多种挑战,导致项目失败。本文旨在深入探讨八个常见的IPD流程失败原因,并提出相应的解决方法,以帮助项目管理者规避风险,确保项目成功。缺乏明确的项目目标与战略对齐IP...
IPD流程图   8  
热门文章
项目管理软件有哪些?
云禅道AD
禅道项目管理软件

云端的项目管理软件

尊享禅道项目软件收费版功能

无需维护,随时随地协同办公

内置subversion和git源码管理

每天备份,随时转为私有部署

免费试用