没有 fsync() 的 rename() 是否安全?

2024-11-08 08:43:00
admin
原创
132
摘要:问题描述:rename(tmppath, path)如果不先打电话就直接拨打电话是否安全fsync(tmppath_fd)?我希望路径始终指向一个完整的文件。我主要关心Ext4。rename() 是否保证在所有未来的 Linux 内核版本中都是安全的?Python 中的使用示例:def store_atomi...

问题描述:

rename(tmppath, path)如果不先打电话就直接拨打电话是否安全fsync(tmppath_fd)

我希望路径始终指向一个完整的文件。我主要关心Ext4。rename() 是否保证在所有未来的 Linux 内核版本中都是安全的?

Python 中的使用示例:

def store_atomically(path, data):
    tmppath = path + ".tmp"
    output = open(tmppath, "wb")
    output.write(data)

    output.flush()
    os.fsync(output.fileno())  # The needed fsync().
    output.close()
    os.rename(tmppath, path)

解决方案 1:

不。

查看 libeatmydata 和此演示文稿:

吃掉我的数据:每个人都犯了文件 IO 错误

http://www.oscon.com/oscon2008/public/schedule/detail/3172

由 MySql 的 Stewart Smith 撰写。

如果它处于离线状态/不再可用,我会保留它的副本:

  • 视频在这里

  • 演示幻灯片(在线版幻灯片)

解决方案 2:

来自ext4 文档:

When mounting an ext4 filesystem, the following option are accepted:
(*) == default

auto_da_alloc(*)    Many broken applications don't use fsync() when 
noauto_da_alloc     replacing existing files via patterns such as
                    fd = open("foo.new")/write(fd,..)/close(fd)/
                    rename("foo.new", "foo"), or worse yet,
                    fd = open("foo", O_TRUNC)/write(fd,..)/close(fd).
                    If auto_da_alloc is enabled, ext4 will detect
                    the replace-via-rename and replace-via-truncate
                    patterns and force that any delayed allocation
                    blocks are allocated such that at the next
                    journal commit, in the default data=ordered
                    mode, the data blocks of the new file are forced
                    to disk before the rename() operation is
                    committed.  This provides roughly the same level
                    of guarantees as ext3, and avoids the
                    "zero-length" problem that can happen when a
                    system crashes before the delayed allocation
                    blocks are forced to disk.

从“损坏的应用程序”这一措辞来看,ext4 开发人员肯定认为这是不好的做法,但实际上,这种方法被广泛使用,因此在 ext4 本身中就对其进行了修补。

因此,如果您的使用符合模式,那么您应该是安全的。

如果没有,我建议你进一步调查,而不是fsync为了安全起见到处插入。这可能不是一个好主意,因为fsync会对 ext3 造成重大性能影响(阅读)。

另一方面,在非日志文件系统上,重命名前刷新是执行替换的正确方法。也许这就是为什么 ext4 最初期望程序有这种行为,auto_da_alloc后来添加了该选项作为修复。此外,这个针对写回(非日志)模式的 ext3 补丁试图通过在重命名时异步刷新来帮助粗心的程序,以降低数据丢失的可能性。

您可以在此处阅读有关 ext4 问题的更多信息。

解决方案 3:

如果您只关心 ext4 而不关心 ext3,那么我建议在重命名之前对新文件使用 fsync。ext4 上的 fsync 性能似乎比 ext3 上的好得多,而且没有很长的延迟。或者可能是因为 writeback 是默认模式(至少在我的 Linux 系统上)。

如果您只关心文件是否完整,而不关心目录中哪个文件的名称,则只需 fsync 新文件即可。无需 fsync 目录,因为它将指向包含完整数据的新文件或旧文件。

相关推荐
  为什么项目管理通常仍然耗时且低效?您是否还在反复更新电子表格、淹没在便利贴中并参加每周更新会议?这确实是耗费时间和精力。借助软件工具的帮助,您可以一目了然地全面了解您的项目。如今,国内外有足够多优秀的项目管理软件可以帮助您掌控每个项目。什么是项目管理软件?项目管理软件是广泛行业用于项目规划、资源分配和调度的软件。它使项...
项目管理软件   1109  
  IPD(Integrated Product Development,集成产品开发)流程是一种广泛应用于高科技和制造业的产品开发方法论。它通过跨职能团队的紧密协作,将产品开发周期缩短,同时提高产品质量和市场成功率。在IPD流程中,CDCP(Concept Decision Checkpoint,概念决策检查点)是一个关...
IPD培训课程   73  
  研发IPD(集成产品开发)流程作为一种系统化的产品开发方法,已经在许多行业中得到广泛应用。它不仅能够提升产品开发的效率和质量,还能够通过优化流程和资源分配,显著提高客户满意度。客户满意度是企业长期成功的关键因素之一,而IPD流程通过其独特的结构和机制,能够确保产品从概念到市场交付的每个环节都围绕客户需求展开。本文将深入...
IPD流程   63  
  IPD(Integrated Product Development,集成产品开发)流程是一种以跨职能团队协作为核心的产品开发方法,旨在通过优化资源分配、提高沟通效率以及减少返工,从而缩短项目周期并提升产品质量。随着企业对产品上市速度的要求越来越高,IPD流程的应用价值愈发凸显。通过整合产品开发过程中的各个环节,IPD...
IPD项目管理咨询   71  
  跨部门沟通是企业运营中不可或缺的一环,尤其在复杂的产品开发过程中,不同部门之间的协作效率直接影响项目的成败。集成产品开发(IPD)作为一种系统化的项目管理方法,旨在通过优化流程和增强团队协作来提升产品开发的效率和质量。然而,跨部门沟通的复杂性往往成为IPD实施中的一大挑战。部门之间的目标差异、信息不对称以及沟通渠道不畅...
IPD是什么意思   66  
热门文章
项目管理软件有哪些?
云禅道AD
禅道项目管理软件

云端的项目管理软件

尊享禅道项目软件收费版功能

无需维护,随时随地协同办公

内置subversion和git源码管理

每天备份,随时转为私有部署

免费试用