为什么 CUDA 固定内存如此之快?

2024-10-31 08:38:00
admin
原创
59
摘要:问题描述:当我使用固定内存进行 CUDA 数据传输时,我观察到数据传输速度显著加快。在 Linux 上,实现此目的的底层系统调用是 mlock。从 mlock 的手册页中可以看出,锁定页面可防止其被换出:mlock() 锁定从 addr 开始并持续 len 个字节的地址范围内的页面。当调用成功返回时,保证包含...

问题描述:

当我使用固定内存进行 CUDA 数据传输时,我观察到数据传输速度显著加快。在 Linux 上,实现此目的的底层系统调用是 mlock。从 mlock 的手册页中可以看出,锁定页面可防止其被换出:

mlock() 锁定从 addr 开始并持续 len 个字节的地址范围内的页面。当调用成功返回时,保证包含指定地址范围一部分的所有页面都驻留在 RAM 中;

在我的测试中,我的系统上有几 GB 的可用内存,因此不存在内存页面被交换的风险,但我仍然观察到了加速。有人能解释一下这里到底发生了什么吗?任何见解或信息都非常感谢。


解决方案 1:

CUDA 驱动程序会检查内存范围是否被锁定,然后它将使用不同的代码路径。锁定的内存存储在物理内存 (RAM) 中,因此设备无需 CPU 的帮助即可获取它(DMA,又称异步复制;设备只需要物理页面列表)。未锁定的内存在访问时会产生页面错误,并且它不仅存储在内存中(例如,它可以存储在交换中),因此驱动程序需要访问未锁定内存的每一页,将其复制到固定缓冲区中并将其传递给 DMA(同步,逐页复制)。

如此处所述http://forums.nvidia.com/index.php?showtopic=164661

异步内存复制调用使用的主机内存需要通过 cudaMallocHost 或 cudaHostAlloc 进行页面锁定。

我还建议您在 developer.download.nvidia.com 上查看 cudaMemcpyAsync 和 cudaHostAlloc 手册。HostAlloc 表示 cuda 驱动程序可以检测固定内存:

驱动程序跟踪使用此(cudaHostAlloc)函数分配的虚拟内存范围,并自动加速对 cudaMemcpy() 等函数的调用。

解决方案 2:

CUDA 使用 DMA 将固定内存传输到 GPU。可分页主机内存不能与 DMA 一起使用,因为它们可能驻留在磁盘上。如果内存未固定(即页面锁定),则首先将其复制到页面锁定的“暂存”缓冲区,然后通过 DMA 复制到 GPU。因此,使用固定内存可以节省从可分页主机内存复制到页面锁定主机内存的时间。

解决方案 3:

如果内存页面尚未被访问,那么它们可能从一开始就没有被交换。特别是,新分配的页面将是通用“零页”的虚拟副本,在写入之前没有物理实例。磁盘上文件的新映射同样将完全保留在磁盘上,直到读取或写入为止。

解决方案 4:

关于将非锁定页面复制到锁定页面的详细说明。

如果在 CPU RAM 有限的繁忙系统中,操作系统将未锁定的页面换出,则成本可能非常高昂。然后会触发页面错误,通过昂贵的磁盘 IO 操作将页面加载到 CPU RAM 中。

在 CPU RAM 非常宝贵的系统中,固定页面还可能导致虚拟内存抖动。如果发生抖动,CPU 的吞吐量可能会大幅下降。

相关推荐
  为什么项目管理通常仍然耗时且低效?您是否还在反复更新电子表格、淹没在便利贴中并参加每周更新会议?这确实是耗费时间和精力。借助软件工具的帮助,您可以一目了然地全面了解您的项目。如今,国内外有足够多优秀的项目管理软件可以帮助您掌控每个项目。什么是项目管理软件?项目管理软件是广泛行业用于项目规划、资源分配和调度的软件。它使项...
项目管理软件   601  
  华为IPD与传统研发模式的8大差异在快速变化的商业环境中,产品研发模式的选择直接决定了企业的市场响应速度和竞争力。华为作为全球领先的通信技术解决方案供应商,其成功在很大程度上得益于对产品研发模式的持续创新。华为引入并深度定制的集成产品开发(IPD)体系,相较于传统的研发模式,展现出了显著的差异和优势。本文将详细探讨华为...
IPD流程是谁发明的   7  
  如何通过IPD流程缩短产品上市时间?在快速变化的市场环境中,产品上市时间成为企业竞争力的关键因素之一。集成产品开发(IPD, Integrated Product Development)作为一种先进的产品研发管理方法,通过其结构化的流程设计和跨部门协作机制,显著缩短了产品上市时间,提高了市场响应速度。本文将深入探讨如...
华为IPD流程   9  
  在项目管理领域,IPD(Integrated Product Development,集成产品开发)流程图是连接创意、设计与市场成功的桥梁。它不仅是一个视觉工具,更是一种战略思维方式的体现,帮助团队高效协同,确保产品按时、按质、按量推向市场。尽管IPD流程图可能初看之下显得错综复杂,但只需掌握几个关键点,你便能轻松驾驭...
IPD开发流程管理   8  
  在项目管理领域,集成产品开发(IPD)流程被视为提升产品上市速度、增强团队协作与创新能力的重要工具。然而,尽管IPD流程拥有诸多优势,其实施过程中仍可能遭遇多种挑战,导致项目失败。本文旨在深入探讨八个常见的IPD流程失败原因,并提出相应的解决方法,以帮助项目管理者规避风险,确保项目成功。缺乏明确的项目目标与战略对齐IP...
IPD流程图   8  
热门文章
项目管理软件有哪些?
云禅道AD
禅道项目管理软件

云端的项目管理软件

尊享禅道项目软件收费版功能

无需维护,随时随地协同办公

内置subversion和git源码管理

每天备份,随时转为私有部署

免费试用