为什么 CUDA 固定内存如此之快?

2024-10-31 08:38:00
admin
原创
222
摘要:问题描述:当我使用固定内存进行 CUDA 数据传输时,我观察到数据传输速度显著加快。在 Linux 上,实现此目的的底层系统调用是 mlock。从 mlock 的手册页中可以看出,锁定页面可防止其被换出:mlock() 锁定从 addr 开始并持续 len 个字节的地址范围内的页面。当调用成功返回时,保证包含...

问题描述:

当我使用固定内存进行 CUDA 数据传输时,我观察到数据传输速度显著加快。在 Linux 上,实现此目的的底层系统调用是 mlock。从 mlock 的手册页中可以看出,锁定页面可防止其被换出:

mlock() 锁定从 addr 开始并持续 len 个字节的地址范围内的页面。当调用成功返回时,保证包含指定地址范围一部分的所有页面都驻留在 RAM 中;

在我的测试中,我的系统上有几 GB 的可用内存,因此不存在内存页面被交换的风险,但我仍然观察到了加速。有人能解释一下这里到底发生了什么吗?任何见解或信息都非常感谢。


解决方案 1:

CUDA 驱动程序会检查内存范围是否被锁定,然后它将使用不同的代码路径。锁定的内存存储在物理内存 (RAM) 中,因此设备无需 CPU 的帮助即可获取它(DMA,又称异步复制;设备只需要物理页面列表)。未锁定的内存在访问时会产生页面错误,并且它不仅存储在内存中(例如,它可以存储在交换中),因此驱动程序需要访问未锁定内存的每一页,将其复制到固定缓冲区中并将其传递给 DMA(同步,逐页复制)。

如此处所述http://forums.nvidia.com/index.php?showtopic=164661

异步内存复制调用使用的主机内存需要通过 cudaMallocHost 或 cudaHostAlloc 进行页面锁定。

我还建议您在 developer.download.nvidia.com 上查看 cudaMemcpyAsync 和 cudaHostAlloc 手册。HostAlloc 表示 cuda 驱动程序可以检测固定内存:

驱动程序跟踪使用此(cudaHostAlloc)函数分配的虚拟内存范围,并自动加速对 cudaMemcpy() 等函数的调用。

解决方案 2:

CUDA 使用 DMA 将固定内存传输到 GPU。可分页主机内存不能与 DMA 一起使用,因为它们可能驻留在磁盘上。如果内存未固定(即页面锁定),则首先将其复制到页面锁定的“暂存”缓冲区,然后通过 DMA 复制到 GPU。因此,使用固定内存可以节省从可分页主机内存复制到页面锁定主机内存的时间。

解决方案 3:

如果内存页面尚未被访问,那么它们可能从一开始就没有被交换。特别是,新分配的页面将是通用“零页”的虚拟副本,在写入之前没有物理实例。磁盘上文件的新映射同样将完全保留在磁盘上,直到读取或写入为止。

解决方案 4:

关于将非锁定页面复制到锁定页面的详细说明。

如果在 CPU RAM 有限的繁忙系统中,操作系统将未锁定的页面换出,则成本可能非常高昂。然后会触发页面错误,通过昂贵的磁盘 IO 操作将页面加载到 CPU RAM 中。

在 CPU RAM 非常宝贵的系统中,固定页面还可能导致虚拟内存抖动。如果发生抖动,CPU 的吞吐量可能会大幅下降。

相关推荐
  为什么项目管理通常仍然耗时且低效?您是否还在反复更新电子表格、淹没在便利贴中并参加每周更新会议?这确实是耗费时间和精力。借助软件工具的帮助,您可以一目了然地全面了解您的项目。如今,国内外有足够多优秀的项目管理软件可以帮助您掌控每个项目。什么是项目管理软件?项目管理软件是广泛行业用于项目规划、资源分配和调度的软件。它使项...
项目管理软件   1325  
  IPD(Integrated Product Development)流程作为一种先进的产品开发管理模式,在众多企业中得到了广泛应用。它涵盖了从产品概念产生到产品退市的整个生命周期,通过整合跨部门团队、优化流程等方式,显著提升产品开发的效率和质量,进而为项目的成功奠定坚实基础。深入探究IPD流程的五个阶段与项目成功之间...
IPD流程分为几个阶段   4  
  华为作为全球知名的科技企业,其成功背后的管理体系备受关注。IPD(集成产品开发)流程作为华为核心的产品开发管理模式,其中的创新管理与实践更是蕴含着丰富的经验和深刻的智慧,对众多企业具有重要的借鉴意义。IPD流程的核心架构IPD流程旨在打破部门墙,实现跨部门的高效协作,将产品开发视为一个整体的流程。它涵盖了从市场需求分析...
华为IPD是什么   3  
  IPD(Integrated Product Development)研发管理体系作为一种先进的产品开发模式,在众多企业的发展历程中发挥了至关重要的作用。它不仅仅是一套流程,更是一种理念,一种能够全方位提升企业竞争力,推动企业持续发展的有效工具。深入探究IPD研发管理体系如何助力企业持续发展,对于众多渴望在市场中立足并...
IPD管理流程   3  
  IPD(Integrated Product Development)流程管理旨在通过整合产品开发流程、团队和资源,实现产品的快速、高质量交付。在这一过程中,有效降低成本是企业提升竞争力的关键。通过优化IPD流程管理中的各个环节,可以在不牺牲产品质量和性能的前提下,实现成本的显著降低,为企业创造更大的价值。优化产品规划...
IPD流程分为几个阶段   4  
热门文章
项目管理软件有哪些?
云禅道AD
禅道项目管理软件

云端的项目管理软件

尊享禅道项目软件收费版功能

无需维护,随时随地协同办公

内置subversion和git源码管理

每天备份,随时转为私有部署

免费试用