为什么 CUDA 固定内存如此之快?

2024-10-31 08:38:00
admin
原创
188
摘要:问题描述:当我使用固定内存进行 CUDA 数据传输时,我观察到数据传输速度显著加快。在 Linux 上,实现此目的的底层系统调用是 mlock。从 mlock 的手册页中可以看出,锁定页面可防止其被换出:mlock() 锁定从 addr 开始并持续 len 个字节的地址范围内的页面。当调用成功返回时,保证包含...

问题描述:

当我使用固定内存进行 CUDA 数据传输时,我观察到数据传输速度显著加快。在 Linux 上,实现此目的的底层系统调用是 mlock。从 mlock 的手册页中可以看出,锁定页面可防止其被换出:

mlock() 锁定从 addr 开始并持续 len 个字节的地址范围内的页面。当调用成功返回时,保证包含指定地址范围一部分的所有页面都驻留在 RAM 中;

在我的测试中,我的系统上有几 GB 的可用内存,因此不存在内存页面被交换的风险,但我仍然观察到了加速。有人能解释一下这里到底发生了什么吗?任何见解或信息都非常感谢。


解决方案 1:

CUDA 驱动程序会检查内存范围是否被锁定,然后它将使用不同的代码路径。锁定的内存存储在物理内存 (RAM) 中,因此设备无需 CPU 的帮助即可获取它(DMA,又称异步复制;设备只需要物理页面列表)。未锁定的内存在访问时会产生页面错误,并且它不仅存储在内存中(例如,它可以存储在交换中),因此驱动程序需要访问未锁定内存的每一页,将其复制到固定缓冲区中并将其传递给 DMA(同步,逐页复制)。

如此处所述http://forums.nvidia.com/index.php?showtopic=164661

异步内存复制调用使用的主机内存需要通过 cudaMallocHost 或 cudaHostAlloc 进行页面锁定。

我还建议您在 developer.download.nvidia.com 上查看 cudaMemcpyAsync 和 cudaHostAlloc 手册。HostAlloc 表示 cuda 驱动程序可以检测固定内存:

驱动程序跟踪使用此(cudaHostAlloc)函数分配的虚拟内存范围,并自动加速对 cudaMemcpy() 等函数的调用。

解决方案 2:

CUDA 使用 DMA 将固定内存传输到 GPU。可分页主机内存不能与 DMA 一起使用,因为它们可能驻留在磁盘上。如果内存未固定(即页面锁定),则首先将其复制到页面锁定的“暂存”缓冲区,然后通过 DMA 复制到 GPU。因此,使用固定内存可以节省从可分页主机内存复制到页面锁定主机内存的时间。

解决方案 3:

如果内存页面尚未被访问,那么它们可能从一开始就没有被交换。特别是,新分配的页面将是通用“零页”的虚拟副本,在写入之前没有物理实例。磁盘上文件的新映射同样将完全保留在磁盘上,直到读取或写入为止。

解决方案 4:

关于将非锁定页面复制到锁定页面的详细说明。

如果在 CPU RAM 有限的繁忙系统中,操作系统将未锁定的页面换出,则成本可能非常高昂。然后会触发页面错误,通过昂贵的磁盘 IO 操作将页面加载到 CPU RAM 中。

在 CPU RAM 非常宝贵的系统中,固定页面还可能导致虚拟内存抖动。如果发生抖动,CPU 的吞吐量可能会大幅下降。

相关推荐
  为什么项目管理通常仍然耗时且低效?您是否还在反复更新电子表格、淹没在便利贴中并参加每周更新会议?这确实是耗费时间和精力。借助软件工具的帮助,您可以一目了然地全面了解您的项目。如今,国内外有足够多优秀的项目管理软件可以帮助您掌控每个项目。什么是项目管理软件?项目管理软件是广泛行业用于项目规划、资源分配和调度的软件。它使项...
项目管理软件   1120  
  IPD(Integrated Product Development,集成产品开发)流程是一种广泛应用于高科技和制造业的产品开发方法论。它通过跨职能团队的紧密协作,将产品开发周期缩短,同时提高产品质量和市场成功率。在IPD流程中,CDCP(Concept Decision Checkpoint,概念决策检查点)是一个关...
IPD培训课程   75  
  研发IPD(集成产品开发)流程作为一种系统化的产品开发方法,已经在许多行业中得到广泛应用。它不仅能够提升产品开发的效率和质量,还能够通过优化流程和资源分配,显著提高客户满意度。客户满意度是企业长期成功的关键因素之一,而IPD流程通过其独特的结构和机制,能够确保产品从概念到市场交付的每个环节都围绕客户需求展开。本文将深入...
IPD流程   66  
  IPD(Integrated Product Development,集成产品开发)流程是一种以跨职能团队协作为核心的产品开发方法,旨在通过优化资源分配、提高沟通效率以及减少返工,从而缩短项目周期并提升产品质量。随着企业对产品上市速度的要求越来越高,IPD流程的应用价值愈发凸显。通过整合产品开发过程中的各个环节,IPD...
IPD项目管理咨询   76  
  跨部门沟通是企业运营中不可或缺的一环,尤其在复杂的产品开发过程中,不同部门之间的协作效率直接影响项目的成败。集成产品开发(IPD)作为一种系统化的项目管理方法,旨在通过优化流程和增强团队协作来提升产品开发的效率和质量。然而,跨部门沟通的复杂性往往成为IPD实施中的一大挑战。部门之间的目标差异、信息不对称以及沟通渠道不畅...
IPD是什么意思   70  
热门文章
项目管理软件有哪些?
云禅道AD
禅道项目管理软件

云端的项目管理软件

尊享禅道项目软件收费版功能

无需维护,随时随地协同办公

内置subversion和git源码管理

每天备份,随时转为私有部署

免费试用