zl程序教程

您现在的位置是:首页 >  大数据

当前栏目

《CUDA高性能并行计算》----0.7 本书代码

高性能代码 ---- CUDA 本书 并行计算
2023-09-11 14:16:11 时间
本书应用程序的代码可以通过www.cudaforengineers.com获取。虽然书中采用了一些代码片断和“骨架”代码(skeleton code),但标记为“代码清单”的代码(包含行号)是真实可运行代码的一部分。
本 节 书 摘 来 自 华 章 出 版 社 《CUDA高性能并行计算》 一 书 中 的 第0章,第0.7节, 作 者 CUDA for Engineers: An Introduction to High-Performance Parallel Computing[美] 杜安·斯托尔蒂(Duane Storti)梅特·尤尔托卢(Mete Yurtoglu) 著,苏统华 项文成 李松泽 姚宇鹏 孙博文 译 , 更 多 章 节 内 容 可 以 访 问 云 栖 社 区 “华 章 计 算 机” 公 众 号 查 看。 0.7 本书代码

本书应用程序的代码可以通过www.cudaforengineers.com获取。虽然书中采用了一些代码片断和“骨架”代码(skeleton code),但标记为“代码清单”的代码(包含行号)是真实可运行代码的一部分。我们努力确保代码经过测试,可以成功运行于多个系统,包括Windows 7、Windows 8.1、Linux操作系统(Ubuntu 14.04 LTS)和OS X 10.10(除了第3章最后有一个确实会发生异常的例子)。

本书介绍的代码在创建阶段非常在意简洁性、可读性、可解释性和易懂性。这一指导思想允许我们在很多时候并不需要考虑很多商业代码需要的功能,如错误检测和性能评价等。有关这些功能的主题统一放到了附录D中,所以你可以根据需要添加它们。

CUDA应用程序既可以用C语言也可以用C++语言的编程风格进行开发。我们主要用C语言编程风格,以尽量减少对读者所需编程背景的要求。


《CUDA高性能并行计算》----2.4 推荐项目 1.去CUDA Zone注册并加入到CUDA开发者中(如果读者还没有这样做的话)。 2.观看 www.nvidia.com/object/nvision08_gpu_v_cpu.html的视频,体会关于并行和串行执行的有趣的对比。
《CUDA高性能并行计算》----3.6 推荐项目 1.改变距离数组中的元素数目并进行实验。当你将数目N定义成128、1024、63、65的时候是否遇到了一些问题? 2.计算包含4096个距离的距离数组并尝试改变TPB。你可以在系统上运行的最大(和最小)线程块大小是多大?注意,这个问题的答案依赖于你的GPU设备的计算能力。
《CUDA高性能并行计算》----0.9 历史沿革 本书是作者在CUDA疆域探险数年的经验总结。最初开展的是容积医学影像(volumetric medical imaging)、2D和3D成像(即透视和CT扫描)的配准以及计算机辅助设计(computer-aided design)和增材制造(additive manufacturing)的新方法研究。
《CUDA高性能并行计算》----2.3 本章小结 现在你已经掌握了开始创建一个拥有使用了CUDA进行GPU并行计算的优点的应用所必需的工具,我们将在第3章中开始创建CUDA应用。
《CUDA高性能并行计算》----3.5 本章小结 在本章中,我们使用CUDA依次创建了``dist_v1``与``dist_v2``的并行化版本``—dist_v1_cuda``与``dist_v2_cuda``。 ``dist_v2_cuda``为CUDA应用标准工作流程提供范例。下面是一些简明的内容回顾(CUDA应用包括的大致步骤):
《CUDA高性能并行计算》----1.3 本章小结 在本章,我们运行了一些CUDA样例程序并且获得了GPU并行计算的直观体验。同时我们介绍了两个串行的程序,将在后文作为并行化的实验函数。其中dist_v1提供了一个最简单的并行化实验例子,而dist_v2则描述了一个实用的结构和更典型的数据流。
《CUDA高性能并行计算》----0.6 本书体例 本书使用以下约定: 为了跟正常文字区分,代码清单使用等宽(monospace)字体排版。 我们经常把类UNIX系统,如Linux和OS X,统一称为Linux。 我们把完整的示例程序称为应用程序(简写为app)。