《CUDA高性能并行计算》----0.7 本书代码
2023-09-11 14:16:11 时间
本书应用程序的代码可以通过www.cudaforengineers.com获取。虽然书中采用了一些代码片断和“骨架”代码(skeleton code),但标记为“代码清单”的代码(包含行号)是真实可运行代码的一部分。
本 节 书 摘 来 自 华 章 出 版 社 《CUDA高性能并行计算》 一 书 中 的 第0章,第0.7节, 作 者 CUDA for Engineers: An Introduction to High-Performance Parallel Computing[美] 杜安·斯托尔蒂(Duane Storti)梅特·尤尔托卢(Mete Yurtoglu) 著,苏统华 项文成 李松泽 姚宇鹏 孙博文 译 , 更 多 章 节 内 容 可 以 访 问 云 栖 社 区 “华 章 计 算 机” 公 众 号 查 看。 0.7 本书代码
《CUDA高性能并行计算》----2.4 推荐项目 1.去CUDA Zone注册并加入到CUDA开发者中(如果读者还没有这样做的话)。 2.观看 www.nvidia.com/object/nvision08_gpu_v_cpu.html的视频,体会关于并行和串行执行的有趣的对比。
《CUDA高性能并行计算》----3.6 推荐项目 1.改变距离数组中的元素数目并进行实验。当你将数目N定义成128、1024、63、65的时候是否遇到了一些问题? 2.计算包含4096个距离的距离数组并尝试改变TPB。你可以在系统上运行的最大(和最小)线程块大小是多大?注意,这个问题的答案依赖于你的GPU设备的计算能力。
《CUDA高性能并行计算》----0.9 历史沿革 本书是作者在CUDA疆域探险数年的经验总结。最初开展的是容积医学影像(volumetric medical imaging)、2D和3D成像(即透视和CT扫描)的配准以及计算机辅助设计(computer-aided design)和增材制造(additive manufacturing)的新方法研究。
《CUDA高性能并行计算》----2.3 本章小结 现在你已经掌握了开始创建一个拥有使用了CUDA进行GPU并行计算的优点的应用所必需的工具,我们将在第3章中开始创建CUDA应用。
《CUDA高性能并行计算》----3.5 本章小结 在本章中,我们使用CUDA依次创建了``dist_v1``与``dist_v2``的并行化版本``—dist_v1_cuda``与``dist_v2_cuda``。 ``dist_v2_cuda``为CUDA应用标准工作流程提供范例。下面是一些简明的内容回顾(CUDA应用包括的大致步骤):
《CUDA高性能并行计算》----1.3 本章小结 在本章,我们运行了一些CUDA样例程序并且获得了GPU并行计算的直观体验。同时我们介绍了两个串行的程序,将在后文作为并行化的实验函数。其中dist_v1提供了一个最简单的并行化实验例子,而dist_v2则描述了一个实用的结构和更典型的数据流。
《CUDA高性能并行计算》----0.6 本书体例 本书使用以下约定: 为了跟正常文字区分,代码清单使用等宽(monospace)字体排版。 我们经常把类UNIX系统,如Linux和OS X,统一称为Linux。 我们把完整的示例程序称为应用程序(简写为app)。
本 节 书 摘 来 自 华 章 出 版 社 《CUDA高性能并行计算》 一 书 中 的 第0章,第0.7节, 作 者 CUDA for Engineers: An Introduction to High-Performance Parallel Computing[美] 杜安·斯托尔蒂(Duane Storti)梅特·尤尔托卢(Mete Yurtoglu) 著,苏统华 项文成 李松泽 姚宇鹏 孙博文 译 , 更 多 章 节 内 容 可 以 访 问 云 栖 社 区 “华 章 计 算 机” 公 众 号 查 看。 0.7 本书代码
本书应用程序的代码可以通过www.cudaforengineers.com获取。虽然书中采用了一些代码片断和“骨架”代码(skeleton code),但标记为“代码清单”的代码(包含行号)是真实可运行代码的一部分。我们努力确保代码经过测试,可以成功运行于多个系统,包括Windows 7、Windows 8.1、Linux操作系统(Ubuntu 14.04 LTS)和OS X 10.10(除了第3章最后有一个确实会发生异常的例子)。
本书介绍的代码在创建阶段非常在意简洁性、可读性、可解释性和易懂性。这一指导思想允许我们在很多时候并不需要考虑很多商业代码需要的功能,如错误检测和性能评价等。有关这些功能的主题统一放到了附录D中,所以你可以根据需要添加它们。
CUDA应用程序既可以用C语言也可以用C++语言的编程风格进行开发。我们主要用C语言编程风格,以尽量减少对读者所需编程背景的要求。
《CUDA高性能并行计算》----2.4 推荐项目 1.去CUDA Zone注册并加入到CUDA开发者中(如果读者还没有这样做的话)。 2.观看 www.nvidia.com/object/nvision08_gpu_v_cpu.html的视频,体会关于并行和串行执行的有趣的对比。
《CUDA高性能并行计算》----3.6 推荐项目 1.改变距离数组中的元素数目并进行实验。当你将数目N定义成128、1024、63、65的时候是否遇到了一些问题? 2.计算包含4096个距离的距离数组并尝试改变TPB。你可以在系统上运行的最大(和最小)线程块大小是多大?注意,这个问题的答案依赖于你的GPU设备的计算能力。
《CUDA高性能并行计算》----0.9 历史沿革 本书是作者在CUDA疆域探险数年的经验总结。最初开展的是容积医学影像(volumetric medical imaging)、2D和3D成像(即透视和CT扫描)的配准以及计算机辅助设计(computer-aided design)和增材制造(additive manufacturing)的新方法研究。
《CUDA高性能并行计算》----2.3 本章小结 现在你已经掌握了开始创建一个拥有使用了CUDA进行GPU并行计算的优点的应用所必需的工具,我们将在第3章中开始创建CUDA应用。
《CUDA高性能并行计算》----3.5 本章小结 在本章中,我们使用CUDA依次创建了``dist_v1``与``dist_v2``的并行化版本``—dist_v1_cuda``与``dist_v2_cuda``。 ``dist_v2_cuda``为CUDA应用标准工作流程提供范例。下面是一些简明的内容回顾(CUDA应用包括的大致步骤):
《CUDA高性能并行计算》----1.3 本章小结 在本章,我们运行了一些CUDA样例程序并且获得了GPU并行计算的直观体验。同时我们介绍了两个串行的程序,将在后文作为并行化的实验函数。其中dist_v1提供了一个最简单的并行化实验例子,而dist_v2则描述了一个实用的结构和更典型的数据流。
《CUDA高性能并行计算》----0.6 本书体例 本书使用以下约定: 为了跟正常文字区分,代码清单使用等宽(monospace)字体排版。 我们经常把类UNIX系统,如Linux和OS X,统一称为Linux。 我们把完整的示例程序称为应用程序(简写为app)。
相关文章
- TP-admin即基于ThinkPHP5拿来即用高性能后台管理系统
- Jackson 高性能的JSON处理 ObjectMapper
- Web站点的传输--《构建高性能Web站点》阅读1
- EasyDSS高性能RTMP、HLS(m3u8)、HTTP-FLV、RTSP流媒体服务器解决方案之Windows服务安装
- EasyDSS高性能RTMP、HLS(m3u8)、HTTP-FLV、RTSP流媒体服务器功能简介---实时数据统计报表、视频文件上传、点播、分享、集成
- frigga+redir实现高性能端口映射
- 新手入门:目前为止最透彻的的Netty高性能原理和框架架构解析(阿里)
- 基于表格存储的高性能监控数据存储计算方案
- Atiitt io的stream流的分类 目录 1. 流的优缺点 高性能但复杂1 1.1. 字节数组更加简单,但性能差点1 2. Io体系1 2.1. 字符流 vs 字节流2 2.2.
- 详解API Gateway流控实现,揭开ROMA平台高性能秒级流控的技术细节
- 【成为架构师课程系列】高并发系统设计的三大目标:高性能、高可用、可扩展
- 【阅读文摘】GraalVM : 一个高性能的、可嵌入的、多语言的虚拟机
- 《高性能MySQL》读书笔记--锁、事务、隔离级别 转
- 高性能kv存储之Redis、Redis Cluster、Pika:如何应对4000亿的日访问量?
- 谈一谈Linux让实时/高性能任务独占CPU的事