高效利用GPU怎能不会CUDA?英伟达官方的基础课程来了
过去十年深度神经网络已成为最重要的机器学习模型之一,创造了从自然语言处理到计算机视觉、计算神经科学等许多领域的 SOTA 实现。
深度神经网络的特征注定其产生的计算量是巨大的,但也会产生大量高度并行化的工作,特别适合多核和众核处理器。深度学习领域的新研究思路往往是结合原生框架 operator 来实现的,一般编写专门的 GPU 内核可以解决过程中的性能损失问题,但也确实具有更高的挑战性。可以说,深度神经网络的计算潜力与 GPU 编程困难之间存在着一道鸿沟。
2007 年,英伟达发布了 CUDA 的初始版本,CUDA 平台是一个软件层,使用者可以直接访问 GPU 的虚拟指令集和并行计算单元,用于执行计算内核。近年来,主流深度学习框架几乎都是基于 CUDA 进行加速,英伟达也一直在完善 CUDA 工具包,但对于一般的开发者来说,CUDA 还是「不那么容易上手」。
为了帮助广大开发者深入了解和快速上手 CUDA编程,英伟达联合机器之心推出「CUDA编程实践」三期线上分享,通过英伟达专家的理论解读和实战经验分享,向读者展示如何使用 CUDA 快速完成图像处理、光线追踪、卷积操作等任务。
「CUDA编程实践」三期分享安排如下:
本次系列分享嘉宾是 NVIDIA 企业级开发者社区经理、高级讲师何琨,他拥有多年的 GPU 和人工智能开发经验。自 2017 年加入 NVIDIA 开发者社区以来,完成过上百场培训,帮助上万个开发者了解人工智能和 GPU 编程开发。在计算机视觉,高性能计算领域完成过多个独立项目。并且,在机器人和无人机领域,有过丰富的研发经验。对于图像识别,目标的检测与跟踪完成过多种解决方案。曾经参与 GPU 版气象模式 GRAPES,是其主要研发者。
9月9日20:00-21:30
CUDA编程基础——利用CUDA加速图像处理
NVIDIA CUDA Toolkit 提供了一个开发环境,用于创建高性能 GPU 加速应用程序。通过CUDA Toolkit可以在 GPU 加速的嵌入式系统、桌面工作站、企业数据中心、基于云的平台和 HPC 超级计算机上开发、优化和部署应用程序。 CUDA 编程模型已经广泛地应用于在计算机视觉领域,对图像的预处理已经成为很多领域必不可少的一步。本节课程将会以图像处理为实例来介绍如何利用 CUDA 加速应用程序。 第一期课程针对需要进行 HPC 和 AI 开发者,将详细介绍以下内容:
- GPU硬件结构
- CUDA 编程模型
- CUDA 线程层次
- CUDA 存储单元
- 利用CUDA进行图像处理
- 实例:利用CUDA加速Sobel 边缘检测
直播时间:9月9日 20:00-21:30 直播间地址:https://jmq.h5.xeknow.com/s/3d286J(点击阅读原文直达) 报名方式:进入直播间——移动端点击底部「观看直播」、PC端点击「立即学习」——填写报名表单后即可进入直播间观看。 直播交流群:识别下方二维码加入交流群。
如群已超出人数限制,请添加其他小助手:syncedai2、syncedai3、syncedai4 或 syncedai5,备注「CUDA」即可加入。
点击阅读原文,立即报名。
相关文章
- 官方一键解绑功能,可一键解除手机号绑定的互联网账号-星泽V社
- 一步步学写Bazel lib&rules (1) - Bazel官方基础库简单浏览
- Java官方笔记3Java语言基础
- Oracle 视图 ALL_TYPE_METHODS 官方解释,作用,如何使用详细说明
- Oracle 视图 ALL_WARNING_SETTINGS 官方解释,作用,如何使用详细说明
- Oracle 视图 DBA_ADVISOR_COMMANDS 官方解释,作用,如何使用详细说明
- Oracle 视图 DBA_ADVISOR_OBJECTS 官方解释,作用,如何使用详细说明
- Oracle 视图 ALL_ZONEMAPS 官方解释,作用,如何使用详细说明
- Oracle 视图 DBA_EDITIONING_VIEWS_AE 官方解释,作用,如何使用详细说明
- Oracle 视图 DBA_SUBPART_COL_STATISTICS 官方解释,作用,如何使用详细说明
- Oracle 视图 DBA_TRIGGERS 官方解释,作用,如何使用详细说明
- Oracle 视图 HS_FDS_CLASS 官方解释,作用,如何使用详细说明
- Oracle 视图 SCHEDULER_BATCH_ERRORS 官方解释,作用,如何使用详细说明
- Oracle 视图 DBA_MINING_MODEL_XFORMS 官方解释,作用,如何使用详细说明
- Oracle 视图 DBA_SCHEDULER_PROGRAMS 官方解释,作用,如何使用详细说明
- Oracle 等待事件 log switch/archive 官方解释,作用,如何使用及优化方法