zl程序教程

您现在的位置是:首页 >  其他

当前栏目

高效利用GPU怎能不会CUDA?英伟达官方的基础课程来了

官方基础 利用 高效 课程 GPU 伟达 CUDA
2023-06-13 09:17:57 时间

过去十年深度神经网络已成为最重要的机器学习模型之一,创造了从自然语言处理到计算机视觉、计算神经科学等许多领域的 SOTA 实现。

深度神经网络的特征注定其产生的计算量是巨大的,但也会产生大量高度并行化的工作,特别适合多核和众核处理器。深度学习领域的新研究思路往往是结合原生框架 operator 来实现的,一般编写专门的 GPU 内核可以解决过程中的性能损失问题,但也确实具有更高的挑战性。可以说,深度神经网络的计算潜力与 GPU 编程困难之间存在着一道鸿沟。

2007 年,英伟达发布了 CUDA 的初始版本,CUDA 平台是一个软件层,使用者可以直接访问 GPU 的虚拟指令集和并行计算单元,用于执行计算内核。近年来,主流深度学习框架几乎都是基于 CUDA 进行加速,英伟达也一直在完善 CUDA 工具包,但对于一般的开发者来说,CUDA 还是「不那么容易上手」。

为了帮助广大开发者深入了解和快速上手 CUDA编程,英伟达联合机器之心推出「CUDA编程实践」三期线上分享,通过英伟达专家的理论解读和实战经验分享,向读者展示如何使用 CUDA 快速完成图像处理、光线追踪、卷积操作等任务。

「CUDA编程实践」三期分享安排如下:

本次系列分享嘉宾是 NVIDIA 企业级开发者社区经理、高级讲师何琨,他拥有多年的 GPU 和人工智能开发经验。自 2017 年加入 NVIDIA 开发者社区以来,完成过上百场培训,帮助上万个开发者了解人工智能和 GPU 编程开发。在计算机视觉,高性能计算领域完成过多个独立项目。并且,在机器人和无人机领域,有过丰富的研发经验。对于图像识别,目标的检测与跟踪完成过多种解决方案。曾经参与 GPU 版气象模式 GRAPES,是其主要研发者。

9月9日20:00-21:30

CUDA编程基础——利用CUDA加速图像处理

NVIDIA CUDA Toolkit 提供了一个开发环境,用于创建高性能 GPU 加速应用程序。通过CUDA Toolkit可以在 GPU 加速的嵌入式系统、桌面工作站、企业数据中心、基于云的平台和 HPC 超级计算机上开发、优化和部署应用程序。 CUDA 编程模型已经广泛地应用于在计算机视觉领域,对图像的预处理已经成为很多领域必不可少的一步。本节课程将会以图像处理为实例来介绍如何利用 CUDA 加速应用程序。 第一期课程针对需要进行 HPC 和 AI 开发者,将详细介绍以下内容:

  • GPU硬件结构
  • CUDA 编程模型
  • CUDA 线程层次
  • CUDA 存储单元
  • 利用CUDA进行图像处理
  • 实例:利用CUDA加速Sobel 边缘检测

直播时间:9月9日 20:00-21:30 直播间地址:https://jmq.h5.xeknow.com/s/3d286J(点击阅读原文直达) 报名方式:进入直播间——移动端点击底部「观看直播」、PC端点击「立即学习」——填写报名表单后即可进入直播间观看。 直播交流群:识别下方二维码加入交流群。

如群已超出人数限制,请添加其他小助手:syncedai2、syncedai3、syncedai4 或 syncedai5,备注「CUDA」即可加入。

点击阅读原文,立即报名。