您现在的位置是：首页 > 其他

当前栏目

fp16训练（混合精度训练）

训练混合精度

2023-09-27 14:20:41 时间

深度神经网络（DNN）在许多领域都取得了突破，包括图像处理和理解，语言建模，语言翻译，语音处理，游戏策略以及许多其他领域。为了获得这些卓越结果，DNN的复杂性一直在增加，这反过来又增加了训练这些网络所需的计算资源。混合精度训练通过使用低精度算术降低了所需的资源，具有以下好处。

减少所需的内存量。半精度浮点格式（FP16）使用16位，而单精度（FP32）使用32位。降低所需的内存可以训练更大的模型或训练时使用更大的batch size。

缩短训练或推理时间。计算的次数或者数据存储的存储十分影响算法的执行时间。半精度使用单精度的一半内存访问，从而降低了在存储层方面所花费的时间。与单精度相比，NVIDIA GPU的半精度算术吞吐量最多提高了8倍，从而加快了数学受限层的速度。

参考资料：
fp16训练（混合精度训练）
fp16与fp32简介与试验

猜你喜欢

转: 常见加密算法分,用途,原理以及比较
【FM】算法
python aes加解密
C#中虚方法、静态方法及实例方法简述
Go语言ORM包中使用worm构造查询条件的实例详解
一台电脑同时使用多个Git账号
站点防止攻击
2018-8-10-win10-uwp-如何在DataTemplate绑定方法
Spring Cloud Eureka 服务注册列表显示 IP 配置问题
【探索】在 JavaScript 中使用 C 程序
采坑笔记，自定义程序端口6000不能在google浏览器访问
阿里巴巴如果不做云计算会死？
freerdp的android客户端afreerdp的编译过程
Linux新手应掌握的10个基本命令
使用Spring Boot开发Web项目
51地图学习笔记
极客日报第107期：创造历史！NASA 机智号火星直升机首飞成功；字节跳动申请注册“狗头大作战”商标；阿里达摩院发布语言模型 PLUG
mybatis in条件查询数据只查出一条
java导入导出用什么，搞懂这些直接来阿里入职
C#框架结构分层
【JavaScript】函数—可重用的代码块
CSS-相关练习1-表格实现奇数行和偶数行自行判断设置不同的背景颜色

相关主题

入门训练（4）
2023春训练7
算法训练 2的次幂表示
分布式训练
混合精度训练
1.15训练笔记补

zl程序教程

当前栏目

fp16训练（混合精度训练）

相关文章