您现在的位置是：首页 > 工具

当前栏目

04 自动调整学习率（Learning Rate）-学习笔记-李宏毅深度学习2021年度

笔记自动学习深度 2021 调整 04 learning

2023-09-27 14:19:57 时间

上一篇：03 梯度（Gradient）很小怎么办（Local Minima与Saddle Point）-学习笔记-李宏毅深度学习2021年度

下一篇：05 Classification-学习笔记-李宏毅深度学习2021年度

本节内容及相关链接

自动调整 Learning Rate 的常见策略

课堂笔记

当training陷入瓶颈时，不一定是gradient太小，有可能是由于学习率太大，导致其在山谷之间震荡，无法抵达最小值

在这里插入图片描述
对应到gradient的函数图像如下图：

$x$ 轴为更新次数， $y$ 为gradient的大小

要根据迭代次数，当前梯度等因素，自动调整 Learning Rate。 $\theta$ 的更新公式改为: $\theta_i^{t+1}\leftarrow \theta_i^t - \frac{\eta}{\sigma_i^t}g^t_i$

对于Learning Rate的调整，都是通过调整 $\sigma$ 来实现

常见的调整策略有：

Root Mean Square：考虑本次的梯度和过去的所有梯度
RMSProp：重点考虑本次的梯度，稍微考虑过去的所有梯度
Adam：结合了RMSProp和Momentum
Learning Rate Decay：随着更新次数的增多，因为我们就会越接近目标，所以要将Learning Rate调小
Warm Up：一开始Learning Rate小一点，然后随着迭代次数增多而增大，然后到某一个点时，再随着迭代次数增多而减小。如图所示：

Root Mean Square公式为： $\sigma_{i}^{t}=\sqrt{\frac{1}{t+1} \sum_{i=0}^{t}\left(g_{i}^{t}\right)^{2}}$

RMSProp公式为： $\sigma_{i}^{t}=\sqrt{\alpha\left(\sigma_{i}^{t-1}\right)^{2}+(1-\alpha)\left(g_{i}^{t}\right)^{2}}$ 其中 $\alpha$ 为要调的超参数， $0<\alpha<1$

Adam 建议采用Pytorch默认的参数。

Adam的调整策略如下：

在这里插入图片描述

猜你喜欢

【GoLang】golang底层数据类型实现原理
python学习笔记（八）——文件操作
nginx的请求接收流程（二）
创业18
Linux(CentOS7)命令学习摘要
jenkins之另辟蹊径实现根据svn项目实现智能选择
跨越沟通界限译云构建创新型语言服务生态系统
python xml.etree.ElementTree解析xml文件获取节点
看完小白也能懂什么是公有云、私有云、混合云
VC++对话框中加状态栏
挑战与机遇并存的物联网2016年十大现象
还在发愁项目去哪找？软件测试企业级Web自动化测试实战项目
MAVEN:不能互相引用
说说云盘背后的黑科技！
odoo8.0下selection_add的使用
windows 下FFMPEG的编译方法附2012-9-19发布的FFMPEG编译好的SDK下载
TeeChart Pro ActiveX2022Crack,带有各种图形样式

相关主题

安全笔记
HTML笔记
GIT学习笔记.
vue2小笔记
算法笔记1
Linux笔记09
正则笔记
汇编笔记
408笔记
管理笔记
docker使用/笔记
Elasticsearch搜学习笔记
笔记笔记笔记
python 爬虫笔记
HTML5笔记
kafka笔记4
笔记笔记
Docker笔记3

zl程序教程

当前栏目

04 自动调整学习率（Learning Rate）-学习笔记-李宏毅深度学习2021年度

本节内容及相关链接

课堂笔记

相关文章