您现在的位置是：首页 > 其他

当前栏目

机器学习之梯度下降

2023-03-14 09:44:23 时间

一、梯度下降

　　引入：当我们得到了一个目标函数后，如何进行求解？直接求解吗？（并不一定可以直接求解，线性回归可以当做是一个特例）

　　梯度：梯度的本意是一个向量（矢量），表示某一函数在该点处的方向导数沿着该方向取得最大值，即函数在该点处沿着该方向（此梯度的方向）变化最快，变化率最大（为该梯度的模）。在机器学习中一般指的就是目标函数的偏导数。

　　下降：正常求出来的一个梯度是朝着梯度上升的一个方向，所以梯度下降就是梯度上升的反方向。

　　基本过程：首先，我们有一个可微分的函数。这个函数就代表着一座山。我们的目标就是找到这个函数的最小值，也就是山底。根据之前的场景假设，最快的下山的方式就是找到当前位置最陡峭的方向，然后沿着此方向向下走，对应到函数中，就是找到给定点的梯度，然后朝着梯度相反的方向，就能让函数值下降的最快！因为梯度的方向就是函数之变化最快的方向所以，我们重复利用这个方法，反复求取梯度，最后就能到达局部的最小值，这就类似于我们下山的过程。局部优化达到最大的优化。

　　常规套路：机器学习的套路就是我交给机器一堆数据，然后告诉它什么样的学习方式是对的（目标函数），然后让它朝着这个方向去做。

　　如何优化：一口吃不成个胖子，我们要静悄悄的一步步的完成迭代（每次优化一点点，累积起来就是个大成绩了）。

　　现在假设有这样一个目标函数：

　　现在我们需要寻找山谷的最低点，也就是我们的目标函数终点（什么样的参数能使得目标函数达到极值点）。

　　那么下山要分几步走呢？首先随机取一个点

　　（1）：然后找到当前最合适的方向
　　（2）：走那么一小步，走快了该”跌倒 ”了
　　（3）：按照方向与步伐去更新我们的参数，也就是重复一二步。

二、梯度下降策略选择

　　（1）批量梯度下降：（容易得到最优解，但是由于每次考虑所有样本，速度很慢）
　　（2）随机梯度下降：（每次找一个样本，迭代速度快，但不一定每次都朝着收敛的方向）
　　（3）小批量梯度下降法：（每次更新选择一小部分数据来算，实用！）batch

三、学习率

　　上面提到我们会按照方向去更新参数，那么更新的幅度就叫做步长，一般叫做学习率。

　　（1）学习率（步长）：对结果会产生巨大的影响，一般小一些
　　（2）如何选择：从小的时候，不行再小
　　（3）批处理数量：32，64，128都可以，很多时候还得考虑内存和效率

　　损失函数就是用来表现预测与实际数据的差距程度，loss表示用来表现预测与实际数据的差距，我们的目标就是让loss的值越接近0越好。

猜你喜欢

鲜为人知但很有用的 HTML 属性
在 Go 里用 CGO？这 7 个问题你要关注！
数据孤岛是业务效率的无声杀手
9款优秀的去中心化通讯软件 Matrix 的客户端
翻转再翻转！有意思的水平横向溢出滚动
发现 Linux SpaceFM 文件管理器的威力
图像处理工具Python扩展库，你了解吗？
求职数据分析，项目经验该怎么写
自定义计数器小技巧！CSS 实现长按点赞累加动画
在OKR中，我看到了数据驱动业务的未来
2023展望：新的一年将给大数据分析领域带来什么？
过五关！React高频面试题指南
阿里云ADB基于Hudi构建Lakehouse的实践
火山引擎云原生大数据在金融行业的实践
OpenHarmony富设备移植指南（二）—从postmarketOS获取移植资源
《数据成熟度指数》报告：64%的企业领袖认为大多数员工“不懂数据”
OpenHarmony 小型系统兼容性测试指南
肯睿中国（Cloudera）：2023年企业数字战略三大趋势预测
适用于 Linux 的十大命令行游戏
软件开发中的十个认知偏差

zl程序教程

当前栏目

机器学习之梯度下降

一、梯度下降

二、梯度下降策略选择

三、学习率

相关文章