您现在的位置是：首页 > IT要闻

当前栏目

【机器学习每日一问06】为什么LSTM使用sigmoid和tanh作为激活函数

输出学习

2023-04-18 14:49:20 时间

门（输入门，输出门，遗忘门）使用sigmoid，求值（

）使用tanh。

为什么？

门是控制开闭的，全开时值为1，全闭值为０。用于遗忘和保留信息。
对于求值的激活函数无特殊要求。

能更换吗？

门是控制开闭的，全开时值为1，全闭值为０。用于遗忘和保留信息。门的激活函数只能是值域为０到１的，最常见的就是sigmoid。
对于求值的激活函数无特殊要求。

能不能把tanh换成relu？

不行

会造成输出值爆炸。RNN共享参数矩阵，长程的话相当于多个相乘，最后输出类似于

，其中是 f 激活函数，如果 W 有一个大于1的特征值，且使用relu激活函数，那最后的输出值会爆炸。但是使用tanh激活函数，能够把输出值限制在-1和1之间。

这里relu并不能解决梯度消失或梯度爆炸的问题。假设有t=3，最后一项输出反向传播对W求导，

。我们用最后一项做分析，即使使用了relu，

，还是会有两个 W 相乘，并不能解决梯度消失或梯度爆炸的问题。

猜你喜欢

Jease 2.6发布 Java开源内容框架
EasyCVR对接华为iVS订阅摄像机和用户变更请求接口介绍
JVM调优总结：反思
【技术种草】cdn+轻量服务器+hugo=让博客“云原生”一下
JVM调优总结：调优方法
前端面试【JavaScript】— typeof 是否能正确判断类型？
JVM调优总结：新一代的垃圾回收算法
前端面试【JavaScript】— instanceof 能否判断基本数据类型？
JVM调优总结：典型配置举例
前端面试【JavaScript】— 能不能手动实现一下 instanceof 的功能？
前端面试【JavaScript】— Object.is和=== 有什么区别？
JVM调优总结：分代垃圾回收详述
前端面试【JavaScript】— JS中类型转换有哪几种？
WPF开发入门尝试
前端面试【JavaScript】— == 和 ===有什么区别？
一个Java程序员对2011年的回顾
前端面试【JavaScript】— 对象转原始类型是根据什么流程运行的？
JVM调优总结：垃圾回收面临的问题
直接在代码里面对list集合进行分页
JVM调优总结：基本垃圾回收算法

zl程序教程

当前栏目

【机器学习每日一问06】为什么LSTM使用sigmoid和tanh作为激活函数

为什么？

能更换吗？

能不能把tanh换成relu？

相关文章