深度学习-神经网络-循环神经网络(二):LSTM【最多200个上下文;1997】 --> GRU【2014】【三者都无法并行计算】
2023-09-27 14:20:38 时间
Jordan RNN于1986年提出:《SERIAL ORDER: A PARALLEL DISTRmUTED PROCESSING APPROACH》
Elman RNN于1990年提出:《Finding Structure in Time》
《LSTM原始论文:Long Short-Term Memory》
《GRU原始论文:Learning Phrase Representations using RNN Encoder-Decoder for Statistical Machine Translation》
四、LSTM(Long Short-term Memory)长短期记忆结构
LSTM是RNN的升级版,加入了forget、input、output三个步骤,包含3个门,5对参数,两次更新。赋予了RNN选择性记忆的能力,一定程度解决了RNN中Long Term Dependency(长期依赖)的问题。
LSTM 通过刻意的设计来避免长期依赖问题。记住长期的信息在实践中是 LSTM 的默认行为,而非需要付出很大代价才能获得的能力!
由于内部结构相对较复杂, 因此训练效率在同等算力下较传统RNN低很多.
相关文章
- php之快速入门学习-13(PHP 循环 - While 循环)
- Python for循环的用法,怎么前面还有一个变量或函数?
- C#学习记录——循环
- (《机器学习》完整版系列)第7章 贝叶斯分类器——7.10 EM算法的使用场景及步骤(反复循环执行E步和M步)
- Google Earth Engine(GEE)——Kmeans聚类快速进行土地分类(双for循环快速调参)
- Google Earth Engine(GEE)——计算ECDI展示的代码2013-2020年6-8月份和循环下载以北京市为例
- python 循环(while、for、break、continue、循环嵌套、while...else、for...else)
- 面向机器学习的自然语言标注1.4 标注开发循环
- JAVA集合为什么不能在foreach 循环中添加或删除元素?
- [算法]循环打印矩阵,蛇形矩阵专题
- MySQL学习笔记:while循环
- SwiftUI 组件大全之 iOS 15 循环视频背景组件 AVKit 和 AVFoundation
- 循环中如果有某一次循环抛出异常了整个循环就停止的解决办法
- 在C和C ++中创建循环缓冲区
- Tensorflow2.0 入门与实战学习笔记(十四)-RNN循环卷积网络
- javascript for in 循环时,会取到Array.prototype
- Spring 循环引用问题
- iOS - Block的循环引用内存泄漏问题探索