您现在的位置是：首页 > 前端

当前栏目

深度学习-神经网络-循环神经网络（二）：LSTM【最多200个上下文；1997】 --＞ GRU【2014】【三者都无法并行计算】

循环学习神经网络 -- 无法深度 2014 200

2023-09-27 14:20:38 时间

Jordan RNN于1986年提出：《SERIAL ORDER: A PARALLEL DISTRmUTED PROCESSING APPROACH》
Elman RNN于1990年提出：《Finding Structure in Time》
《LSTM原始论文：Long Short-Term Memory》
《GRU原始论文：Learning Phrase Representations using RNN Encoder-Decoder for Statistical Machine Translation》

四、LSTM(Long Short-term Memory)长短期记忆结构

LSTM是RNN的升级版，加入了forget、input、output三个步骤，包含3个门，5对参数，两次更新。赋予了RNN选择性记忆的能力，一定程度解决了RNN中Long Term Dependency（长期依赖）的问题。

LSTM 通过刻意的设计来避免长期依赖问题。记住长期的信息在实践中是 LSTM 的默认行为，而非需要付出很大代价才能获得的能力！

由于内部结构相对较复杂, 因此训练效率在同等算力下较传统RNN低很多.

猜你喜欢

Portraiture4.0最新免费磨皮美白滤镜修图插件
【SSH系列】Hibernate映射 -- 多对多关联映射
文件读写的方法
【1】从零开始学习目标检测：YOLO算法详解
【小程序】普惠节
Java异常-Java随记（throw和throws区别，final、finally和finalize的区别）
redmine和jenkins的ldap登录设置
4G刚到华为新一代5G无线网络接口又将面世
java8 Streams API（1）
VC获取精确时间的做法
thinkphp遇到的小问题，js文件中U方法不被解析
Spring的@Async异步编程

相关主题

Java--循环结构
js for循环
v-for循环遍历

zl程序教程

当前栏目

深度学习-神经网络-循环神经网络（二）：LSTM【最多200个上下文；1997】 --＞ GRU【2014】【三者都无法并行计算】

四、LSTM(Long Short-term Memory)长短期记忆结构

相关文章