您现在的位置是：首页 > 其他

当前栏目

聊聊图像识别：循环神经网络

网络输出神经网络

2023-04-18 15:12:19 时间

循环神经网络(Recurrent Neural Network，RNN)主要是用来解决序列数据问题。它之所以成为循环神经网络，是因为一个序列的当前输出与前面的输出也是有关的。RNN网络对之前时刻的信息进行记忆，并运用到当前输出计算中，与卷积神经网络不同，循环神经网络隐藏层之间的神经元是相互连接的，隐藏层中神经元的输入是由输入层的输出和上一时刻隐藏神经元的输出共同构成。虽然RNN网络取得了一些显著成果，但是有一些缺点和局限，如：训练难度大、准确度低、效率低、时间长等，故基于RNN之上的一些改进的网络模型逐渐被研发出来，如：长短时记忆网络(Long Short-Term Memory，LSTM)，双向RNN，双向LSTM、GRU等。这些改进的RNN模型在图像识别领域表现出了显出的效果，并被广泛应用。以LSTM网络为例，介绍下其主要网络结构。

长短时记忆网络(Long Short-Term Memory，LSTM)解决了RNN存在着梯度消失或梯度爆炸等问题，可以学习长期依赖问题。其结构如下。

LSTM拥有三个门来让信息选择式通过：遗忘门、输入门、输出门。其中遗忘门决定着哪些信息可以通过这个cell。它通过一个sigmoid神经层来实现。它的输入是，输出是一个数值在(0，1)之间的向量，表示着让的各部分信息通过的比重。0表示“不让任何信息通过”，1表示“让所有信息通过”。

输入门决定着让多少新的信息加入到cell状态中来，一个tanh层生成一个向量，也就是备选的用来更新的内容。

更新cell状态：

输出门决定中的哪部分信息被输出：

GRU网络模型也同样解决了RNN存在着梯度消失或梯度爆炸等问题，能够学习长期依赖关系，是LSTM的一种变形，结构比LSTM简单，具有更少的参数，训练时间也较LSTM有所缩短。也广泛应用于语音识别、图像描述、自然语言处理等场景。

猜你喜欢

Jease 2.6发布 Java开源内容框架
EasyCVR对接华为iVS订阅摄像机和用户变更请求接口介绍
JVM调优总结：反思
【技术种草】cdn+轻量服务器+hugo=让博客“云原生”一下
JVM调优总结：调优方法
前端面试【JavaScript】— typeof 是否能正确判断类型？
JVM调优总结：新一代的垃圾回收算法
前端面试【JavaScript】— instanceof 能否判断基本数据类型？
JVM调优总结：典型配置举例
前端面试【JavaScript】— 能不能手动实现一下 instanceof 的功能？
前端面试【JavaScript】— Object.is和=== 有什么区别？
JVM调优总结：分代垃圾回收详述
前端面试【JavaScript】— JS中类型转换有哪几种？
WPF开发入门尝试
前端面试【JavaScript】— == 和 ===有什么区别？
一个Java程序员对2011年的回顾
前端面试【JavaScript】— 对象转原始类型是根据什么流程运行的？
JVM调优总结：垃圾回收面临的问题
直接在代码里面对list集合进行分页
JVM调优总结：基本垃圾回收算法

zl程序教程

当前栏目

聊聊图像识别：循环神经网络

相关文章