zl程序教程

您现在的位置是:首页 >  硬件

当前栏目

6-机器学习进阶_指针网络_递归结构

机器网络学习 进阶 指针
2023-09-11 14:14:28 时间

在这里插入图片描述
指针网络,输入坐标,输出包围的外围的点,输入的特征是什么,输出的选择结果范围是什么
在这里插入图片描述
传统的seq2seq
decoder训练的时候固定输出范围了,当预测输出类别大于之前训练好的时候的时候和训练不一致就不work了
这些问题,前人经典的课程已经涉及到了,值得反复的看
所谓的训练就是,按一定的规则去训练一个函数,让函数学会人为设定的这个规则而已
在这里插入图片描述
通过指针网络,不取decoder是输出,直接取encoder的输出即可,通过相似度计算去改了最大的那个,知道输出x0.y0这个停止标志,decode部分同样包含解码网络的
在这里插入图片描述
在文本摘要的应用
用一定的几率传统和指针网络相结合,最终的输出是两者概率的加权和,针对词典里面没有的词也能正常输出,
在这里插入图片描述
阅读理解和对话系统都可以应用,针对词典中没有的词,可以直接通过指针网络从输入里面取即可
在这里插入图片描述
其实就是纯数学的应用而已,输入的数值,经过一个函数得到输出,神经元就是一个函数,包含线性和非线性而已
Recurrent structure就是Recursive structure第一个特殊应用而已,Recursive structure可以觉得根据文法结构方式结合,也可以按这种递归网络的方式结合
在这里插入图片描述
按特定的文法结构来组合,先结合那部分向量,再结合哪部分向量
在这里插入图片描述
在这里插入图片描述
根据语法结构,先结合部分,再结合其他的部分,尤其是针对数学公式,这个方法会更加有效相比传统的RNN网络
在这里插入图片描述
不是简单的组合,经过一些运算和转换在组合
这个就是自注意力机制的起源了,后面还有拼接,创新的方法,都是经典的点子的一个燃烧

在这里插入图片描述
把一个向量拆成自己的和影响其他向量的组合
在这里插入图片描述
LSTM的组合,组合的网络换成LSTM,就变成了LSTM递归树,数据结构的思想随处可见