您现在的位置是：首页 > 其他

当前栏目

bert预训练代码

训练代码 bert

2023-09-14 09:11:22 时间

1.输入emb层

在modeling.py文件中，首先对token进行emb词向量查询

然后进行emb后处理，获取sentence emb/位置emb：

sentence emb也就是segment emb，即不同句子的初始化嵌入向量:

下面是pos emb：

https://blog.csdn.net/Kaiyuan_sjtu/article/details/90265473

注意，在Transformer论文中的position embedding是由sin/cos函数生成的固定的值，而在这里代码实现中是跟普通word embedding一样随机生成的，可以训练的。作者这里这样选择的原因可能是BERT训练的数据比Transformer那篇大很多，完全可以让模型自己去学习。
https://blog.csdn.net/Kaiyuan_sjtu/article/details/90288178，关于处理输入的部分。

https://blog.csdn.net/Kaiyuan_sjtu/article/details/90298807，任务训练的目标函数

3.2个任务

get_masked_lm_output：

#就是每一个word在encoder之后都会有一个输出，根据这个和那些mask掉的做标记，经过softmax计算损失，其实这个还蛮好理解的。

get_next_sentence_output：

#输入为BertModel的最后一层pooled_output输出（[batch_size, hidden_size]），
# 因为该任务属于二分类问题，所以只需要每个序列的第一个token【CLS】即可。
0表示是next 句子，1 表示是随机选择的句子。

猜你喜欢

57. SAPGUI 里 F1 功能键的用法专题讲解
ETA6093 或 ETA9741 ETA9742 的 TYPE-C 的资料收集
46. 全排列
王健林的滑铁卢
从零开始学_JavaScript_系列（13）——CSS<2>（新窗口打开，背景图片填充，底文字，小提示，CSS选择器整理）
【EdgeX】EdgeX Foundry 框架整体入门（详解）
Qt设置TextEdit一直显示最新的数据
链家笔试：素数打表
“决策树”——数据挖掘、数据分析
【华为云技术分享】【Python算法】分类与预测——Python随机森林

相关主题

蓝桥杯训练6
蓝桥杯训练2
算法训练 2的次幂表示
试题算法训练 P0104
（原）torch的训练过程
2017多校训练1
pytorch训练模型

zl程序教程

当前栏目

bert预训练代码

1.输入emb层

3.2个任务

相关文章