2013-03-18干活小计
2023-04-18 16:49:56 时间
13:00 - 23.00
13点才到实验室 汗
做了一下午思政知识图谱
复现了transformer位置编码:
class Positional(nn.Module): def __init__(self, pos_max_len, embedding_dim, deivce): super().__init__() self.device = device self.position_embedding = torch.zeros(size=(pos_max_len, embedding_dim), dtype=torch.float32) self.omega = torch.arange(embedding_dim/2, dtype=torch.float32) self.omege = self.omega/embedding_dim/2 self.omega = 1./(10000 ** self.omega) out = (torch.arange(1, pos_max_len+1, dtype=torch.float32)[:, None])@(self.omega[None, :] ) emb_sin = torch.sin(out) emb_cos = torch.cos(out) self.position_embedding[:, 0::2] = emb_sin self.position_embedding[:, 1::2] = emb_cos def forward(self, x): pos = self.position_embedding.unsqueeze(dim=0).to(self.device) pos = pos[:, :x.shape[1], :] result = x+pos return result
注意:out = (torch.arange(1, pos_max_len+1, dtype=torch.float32)[:, None])@(self.omega[None, :] ) 这句话把两个一维tensor 变成了相应的二维列行向量
我在高质量的复现transformer 所以今天做的事没那么多
相关文章
- 【技术种草】cdn+轻量服务器+hugo=让博客“云原生”一下
- CLB运维&运营最佳实践 ---访问日志大洞察
- vnc方式登陆服务器
- 轻松学排序算法:眼睛直观感受几种常用排序算法
- 十二个经典的大数据项目
- 为什么使用 CDN 内容分发网络?
- 大数据——大数据默认端口号列表
- Weld 1.1.5.Final,JSR-299 的框架
- JavaFX 2012:彻底开源
- 提升as3程序性能的十大要点
- 通过凸面几何学进行独立于边际的在线多类学习
- 利用行动影响的规律性和部分已知的模型进行离线强化学习
- ModelLight:基于模型的交通信号控制的元强化学习
- 浅谈Visual Source Safe项目分支
- 基于先验知识的递归卡尔曼滤波的代理人联合状态和输入估计
- 结合网络结构和非线性恢复来提高声誉评估的性能
- 最佳实践丨云开发CloudBase多环境管理实践
- TimeVAE:用于生成多变量时间序列的变异自动编码器
- 具有线性阈值激活的神经网络:结构和算法
- 内网渗透之横向移动 -- 从域外向域内进行密码喷洒攻击