您现在的位置是：首页 > 系统

当前栏目

使用pytorch动手实现LSTM模块

模块 PyTorch 实现动手 lstm 使用

2023-09-14 09:15:50 时间

import torch
import torch.nn as nn
from torch.nn import Parameter
from torch.nn import init
from torch import Tensor
import math

class NaiveLSTM(nn.Module):
    """Naive LSTM like nn.LSTM"""
    def __init__(self, input_size: int, hidden_size: int):
        super(NaiveLSTM, self).__init__()
        self.input_size = input_size
        self.hidden_size = hidden_size

        # input gate
        self.w_ii = Parameter(Tensor(hidden_size, input_size))
        self.w_hi = Parameter(Tensor(hidden_size, hidden_size))
        self.b_ii = Parameter(Tensor(hidden_size, 1))
        self.b_hi = Parameter(Tensor(hidden_size, 1))

        # forget gate
        self.w_if = Parameter(Tensor(hidden_size, input_size))
        self.w_hf = Parameter(Tensor(hidden_size, hidden_size))
        self.b_if = Parameter(Tensor(hidden_size, 1))
        self.b_hf = Parameter(Tensor(hidden_size, 1))

        # output gate
        self.w_io = Parameter(Tensor(hidden_size, input_size))
        self.w_ho = Parameter(Tensor(hidden_size, hidden_size))
        self.b_io = Parameter(Tensor(hidden_size, 1))
        self.b_ho = Parameter(Tensor(hidden_size, 1))
        
        # cell
        self.w_ig = Parameter(Tensor(hidden_size, input_size))
        self.w_hg = Parameter(Tensor(hidden_size, hidden_size))
        self.b_ig = Parameter(Tensor(hidden_size, 1))
        self.b_hg = Parameter(Tensor(hidden_size, 1))

        self.reset_weigths()

    def reset_weigths(self):
        """reset weights
        """
        stdv = 1.0 / math.sqrt(self.hidden_size)
        for weight in self.parameters():
            init.uniform_(weight, -stdv, stdv)

    def forward(self, inputs: Tensor, state: Tuple[Tensor]) \
        -> Tuple[Tensor, Tuple[Tensor, Tensor]]:
        """Forward
        Args:
            inputs: [1, 1, input_size]
            state: ([1, 1, hidden_size], [1, 1, hidden_size])
        """
#         seq_size, batch_size, _ = inputs.size()

        if state is None:
            h_t = torch.zeros(1, self.hidden_size).t()
            c_t = torch.zeros(1, self.hidden_size).t()
        else:
            (h, c) = state
            h_t = h.squeeze(0).t()
            c_t = c.squeeze(0).t()

        hidden_seq = []

        seq_size = 1
        for t in range(seq_size):
            x = inputs[:, t, :].t()
            # input gate
            i = torch.sigmoid(self.w_ii @ x + self.b_ii + self.w_hi @ h_t +
                              self.b_hi)
            # forget gate
            f = torch.sigmoid(self.w_if @ x + self.b_if + self.w_hf @ h_t +
                              self.b_hf)
            # cell
            g = torch.tanh(self.w_ig @ x + self.b_ig + self.w_hg @ h_t
                           + self.b_hg)
            # output gate
            o = torch.sigmoid(self.w_io @ x + self.b_io + self.w_ho @ h_t +
                              self.b_ho)
            
            c_next = f * c_t + i * g
            h_next = o * torch.tanh(c_next)
            c_next_t = c_next.t().unsqueeze(0)
            h_next_t = h_next.t().unsqueeze(0)
            hidden_seq.append(h_next_t)

        hidden_seq = torch.cat(hidden_seq, dim=0)
        return hidden_seq, (h_next_t, c_next_t)

def reset_weigths(model):
    """reset weights
    """
    for weight in model.parameters():
        init.constant_(weight, 0.5)

### test 
inputs = torch.ones(1, 1, 10)
h0 = torch.ones(1, 1, 20)
c0 = torch.ones(1, 1, 20)
print(h0.shape, h0)
print(c0.shape, c0)
print(inputs.shape, inputs)

# test naive_lstm with input_size=10, hidden_size=20
naive_lstm = NaiveLSTM(10, 20)
reset_weigths(naive_lstm)

output1, (hn1, cn1) = naive_lstm(inputs, (h0, c0))

print(hn1.shape, cn1.shape, output1.shape)
print(hn1)
print(cn1)
print(output1)

猜你喜欢

DotNetOnPreRender(EventArgse)事件常用的方法
优维科技彭鲤航：应用CMDB 金融行业运维平台的基石
SAP 采购订单/采购申请审批流程配置详解编程语言
数据库-MySQL基础（9）-多表关系
MySQL Error number: MY-011159; Symbol: ER_SEMISYNC_FAILED_TO_INSERT_TRX_NODE; SQLSTATE: HY000 报错故障修复远程处理
2022世界人工智能大会•腾讯“智变未来”论坛：聚焦产业升级，数字赋能未来
本周将迎来超级月亮“草莓月亮”
使用Oracle HR建立数据库表快速高效的存储解决方案（oracle hr建表）
基于SQLServer的Web开发项目实践（sqlserver项目）
一个lock锁就可以分出低中高水平的程序员对问题的处置方式
MySQL中简单易用的字符串函数（mysql取字符串函数）
MySQL 查看用户信息实现快速检索（mysql查看用户信息）
微信小程序函数防抖和函数节流
一个半月，拿下《剑指offer》了
轻松完成700多条指令、成功率达97%！谷歌开源机器人领域transformer
安装双系统的Linux美丽大世界！（linux安装xp系统）

相关主题

Python 模块和包
python io模块
Python-模块
python的sys模块
模块模式
android模块
Lua中模块和包
Ansible-yum模块
os模块
os.path 模块
ES6 模块
模块和包
angular模块
函数与模块
fs模块
Pycharm 中导入模块
模块分析
3-7 模块的概念
nodejs之fs 模块
登录模块

zl程序教程

当前栏目

使用pytorch动手实现LSTM模块

相关文章