如何使用Pytorch-LSTM输出参数

89542767 发布于2022-10-11 11:05 / 1288人阅读

　　小编写这篇文章的主要目的，主要是给大家做一个介绍，介绍关于Pytorch-LSTM是如何去输出参数，有哪一些步骤呢？下面小编就以代码和图片给大家做出一个介绍。

　　1.Pytorch中的LSTM中输入输出参数

　　nn.lstm是继承nn.RNNBase，初始化的定义如下：

　　class RNNBase(Module):
　　...
　　def __init__(self,mode,input_size,hidden_size,
　　num_layers=1,bias=True,batch_first=False,
　　dropout=0.,bidirectional=False):

　　以下是Pytorch中的参数及其含义，解释如下：

　　input_size–输入数据的大小，也就是前面例子中每个单词向量的长度

　　hidden_size–隐藏层的大小（即隐藏层节点数量），输出向量的维度等于隐藏节点数

　　num_layers–recurrent layer的数量，默认等于1。

　　bias–If False,then the layer does not use bias weights b_ih and b_hh.Default:True

　　batch_first–默认为False，也就是说官方不推荐我们把batch放在第一维，这个与之前常见的CNN输入有点不同，此时输入输出的各个维度含义为(seq_length,batch,feature)。当然如果你想和CNN一样把batch放在第一维，可将该参数设置为True，即(batch,seq_length,feature)，习惯上将batch_first设置为True。

　　dropout–如果非0，就在除了最后一层的其它层都插入Dropout层，默认为0。

　　bidirectional–如果设置为True,则表示双向LSTM，默认为False

　　2.输入数据（以batch_first=True，单层单向为例）

　　假设输入数据信息如下：

　　输入维度=28

　　nn.lstm中的API输入参数如下：

　  time_steps=3
　　batch_first=True
　　batch_size=10
　　hidden_size=4
　　num_layers=1
　　bidirectional=False

　　备注：先以简单的num_layers=1和bidirectional=1为例，后面会讲到num_layers与bidirectional的LSTM网络具体构造。

　　下在面代码的中：

　　lstm_input是输入数据，隐层初始输入h_init和记忆单元初始输入c_init的解释如下：

　　h_init：维度形状为(num_layers*num_directions,batch,hidden_size)：

　　第一个参数的含义num_layers*num_directions，即LSTM的层数乘以方向数量。这个方向数量是由前面介绍的bidirectional决定，如果为False,则等于1；反之等于2（可以结合下图理解num_layers*num_directions的含义）。

　　batch：批数据量大小

　　hidden_size:隐藏层节点数

　　c_init：维度形状也为(num_layers*num_directions,batch,hidden_size)，各参数含义与h_init相同。因为本质上，h_init与c_init只是在不同时刻的不同表达而已。

　　备注：如果没有传入，h_init和c_init，根据源代码来看，这两个参数会默认为0。

　　import torch
　　from torch.autograd import Variable
　　from torch import nn
　　input_size=28
　　hidden_size=4
　　lstm_seq=nn.LSTM(input_size,hidden_size,num_layers=1,batch_first=True)#构建LSTM网络
　　lstm_input=Variable(torch.randn(10,3,28))#构建输入
　　h_init=Variable(torch.randn(1,lstm_input.size(0),hidden_size))#构建h输入参数--每个batch对应一个隐层
　　c_init=Variable(torch.randn(1,lstm_input.size(0),hidden_size))#构建c输出参数--每个batch对应一个隐层
　　out,(h,c)=lstm_seq(lstm_input,(h_init,c_init))#将输入数据和初始化隐层、记忆单元信息传入
　　print(lstm_seq.weight_ih_l0.shape)#对应的输入学习参数
　　print(lstm_seq.weight_hh_l0.shape)#对应的隐层学习参数
　　print(out.shape,h.shape,c.shape)

　　输出结果如下：

　　输出结果解释如下：

　　（1）lstm_seq.weight_ih_l0.shape的结果为：torch.Size([16,28])，表示对应的输入到隐层的学习参数：(4*hidden_size,input_size)。

　　（2）lstm_seq.weight_hh_l0.shape的结果为：torch.Size([16,4])，表示对应的隐层到隐层的学习参数：(4*hidden_size,num_directions*hidden_size)

　　（3）out.shape的输出结果：torch.Size([10,3,4])，表示隐层到输出层学习参数，即(batch，time_steps,num_directions*hidden_size)，维度和输入数据类似，会根据batch_first是否为True进行对应的输出结果，（如果代码中，batch_first=False，则out.shape的结果会变为：torch.Size([3,10,4])），

　　这个输出tensor包含了LSTM模型最后一层每个time_step的输出特征，比如说LSTM有两层，那么最后输出的是,表示第二层LSTM每个time step对应的输出；另外如果前面对输入数据使用了torch.nn.utils.rnn.PackedSequence,那么输出也会做同样的操作编程packed sequence；对于unpacked情况，我们可以对输出做如下处理来对方向作分离output.view(seq_len,batch,num_directions,hidden_size),其中前向和后向分别用0和1表示。

　　h.shape输出结果是：torch.Size([1,10,4]),表示隐层到输出层的参数，h_n：(num_layers*num_directions,batch,hidden_size)，只会输出最后一个time step的隐状态结果（如下图所示）

　　c.shape的输出结果是：torch.Size([1,10,4])，表示隐层到输出层的参数，c_n：(num_layers*num_directions,batch,hidden_size)，同样只会输出最后一个time step的cell状态结果（如下图所示）

　　3.输入数据（以batch_first=True，双层双向）

　　'''
　　batch_first=True:输入形式：(batch,seq,feature)
　　bidirectional=True
　　num_layers=2
　　'''
　　num_layers=2
　　bidirectional_set=True
　　bidirectional=2 if bidirectional_set else 1
　　input_size=28
　　hidden_size=4
　　lstm_seq=nn.LSTM(input_size,hidden_size,num_layers=num_layers,bidirectional=bidirectional_set,batch_first=True)#构建LSTM网络
　　lstm_input=Variable(torch.randn(10,3,28))#构建输入
　　h_init=Variable(torch.randn(num_layers*bidirectional,lstm_input.size(0),hidden_size))#构建h输入参数
　　c_init=Variable(torch.randn(num_layers*bidirectional,lstm_input.size(0),hidden_size))#构建c输出参数
　　out,(h,c)=lstm_seq(lstm_input,(h_init,c_init))#计算
　　print(lstm_seq.weight_ih_l0.shape)
　　print(lstm_seq.weight_hh_l0.shape)
　　print(out.shape,h.shape,c.shape)

　　Pytorch-LSTM函数参数解释图解

　　最近在写有关LSTM的代码，但是对于nn.LSTM函数中的有些参数还是不明白其具体含义，学习过后在此记录。

　　为了方便说明，我们先解释函数参数的作用，接着对应图片来说明每个参数的具体含义。

　　torch.nn.LSTM函数

　　LSTM的函数

　　class torch.nn.LSTM(args,*kwargs)
　　#主要参数
　　#input_size–输入的特征维度
　　#hidden_size–隐状态的特征维度
　　#num_layers–层数（和时序展开要区分开）
　　#bias–如果为False，那么LSTM将不会使用偏置，默认为True。
　　#batch_first–如果为True，那么输入和输出Tensor的形状为(batch,seq_len,input_size)
　　#dropout–如果非零的话，将会在RNN的输出上加个dropout，最后一层除外。
　　#bidirectional–如果为True，将会变成一个双向RNN，默认为False。

　　LSTM的输入维度为(seq_len,batch,input_size)如果batch_first为True，则输入形状为(batch,seq_len,input_size)

　　seq_len是文本的长度;

　　batch是批次的大小;

　　input_size是每个输入的特征纬度（一般是每个字/单词的向量表示;

　　LSTM的输出维度为(seq_len,batch,hidden_size*num_directions)

　　seq_len是文本的长度;

　　batch是批次的大小;

　　hidden_size是定义的隐藏层长度

　　num_directions指的则是如果是普通LSTM该值为1;Bi-LSTM该值为2

　　当然，仅仅用文本来说明则让人感到很懵逼，所以我们使用图片来说明。

　　图解LSTM函数

　　我们常见的LSTM的图示是这样的：

　　但是这张图很具有迷惑性，让我们不易理解LSTM各个参数的意义。具体将上图中每个单元展开则为下图所示：

　　input_size:图1中xi与图2中绿色节点对应，而绿色节点的长度等于input_size（一般是每个字/单词的向量表示）。

　　hidden_size:图2中黄色节点的数量

　　num_layers:图2中黄色节点的层数（该图为1）

　　以上就是小编为大家总结的资料，希望可以为大家带来更多的帮助。

GPU云服务器云服务器带有输出参数 php输出连接参数 jsp输出使用 php 函数参数使用

文章版权归作者所有，未经允许请勿转载,若此文章存在违规行为，您可以联系管理员删除。

转载请注明本文地址：https://www.ucloud.cn/yun/127989.html

37个JavaScript基本面试问题和解答

摘要：在严格模式下，尝试这样做会引发错误。问题是在解析数字之前将其第一个参数强制转换为字符串。当处理程序完成时，将检查队列并处理该事件例如，执行脚本。当值为零作为的第二个参数传递时，它将尝试尽快执行指定的函数。 1、使用typeof bar ===object来确定bar是否是一个对象时有什么潜在的缺陷？这个陷阱如何避免？尽管typeof bar ===object是检查bar是否是对象的...

yzzz 2019-08-22 17:02 评论0 收藏0
37个JavaScript基本面试问题和解答

摘要：在严格模式下，尝试这样做会引发错误。问题是在解析数字之前将其第一个参数强制转换为字符串。当处理程序完成时，将检查队列并处理该事件例如，执行脚本。当值为零作为的第二个参数传递时，它将尝试尽快执行指定的函数。 1、使用typeof bar ===object来确定bar是否是一个对象时有什么潜在的缺陷？这个陷阱如何避免？尽管typeof bar ===object是检查bar是否是对象的...

Taste 2019-08-29 15:19 评论0 收藏0
37个JavaScript基本面试问题和解答

摘要：在严格模式下，尝试这样做会引发错误。问题是在解析数字之前将其第一个参数强制转换为字符串。当处理程序完成时，将检查队列并处理该事件例如，执行脚本。当值为零作为的第二个参数传递时，它将尝试尽快执行指定的函数。 1、使用typeof bar ===object来确定bar是否是一个对象时有什么潜在的缺陷？这个陷阱如何避免？尽管typeof bar ===object是检查bar是否是对象的...

hedzr 2019-08-02 10:21 评论0 收藏0
胶囊网络9大优势4大缺陷

摘要：链接是他们在数据集上达到了较先进的性能，并且在高度重叠的数字上表现出比卷积神经网络好得多的结果。在常规的卷积神经网络中，通常会有多个汇聚层，不幸的是，这些汇聚层的操作往往会丢失很多信息，比如目标对象的准确位置和姿态。 PPT由于笔者能力有限，本篇所有备注皆为专知内容组成员根据讲者视频和PPT内容自行补全，不代表讲者本人的立场与观点。胶囊网络Capsule Networks你好！我是Aurél...

TesterHome 2019-04-25 18:22 评论0 收藏0