PyTorch教程参数访问

番茄西红柿发布于2021-11-26 11:11 / 3149人阅读

摘要：因为在训练的过程中，我们的目标就是找到让损失函数最小化的参数值。经过训练之后我们需要将这些参数拿出来做预测，或者在其他地方使用。在不同模型组件间共享参数。当通过类定义模型时，我们可以通过索引来访问模型的任意层。

为什么要多带带摘出来参数讲一下。

因为在训练的过程中，我们的目标就是找到让损失函数最小化的参数值。经过训练之后我们需要将这些参数拿出来做预测，或者在其他地方使用。

所以为了以后方便，我们现在就要摘出来多带带讲一下：

访问参数，用于调试、诊断和可视化。
参数初始化。
在不同模型组件间共享参数。

import torchfrom torch import nnnet = nn.Sequential(nn.Linear(4, 8), nn.ReLU(), nn.Linear(8, 1))X = torch.rand(size=(2, 4))net(X)

这还是简易实现了一个多层感知机，然后弄了一个X做输入。

当通过Sequential类定义模型时，我们可以通过索引来访问模型的任意层。

print(net)

可以看到输出为：

>>Sequential(  (0): Linear(in_features=4, out_features=8, bias=True)  (1): ReLU()  (2): Linear(in_features=8, out_features=1, bias=True))

我们可以通过前边的序号得到想要的层。

print(net[0])print(net[1])print(net[2].state_dict())

>>Linear(in_features=4, out_features=8, bias=True)ReLU()OrderedDict([(weight, tensor([[-0.0264, -0.0906,  0.3497,  0.3284, -0.0173,  0.0124,  0.0136,  0.0782]])), (bias, tensor([0.2243]))])

不出意外，我们看到了前两层是什么。

至于第三个输出，我们可以看到，这个层包含两个参数。

[    (        weight,         tensor([[-0.0264, -0.0906,  0.3497,  0.3284, -0.0173,  0.0124,  0.0136,  0.0782]])    ),    (        bias,         tensor([0.2243])    )]

print(type(net[2].bias))print(type(net[0].weight))

>>

可以看到每个参数都表示为参数（parameter）类的一个实例。

print(net[2].bias)print(net[0].weight)

Parameter containing:tensor([-0.1431,  0.1381, -0.2775,  0.0038, -0.0269,  0.0631, -0.1791,  0.1291],       requires_grad=True)Parameter containing:tensor([[-0.4736,  0.2223, -0.0059,  0.4146],        [-0.1052,  0.2813, -0.2315,  0.2931],        [-0.4990, -0.1991, -0.1453,  0.0369],        [-0.4676,  0.0669, -0.0069, -0.4932],        [-0.4223,  0.0659, -0.3783, -0.1145],        [-0.0460,  0.2386, -0.1586,  0.2148],        [-0.0085, -0.3642,  0.0265,  0.0487],        [ 0.2703, -0.2903,  0.1822, -0.3782]], requires_grad=True)

相应的层序号+方法调用，提取网络的偏置或参数。

print(*[(name, param.shape) for name, param in net[0].named_parameters()])print(*[(name, param.shape) for name, param in net.named_parameters()])print(*net.named_parameters(),end="/n",sep=/n)# 这里*是一个解包器 ，用于输出列表的每一个元素

>>(weight, torch.Size([8, 4])) (bias, torch.Size([8]))(0.weight, torch.Size([8, 4])) (0.bias, torch.Size([8]))(2.weight, torch.Size([1, 8])) (2.bias, torch.Size([1]))(0.weight, Parameter containing:tensor([[ 0.3700,  0.3270, -0.3741, -0.1365],        [ 0.2200,  0.0786,  0.1241, -0.2834],        [ 0.3143,  0.3718,  0.3278,  0.0949],        [ 0.1565,  0.4639, -0.1515, -0.4962],        [ 0.3102, -0.0025, -0.0099, -0.4132],        [ 0.1754, -0.1320, -0.3762, -0.1371],        [-0.3860, -0.0369,  0.3743, -0.0892],        [ 0.0280, -0.2877, -0.1884,  0.2915]], requires_grad=True))(0.bias, Parameter containing:tensor([ 0.4722, -0.4143,  0.0858, -0.2280,  0.4349,  0.3954,  0.0971, -0.1192],       requires_grad=True))(2.weight, Parameter containing:tensor([[ 0.0984,  0.0207, -0.1292,  0.0530, -0.0693,  0.0413, -0.2231, -0.3125]],       requires_grad=True))(2.bias, Parameter containing:tensor([0.1844], requires_grad=True))

关于解包器看这里：Python * ** 打包解包详解 - 掘金 (juejin.cn)

我把三个输出分开了。

第一个是解包net的第0层的参数参数名称和参数形状
第二个是解包net所有层的参数名称和参数形状
第三个是解包net的参数列表

还可以这样获取参数列表：

print(net.state_dict()[2.bias].data)print(net.state_dict()[0.weight])

>>tensor([0.1844])tensor([[ 0.3700,  0.3270, -0.3741, -0.1365],        [ 0.2200,  0.0786,  0.1241, -0.2834],        [ 0.3143,  0.3718,  0.3278,  0.0949],        [ 0.1565,  0.4639, -0.1515, -0.4962],        [ 0.3102, -0.0025, -0.0099, -0.4132],        [ 0.1754, -0.1320, -0.3762, -0.1371],        [-0.3860, -0.0369,  0.3743, -0.0892],        [ 0.0280, -0.2877, -0.1884,  0.2915]])

后边不管加不加.data都可以直接输出参数的值。

def block1():    return nn.Sequential(nn.Linear(4, 8), nn.ReLU(),                         nn.Linear(8, 4), nn.ReLU())def block2():    net = nn.Sequential()    for i in range(4):        # 在这里嵌套        net.add_module(fblock {i}, block1())    net[2] = nn.Linear(4,4)    return netX = torch.rand(size=(2, 4))rgnet = nn.Sequential(block2(), nn.Linear(4, 1))rgnet(X)

定义一个嵌套的网络。随手画了个图，长这样。

print(rgnet)

输出一下这个网路哦，可以看到其结构如下：

>>Sequential(  (0): Sequential(    (block 0): Sequential(      (0): Linear(in_features=4, out_features=8, bias=True)      (1): ReLU()      (2): Linear(in_features=8, out_features=4, bias=True)      (3): ReLU()    )    (block 1): Linear(in_features=4, out_features=4, bias=True)    (block 2): Sequential(      (0): Linear(in_features=4, out_features=8, bias=True)      (1): ReLU()      (2): Linear(in_features=8, out_features=4, bias=True)      (3): ReLU()    )  )  (1): Linear(in_features=4, out_features=1, bias=True))

比如：

print(rgnet[0][2][0].bias.data)print(rgnet.state_dict()[0.block 2.0.bias])

>>tensor([-0.1555,  0.4410, -0.4920,  0.1434,  0.1243,  0.4114, -0.0883,  0.1387])tensor([-0.1555,  0.4410, -0.4920,  0.1434,  0.1243,  0.4114, -0.0883,  0.1387])

在这种情况下要取到其中的参数，第一个放大就是增加一个地址而已。
第二种方法要首先指明在哪一个块。再指明哪一个块上的哪一层。

本文是《动手学深度学习》的笔记，Github地址：DeepLearningNotes/d2l(github.com)

还在更新中…………

GPU云服务器云服务器 linux防火墙禁止访问参数 pytorch pytorch图像识别 pytorch和tensorflow

文章版权归作者所有，未经允许请勿转载,若此文章存在违规行为，您可以联系管理员删除。

转载请注明本文地址：https://www.ucloud.cn/yun/125258.html

Keras vs PyTorch：谁是「第一」深度学习框架？

摘要：第一个深度学习框架该怎么选对于初学者而言一直是个头疼的问题。简介和是颇受数据科学家欢迎的深度学习开源框架。就训练速度而言，胜过对比总结和都是深度学习框架初学者非常棒的选择。「第一个深度学习框架该怎么选」对于初学者而言一直是个头疼的问题。本文中，来自 deepsense.ai 的研究员给出了他们在高级框架上的答案。在 Keras 与 PyTorch 的对比中，作者还给出了相同神经网络在不同框...

_DangJin 2019-04-25 18:28 评论0 收藏0
PyTorch教程自定义层

摘要：上一小节讲的是怎么自定义初始化参数。这个自建一层的作用是让每一个特征量都减去其平均值。第一个是一个线性层。第二个就是我们的自定义层。带参数的层这个租赁一层是自定义实现了一个全链接层。输出它的权重看一下，确实是能生成的权重矩阵。上一小节讲的是怎么自定义初始化参数。这一节是看怎么自定义层。这样可以想一下之前接触的...

不知名网友 2021-11-29 10:50 评论0 收藏0
教程 | 图像分类: Caltech 256数据集

摘要：在该数据集中，图片被分为类，每个类别的图片超过张。这样做是为了减小图片的范围，使得图片的特征更易于学习。为了在数据集上获得更高的准确率，读者可尝试取消冻结参数的设置，使得卷积层也参与训练。 Caltech 256是什么？ Caltech 256数据集是加利福尼亚理工学院收集整理的数据集，该数据集选自Google Image数据集，并手工去除了不符合其类别的图片。在该数据集中，图片被分为...

Channe 2019-06-26 18:45 评论0 收藏0
yolov5无从下手？一篇就够,2021年全部基于最新配置的yolo入门升级路线

摘要：的安装下载好之后双击打开可执行安装文件选择安装目录，需要的内存较多，建议将其安装在盘或者盘，不建议放在系统盘盘。 yolov5无从下手？一篇就够的保姆级教程,202...

AlanKeene 2021-09-06 15:02 评论0 收藏0
PyTorch一周年战绩总结：是否比TensorFlow来势凶猛？

摘要：截止到今天，已公开发行一周年。一年以来，社区中的用户不断做出贡献和优化，在此深表感谢。所以与衡量它的指标包括在机器学习研究论文中的使用。来自香港科技大学的在上推出了面向普通观众的在线课程。 Yann LeCun Twitter截止到今天，PyTorch 已公开发行一周年。一年以来，我们致力于打造一个灵活的深度学习研究平台。一年以来，PyTorch 社区中的用户不断做出贡献和优化，在此深表感谢...

ymyang 2019-04-25 18:23 评论0 收藏0