just do it and waiting

Pytorch基础

2020-12-18


[toc]

Tensor的创建

tensor是基本的数据类型,基本的创建方式有

除了上述的创建方式,还有可以利用已经存在的tensor来创建,假设现有x = torch.zeros(5,3, dtype=torch.float32),那么,可以根据以下方式创建

Operations

加法

索引

可以使用标准的类似numpy的索引。例如x[:, 1]

resize

resize或者reshape一个tensor,可以使用函数torch.view,例如

x = torch.randn(4, 4)
y = x.view(16)
z = x.view(-1, 8) # -1 表示该维度的值由其他维度推断,这里这个维度的值16/8 = 2
print(x.size(), y.size(), z.size)
# out
# >> torch.Size([4, 4]) torch.Size([16]) torch.Size([2, 8])

更多操作可以参考这里

与numpy连接

事实上,tensor的大多数操作都和numpy类似。这里简单介绍tensor与numpy的互相转换

tensor -> numpy

a = torch.ones(5) # a: tensor([1., 1., 1., 1., 1.])
b = a.numpy() # b: [1. 1. 1. 1. 1.]

注意tensor改变后,numpy数组的变化

a.add_(1) 
# a: tensor([2., 2., 2., 2., 2.])
# b: [2. 2. 2. 2. 2.]
# tensor改变的同时也会改变numpy数组

numpy -> tensor

import numpy as np
a = np.ones(5)
b = torch.from_numpy(a)
np.add(a, 1, out=a)
# a: [2. 2. 2. 2. 2.]
# b: tensor([2., 2., 2., 2., 2.])

自动梯度

tensor的requires_grad属性

每一个tensor有一个requires_grad的属性,如果这个属性设置为True,那么程序将会跟踪与这个tensor所有有关的计算过程,以此来在后续计算它的梯度,计算完的梯度累加在tensor的grad属性中。例如$y=f(x)=a+bx$,$z = g(y)=c+dy$,$f(x), g(y)$均会被跟踪,因为计算$x$的梯度为$\frac{\partial z}{\partial x}=\frac{\partial z}{\partial y}\frac{\partial y}{\partial x}$

requires_grad

用于指定是否需要加入跟踪以计算梯度,例如

x = torch.ones(2, 2, requires_grad=True)
# x: tensor([[1., 1.],
#            [1., 1.]], requires_grad=True)
y = x + 2
# y: tensor([3., 3.],
#           [3., 3.], grad_fn=<AddBackward0>)

临时暂停跟踪

有时,$x$ 参与的一些计算并不需要加入跟踪,也即不需要用于计算梯度,比如临时计算精准度,那么这时需要暂停跟踪。方法如下

detach

直接在需要暂停的变量后执行detach()获得一个不被跟踪的tensor以替代x

x_detached = x.detach()
# do someting here using x_detached
with torch.no_grad():

除了detach创建变量,还可通过上下文管理器torch.no_grad()用于指示接下来的操作都不跟踪,例如

with torch.no_grad():
  # do someting here using x
  # 这里的操作都不会被跟踪
# 上下文管理器外的操作又会继续跟踪

更改requires_grad属性

对于requires_grad属性为False的tensor,可以通过requires_grad_(True)改变属性。例如

a = torch.randn(2, 2)
a.requires_grad(True)
# 改变requires_grad属性

Function

function说明了tensor的计算过程,tensor的grad_fn属性与一个function绑定,用于说明这个tensor如果计算传递过来的。例如

x = torch.ones(2, 2, requires_grad=True)
y = x + 2
# y: tensor([[3., 3.],
#            [3., 3.]], grad_fn=<AddBackward0>)
z = y*y*3
out = z.mean()
# out: tensor(27., grad_fn=<MeanBackward0>)

梯度计算

带有grad_fn属性的tensor,调用backward()可以根据该tensor的grad_fn属性向前计算各个tensor的梯度,并存在各个tensor的grad属性中。例如

out.backward()
print(x.grad)
# >> tensor([[4.5, 4.5],
#            [4.5, 4.5]])

其他方法

item()

对于一个只含有一个数的tensor可以使用item()方法获取这个数值,但如果tensor中的数据不止1个,则会报错,例如

a = torch.tensor([1])
a.item()  # 1
b = torch.tensor([1,2,3])
b.item() # ValueError: only one element tensors can be converted to Python scalars