第二章 预备知识
接下来一段时间,我想自学深度学习,使用的教材为 动手学深度学习 (Pytorch 版),该书有线上网址,且提供配套代码和相关 Python 包,详情可参见 动手学深度学习。
第一章内容,介绍了深度学习的相关背景和应用场景,以及深度学习领域常见的术语和名词,有一定机器学习经验的人或许已比较熟悉,故不再赘述,我们直接从第二章开始。
1. Tensor 操作和数据预处理 深度学习中的数据以张量 (tensor) 形式存储,支持 GPU 计算和 autograd 自动微分。
张量的创建、变形、运算 (按元素 / 矩阵)、广播机制、索引、切片等均与 numpy.ndarray 类似。
节省内存: Y = X + Y 不是原地操作,即:id(Y = X + Y) != id(Y),会分配新的内存。 使用 Y[:] = X + Y 或 Y += X 进行原地操作以避免不必要的内存分配。 Tensor 可以与其他 Python 对象互相转换,如 tensor.numpy()。大小为 1 的张量可以转化为 Python 标量,使用 tensor.item() 或 float(tensor) 等。
数据需要经过预处理,如填充 nan,标准化等,可以借用其他 Python 包处理后再转化为 tensor。
2. 线性代数 标量,以小写字母 $x,y,z$ 等表示。 向量,以粗体小写字母 $\bold{x,y,z}$ 表示,向量的维度 (形状) 代表元素个数 (向量长度),可以使用 len(x), x.shape 获取。以列向量为默认的向量方向,例如: $$ \begin{equation*} x = \begin{bmatrix*} x_{1} \cr x_{2} \cr \vdots \cr x_{n} \end{bmatrix*} \end{equation*} $$ 矩阵,以粗体大写字母 $\bold{X,Y,Z}$ 表示,是具有两个轴的张量。 张量 (此处指代数对象),矩阵的拓展,一种具有更多轴的数据结构,使用特殊字体的大写字母 $X, Y, Z$ 表示。 张量的计算,与 numpy.ndarray 相同,普通的加减乘除、求和、平均、向量点积、矩阵 hadamard 积、矩阵-向量积、矩阵乘法、范数等。