Skip to main content

第一章 向量引论

线性代数的中心是两个运算--都是针对向量。我们把向量相加得到 v+w\bm{v} + \bm{w},我们用数字 ccdd 乘向量得到 cvc\bm{v}dwd\bm{w},组合这两种运算(cvc\bm{v} 加到 dwd\bm{w})得到线性组合 cv+dwc\bm{v}+d\bm{w}

线性组合

cv+dw=c[11]+d[23]=[c+2dc+3d]c\bm{v}+d\bm{w} = c \begin{bmatrix} 1 \\ 1 \end{bmatrix} + d \begin{bmatrix} 2 \\ 3 \end{bmatrix} = \begin{bmatrix} c + 2d \\ c + 3d \end{bmatrix}

向量cvc\bm{v}落在一条直线,当w\bm{w}不在这条线上时,线性组合cv+dwc\bm{v}+d\bm{w}会充满整个二维平面

The vectors cvc\bm{v} lie along a line. When w\bm{w} is not on that line, the combinations cv+dwc\bm{v}+d\bm{w} fill the whole two-dimensional plane.

1.1 向量与线性组合

我们有两个不同的数字 v1v_1v2v_2,它们配对产生一个二维向量v\bm{v}

列向量vv=[v1v2]v1=v的第一个分量v2=v的第二个分量\text{列向量}\bm{v} \qquad \bm{v} = \begin{bmatrix} v_1 \\ v_2 \end{bmatrix} \begin{matrix} \qquad v_1=\bm{v}\text{的第一个分量} \\ \qquad v_2=\bm{v}\text{的第二个分量} \end{matrix}

向量加法(Vector Addition)

v=[v1v2]w=[w1w2]相加得到v+w=[v1+w1v2+w2]\bm{v}= \begin{bmatrix} v_1 \\ v_2 \end{bmatrix} \quad \text{与} \quad \bm{w}= \begin{bmatrix} w_1 \\ w_2 \end{bmatrix} \quad \text{相加得到} \quad \bm{v}+\bm{w} = \begin{bmatrix} v_1 + w_1\\ v_2 + w_2 \end{bmatrix}

减法追随相同的概念:vw\bm{v}-\bm{w} 的分量是 v1w1v_1-w_1v2w2v_2-w_2

标量乘法(Scalar Multiplication) ,也称为:数乘、纯量乘法

2v=[2v12v2]=v+vv=[v1v2]2\bm{v} = \begin{bmatrix} 2v_1 \\ 2v_2 \end{bmatrix} = \bm{v} + \bm{v} \qquad -\bm{v} = \begin{bmatrix} -v_1 \\ -v_2 \end{bmatrix}

一个数乘以一个向量,仍然是一个向量。一个负数乘以一个向量会改变向量的方向(箭头朝向反方向)

标量乘法(英语:scalar multiplication)是线性代数中向量空间的一种基本运算(更广义的,是抽象代数的一个模)。在直觉上,将一个实数向量和一个正的实数进行标量乘法,也就是将其长度乘以此标量,方向不变。标量一词也从此用法而来:可将向量缩放的量。标量乘法是将标量和向量相乘,结果得到一向量,和内积将两向量相乘,得到一标量不同。

注意:v-\bm{v}v\bm{v} 的总和(sum)是零向量,以粗体0\bm{0}表示。

线性代数就是建立在v+w\bm{v} + \bm{w}cvc\bm{v}dwd\bm{w}的运算之上的。----向量加法和标量乘法

线性组合

我们现在结合向量加法与标量乘法产生 v\bm{v}w\bm{w}“线性组合” 。用 ccv\bm{v} 以及 ddw\bm{w},然后相加得到 cv+dwc\bm{v}+d\bm{w}

cv 与 dw 的总和是 线性组合 cv+dw c\bm{v} \text{ 与 }d\bm{w} \text{ 的总和是} \quad \colorbox{white}{ $\text{线性组合 }c\bm{v}+d\bm{w}$ }

四种特殊的线性组合是:和,差,零,标量乘积cvc\bm{v}

  • 1v+1w=1\bm{v} + 1\bm{w} = 向量的和,如图1.1a
  • 1v1w=1\bm{v} - 1\bm{w} = 向量的差,如图1.1b
  • 0v0w=00\bm{v} - 0\bm{w} = \bm{0} 零向量
  • cv+0w=cvc\bm{v} + 0\bm{w} = c\bm{v} 沿着v\bm{v}方向的向量cvc\bm{v}

图1.1

向量 v 表示法两个数字(0,0)出发的箭头平面上的点\text{向量 }\bm{v}\text{ 表示法} \qquad \colorbox{white}{$\text{两个数字}$} \quad \colorbox{white}{由$(0,0)$出发的箭头} \quad \colorbox{white}{平面上的点}

向量 v=(v1,v2)\bm{v} = (v_1, v_2)v\bm{v} 的分量就是点的坐标: x=v1x = v_1y=v2y = v_2。向量从(0,0)(0, 0)出发,箭头在点(v1,v2)(v_1, v_2)结束。

三维向量

三维向量v\bm{v}有3个分量 (v1,v2,v3)(v_1, v_2, v_3),对应三维空间中的一个箭头。通常箭头由原点出发,原点是 xyzxyz 轴的交点,坐标为(0,0,0)(0, 0, 0),箭头终点的坐标是 v1,v2,v3v_1, v_2, v_3列向量, 原点出发的箭头与箭头的终点,这三者之间有着完美的适配。

There is a perfect match between the column vector and the arrow from the origin and the point where the arrow ends.

origin:是原点的意思

From now onv=[111]is also written asv=(1,1,1)\textbf{From now on} \quad \bm{v}=\begin{bmatrix}1\\1\\-1\end{bmatrix} \quad \textbf{is also written as} \quad \bm{v}=(1,1,-1)

v=(1,1,1)\bm{v}=(1,1,-1) 并不是一个行向量,而是一个列向量。与行向量[1,1,1][1,1,-1]是不同的。1×31 \times 3 的行向量是 3×13 \times 1 的列向量v\bm{v}“转置”(transpose)。

二维平面向量的线性组合的计算规则,同样可以应用到三维空间向量。

cv+dw=c[111]+d[231]=[c+2dc+3dc+d]c\bm{v}+d\bm{w} = c \begin{bmatrix} 1 \\ 1 \\ -1 \end{bmatrix} + d \begin{bmatrix} 2 \\ 3 \\ 1 \end{bmatrix} = \begin{bmatrix} c + 2d \\ c + 3d \\ -c + d \end{bmatrix}

由此,此线性组合的计算规则可以应用的nn维向量。

cv+dw=c[v1v2vn]+d[w1w2wn]=[cv1cv2cvn]+[dw1dw2dwn]=[cv1+dw1cv2+dw2cvn+dwn]c\bm{v}+d\bm{w} = c \begin{bmatrix} v_1 \\ v_2 \\ \dots \\ v_n \end{bmatrix} + d \begin{bmatrix} w_1 \\ w_2 \\ \dots \\ w_n \end{bmatrix} = \begin{bmatrix} c\sdot v_1 \\ c\sdot v_2 \\ \dots \\ c\sdot v_n \end{bmatrix} + \begin{bmatrix} d \sdot w_1 \\ d \sdot w_2 \\ \dots \\ d \sdot w_n \end{bmatrix} = \begin{bmatrix} c\sdot v_1 + d \sdot w_1 \\ c \sdot v_2 + d \sdot w_2 \\ \dots \\ c \sdot v_n + d \sdot w_n \end{bmatrix}

重要问题

对于三个向量,线性组合是cu+dv+ewc\bm{u}+d\bm{v}+e\bm{w}。允许每个(任意) ccddee,假设 u,v,w\bm{u}, \bm{v}, \bm{w} 是三维空间中的向量:

  1. 所有 cuc\bm{u} 的组合,图形是什么?
  2. 所有 cu+dvc\bm{u} + d\bm{v} 的组合,图形是什么?
  3. 所有 cu+dv+ewc\bm{u} + d\bm{v} + e\bm{w} 的组合,图形是什么?

上述的答案与特定向量u,v,w\bm{u}, \bm{v}, \bm{w}有关,如果他们都是零向量,所有的线性组合都是零。如果他们是典型的非零向量。这里有三种答案。

  1. 所有 cuc\bm{u} 的组合形成一条通过(0,0,0)(0, 0, 0)的直线。
  2. 所有 cu+dvc\bm{u} + d\bm{v} 的组合形成一个通过(0,0,0)(0, 0, 0)的平面。
  3. 所有 cu+dv+ewc\bm{u} + d\bm{v} + e\bm{w} 的组合形成三维空间。

一条直线上的所有 cuc\bm{u} 加到另一条直线上的所有 dvd\bm{v} 会形成图 1.3 的平面。

要点回顾

  1. 二维空间的向量 v\bm{v} 具有两个分量 v1v1v2v2
  2. v+w=(v1+w1,v2+w2)\bm{v} + \bm{w} = (v1 + w1, v2 + w2)cv=(cv1,cv2)c\bm{v} = (cv1, cv2),每次计算一个分量。
  3. 三个向量 u,v,w\bm{u, v, w} 的线性组合是 cu+dv+ewc\bm{u} + d\bm{v} + e\bm{w}
  4. 选取所有 u\bm{u} 或是 u\bm{u}v\bm{v} 或是 u\bm{u}v\bm{v}w\bm{w} 的线性组合,在三维空间中,这些组合典型的形成一条直线或是一个平面或是整个空间 R3\mathbf{R}^3

1.2 长度与点积

1. v\bm{v}w\bm{w}的点积为:

vw=[v1v2vn][w1w2wn]=i=1nviwi=(v1w1)+(v2w2)++(vnwn)\bm{v} \sdot \bm{w} = \begin{bmatrix} v_1 \\ v_2 \\ \dots \\ v_n \end{bmatrix} \sdot \begin{bmatrix} w_1 \\ w_2 \\ \dots \\ w_n \end{bmatrix} = \sum_{i=1}^n v_i \sdot w_i = (v_1 \sdot w_1) + (v_2 \sdot w_2) + \dots + (v_n \sdot w_n)

点积具有交换律vw=wv\bm{v} \sdot \bm{w} = \bm{w} \sdot \bm{v}

2. 向量正交(垂直)

vw=0,则这两个向量垂直\bm{v} \sdot \bm{w} = 0\text{,则这两个向量垂直}

3. 向量vv的长度为:(我们使用v\parallel \bm{v} \parallel 来表示向量长度)

v=vv=v12+v22++vn2\parallel \bm{v} \parallel = \sqrt{\bm{v} \sdot \bm{v}} = \sqrt{v_1^2 + v_2^2 +\dots + v_n^2}

注意:vvv\sqrt{\bm{v} \sdot \bm{v}} \ne \bm{v},因为vv\sqrt{\bm{v} \sdot \bm{v}}是一个数,而v\bm{v}是一个向量。v0\parallel \bm{v} \parallel \ge 0

4. 向量单位化

向量单位化是将向量的长度变为1,而方向不变。

u=vvu的长度为1,u=1\bm{u} = \frac{\bm{v}}{\parallel \bm{v} \parallel} \quad \text{则$\bm{u}$的长度为1,} \parallel \bm{u} \parallel = 1

长度为1的向量又叫单位向量。证明过程见下文。

5. 向量的夹角

v\bm{v}w\bm{w}之间的角度有 cosθ=vwvw\cos{\theta} = \displaystyle\frac{\bm{v} \sdot \bm{w}}{\parallel \bm{v} \parallel \parallel \bm{w} \parallel}

vw=0\bm{v} \sdot \bm{w} = 0时,v\bm{v}w\bm{w}之间的角度有 cosθ=0\cos{\theta} =0,也即v\bm{v}w\bm{w}垂直

6. 两个向量点积与长度的不等式

cosθ1,因此有vwvw|\cos{\theta}| \le 1, \quad \text{因此有} |\bm{v} \sdot \bm{w}| \le \parallel \bm{v} \parallel\parallel \bm{w} \parallel

证明: 这里简单证明一下向量单位化的公式,即vv=1 \displaystyle\frac{\bm{v}}{\parallel \bm{v} \parallel} = 1

Solution

u=vv\displaystyle\bm{u} = \frac{\bm{v}}{\parallel \bm{v} \parallel},则有

u=vv=vvvv=vvvvvv=vvvv2=vvvv=1\displaystyle \begin{align} \parallel \bm{u} \parallel &= \begin{Vmatrix}\displaystyle \frac{\bm{v}}{\parallel \bm{v} \parallel} \end{Vmatrix} = \sqrt{\displaystyle\frac{\bm{v}}{\parallel \bm{v} \parallel} \sdot \frac{\bm{v}}{\parallel \bm{v} \parallel}} = \sqrt{\displaystyle\frac{\bm{v}}{\sqrt{\bm{v} \sdot \bm{v}}} \sdot \frac{\bm{v}}{\sqrt{\bm{v} \sdot \bm{v}}}} \\ &= \sqrt{\displaystyle\frac{\bm{v} \sdot \bm{v}}{\sqrt{\bm{v} \sdot \bm{v}}^2}} = \frac{ \sqrt{\bm{v} \sdot \bm{v} }}{\sqrt{\bm{v} \sdot \bm{v}}} \\ &= 1 \end{align}

附一个实际的例子

v=(1,3,2)\bm{v} = (1,3,2)v=1+9+4=14\parallel \bm{v} \parallel = \sqrt{1+9+4} = \sqrt{14}

u=vv=114[132]=[114314214] \bm{u} = \frac{\bm{v}}{\parallel \bm{v} \parallel} = \frac{1}{\sqrt{14}} \sdot \begin{bmatrix} 1 \\ 3 \\ 2 \end{bmatrix} = \begin{bmatrix} \displaystyle\frac{1}{\sqrt{14}} \\ \displaystyle\frac{3}{\sqrt{14}} \\ \displaystyle\frac{2}{\sqrt{14}} \end{bmatrix}u=(114)2+(314)2+(214)2=114+914+414=1=1\parallel \bm{u} \parallel = \sqrt{ (\frac{1}{\sqrt{14}})^2 + (\frac{3}{\sqrt{14}})^2 + (\frac{2}{\sqrt{14}})^2 } = \sqrt{\frac{1}{14} + \frac{9}{14} + \frac{4}{14}} = \sqrt{1} = 1

长度与点积

DEFINITION 单位向量

单位向量u\bm{u}是长度为 11 的向量,uu=1\bm{u}\sdot\bm{u}=1

单位化向量的方向

单位向量 u=v/v\bm{u} = \bm{v}/\parallel \bm{v} \parallel 是在v\bm{v}方向的单位向量。

1.3 矩阵