专题讨论:子空间之间的投影
我们已经学习了如何将一个向量投影到子空间上。现在,我们来探讨一个更宏观的问题:如果我们将一个子空间 V 投影到另一个子空间 W 上,结果会是什么?
“投影一个空间 V” 的意思是:将 V 中的每一个向量都投影到 W 上,然后将所有这些投影结果集合在一起,形成一个新的空间,记为 π_W(V)。
这个问题的答案取决于两个子空间 V 和 W 的维度关系。
情况一:高维子空间投影到低维子空间 (最常见)
这是投影在数据科学和机器学习中最核心的应用,例如维度约减。
-
前提:
dim(V) > dim(W)。 -
直观想象: 将整个三维空间 (
V=R³) 投影到地面(一个二维平面W)上。 -
结论: 投影结果会“填满”并覆盖整个低维子空间
W。 -
原因:
- 结果的有界性: 根据投影的定义,任何向量的投影结果都必须落在目标子空间
W内。因此,π_W(V)最多只能是W。 - 结果的完备性: 因为
V的维度更高,它包含了比W“更丰富”的方向。对于W中的任何一个点w,我们总能在更高维的V中找到一个(通常是无穷多个)源向量v,使得v在W上的投影恰好是w。没有任何W中的点会被“遗漏”。
- 结果的有界性: 根据投影的定义,任何向量的投影结果都必须落在目标子空间
-
信息变化: 在这个过程中,垂直于
W的所有信息都被“压扁”了。这是一个信息有损压缩的过程,投影后的维度等于低维子空间的维度。 -
具体例子:
- 将整个三维空间
V = R³投影到xy平面W上。 R³中任意一点(x, y, z)的投影是(x, y, 0)。- 所有这些投影点的集合,构成了整个
xy平面。 π_W(V) = W,投影后的维度为dim(W) = 2。
- 将整个三维空间
情况二:低维子空间投影到高维子空间
这种情况在理论上很有启发性,它帮助我们理解投影的边界条件。
-
前提:
dim(V) < dim(W),并且V是W的一个子空间,即V ⊆ W。 -
直观想象: 将地面上的一条直线 (
V) “投影”到整个三维空间 (W=R³) 中。 -
结论: 投影结果就是低维子空间
V本身。 -
原因:
- 根据投影最根本的几何定义:
π_W(v)是W中离v最近的那个点。 - 既然
V整个都在W里面,那么对于任何一个取自V的向量v,它本身就已经在W中了。 - 在
W中离v最近的点,显然就是v自己(距离为0)。 - 因此,
V中的每一个向量在投影后都保持不变。
- 根据投影最根本的几何定义:
-
信息变化: 在这个过程中,没有任何信息发生改变。这是一个信息无损的操作,投影后的维度等于原始低维子空间的维度。
-
具体例子:
- 将
x轴 (V = span{[1,0,0]ᵀ}) 投影到整个三维空间W = R³上。 x轴上任意一点(x, 0, 0)在R³中的投影是什么?就是它自己。- 所有这些投影点的集合,构成的仍然是
x轴本身。 π_W(V) = V,投影后的维度为dim(V) = 1。
- 将
总结与对比
| 投影方向 | 原始空间 V |
目标空间 W |
投影结果 π_W(V) |
结果维度 | 信息变化 |
|---|---|---|---|---|---|
| 高维 → 低维 | dim(V) > dim(W) |
W |
W |
dim(W) |
有损压缩 |
| 低维 → 高维 | dim(V) < dim(W) |
W (且V⊆W) |
V |
dim(V) |
无损保留 |
这两个对偶的场景共同揭示了投影的本质:投影操作的结果永远不会超过目标子空间 W 的范围和维度。它要么将一个“更大”的空间压缩并填满 W,要么将一个“更小”的空间原封不动地保留在 W 中。