最小二乘解:为什么正规方程就是投影方程?
我们要证明:对于线性系统
这个证明可以从两个角度理解:一是纯粹的代数优化,二是更直观的几何投影。几何方法能让我们深刻理解为什么正规方程
几何视角证明:
1. 目标:最小化距离
我们的目标是找到一个
- 向量
是一个固定的点。 - 集合
是矩阵 的列空间 (Column Space),记为 Col(A)。它是一个由 的列向量张成的子空间。 - 所以,我们的问题等价于:在 Col(A) 这个子空间中,找到一个点,使得它离
最近。
2. 几何答案:正交投影
根据我们对正交投影的定义,子空间中离一个外部点最近的点,正是这个点在该子空间上的正交投影。
- 我们设这个最近点(也就是投影点)为
。 - 因为
在 Col(A) 中,所以一定存在一个唯一的 (因为A的列线性无关),使得: 这个 就是我们要找的最小二乘解。
3. 投影的核心性质:正交性
正交投影最关键的性质是:误差向量
- 这意味着,误差向量
必须与 Col(A) 的所有基向量都正交。 - Col(A) 的基向量就是矩阵
的列向量,记为 。 - 所以,我们必须满足以下正交条件:
4. 从几何正交性到正规方程
这
- ...
将这些行向量
这就是:
展开这个方程,我们就得到了:
看!我们从纯粹的几何投影思想出发,推导出了与代数优化方法完全相同的“正规方程”。
5. 求解正规方程
这一步与代数证明完全相同。
- A 的列是线性独立的(这是假设条件)。
- 定理: 如果矩阵
的列线性无关,那么矩阵 是可逆的。 - (证明过程:通过证明
的唯一解是 )
- (证明过程:通过证明
- 既然
存在,我们可以从左侧乘以它来求解 :
两种方法的联系与总结
- 代数优化方法通过求梯度为零,找到了一个驻点 (stationary point),并证明了这个驻点是最小值点。
- 几何投影方法通过“最近点”的直觉,利用正交性直接构造出了最优解必须满足的条件。
这两种方法殊途同-归,都得到了正规方程
它是一个数学声明,表达了“误差向量
因此,求解最小二乘问题,在几何上就是做一次正交投影,而在代数上就是解一个被称为正规方程的线性系统。伪逆公式
这个解
有解与无解对比
让我们来详细对比一下有解和无解两种情况下,最小二乘解(或者说它的公式)到底意味着什么。
我们将使用几何投影的视角,因为它最直观。
背景回顾
- 问题: 求解线性方程组
。 - 几何视角: 我们想找到一个对
的列向量的线性组合,使其恰好等于向量 。 - 核心空间: 矩阵
的列空间 Col(A),即由 的列向量张成的子空间。 - 最小二乘公式:
(假设 列满秩)。
情况一:当 有精确解时
这种情况在理论上很完美,但在实际数据问题中较少见。
1. 几何上发生了什么?
- “有精确解”意味着向量
本身就已经位于矩阵 的列空间 Col(A) 内部。 - 我们现在要问:在 Col(A) 中,离
最近的点是哪个点? - 答案: 既然
已经身处 Col(A) 之中,离它最近的点当然就是它自己! - 因此,
在 Col(A) 上的正交投影就是 本身:
2. 最小二乘公式会算出什么?
- 最小二乘法要我们求解新的方程
。 - 既然在这种情况下
,那么我们要解的方程就是: - 这正是我们一开始要解的原始方程!
- 所以,当我们把
代入那个复杂的最小二乘公式时,它计算出的解 ,就是原始方程的那个唯一的精确解 。
3. 误差是多少?
- 最小二乘法旨在最小化误差
。 - 既然我们找到了一个精确解
,使得 ,那么误差就是: - 误差为零,这与我们的预期完全相符。
总结 (有解时):
最小二乘法在这种情况下没有做任何“近似”。它只是通过一个看起来更复杂的公式,找到了那个本来就存在的精确解。投影操作
情况二:当 无解时 (最小二乘法的真正用武之地)
这种情况在处理带有噪声的真实数据时是常态。
1. 几何上发生了什么?
- “无解”意味着向量
位于矩阵 的列空间 Col(A) 的外部。它“飘”在了子空间的“上方”或“旁边”。 - 我们无法在 Col(A) 中找到任何一个点能精确等于
。 - 于是,我们寻找 Col(A) 中离
最近的点,也就是 在 Col(A) 上的正交投影 。 - 这个投影点
是我们能用 的列向量线性组合出来的、最接近 的“替代品”。
2. 最小二乘公式会算出什么?
- 最小二乘法让我们求解
。 - 这个方程一定有解,因为根据定义,
就在 Col(A) 中。 - 最小二乘公式计算出的
就是这个方程的解。这个 告诉我们:需要对 的列向量进行怎样的线性组合,才能得到那个最佳的近似点 。 这个解 不再是原始问题的精确解(因为它不存在),而是最优的近似解。
3. 误差是多少?
- 最小二乘解
使得误差 最小。 - 最小误差的值就是
到它的投影 之间的距离: - 这个误差向量
是垂直于整个 Col(A) 空间的。
总结 (无解时):
最小二乘法找到了一个近似解
核心对比
特性 | 当 |
当 |
---|---|---|
在 Col(A) 内部 | 在 Col(A) 外部 | |
投影 |
||
最小二乘解 |
是精确解 | 是最优近似解 |
最小误差 |
0 | 大于 0 (是 |
希望这个对比能让你彻底明白最小二乘解在两种情况下的不同含义!它是一个非常优雅的框架,统一了有解和无解两种情况的处理方式。