1. 核心定义:它是什么?
简单来说,矩阵的二次型是一个函数,它接受一个向量作为输入,然后输出一个标量(一个数)。这个函数由一个固定的方阵
其数学表达式为:
其中:
是一个列向量,例如 。 是一个 的方阵。 是 的转置,即一个行向量 。
一句话概括:二次型就是将一个向量“夹”在一个矩阵的两侧进行运算,最终得到一个标量的过程。
2. “二次型”这个名字的由来
为什么叫“二次”型?我们来看一个具体的例子。
假设
我们来计算
观察最终得到的这个多项式:
它的每一个项(
3. 与对称矩阵的关系(非常重要)
在上面的例子中,我们看到混合项的系数是
如果有一个非对称矩阵
现在我们看另一个对称矩阵
结论:非对称矩阵
正因为如此,在讨论二次型时,我们通常只考虑对称矩阵。因为任何非对称矩阵的二次型都可以由一个唯一的对称矩阵来表示,这样可以大大简化理论和计算。从现在开始,我们默认二次型中的矩阵
对于对称矩阵
这里,对角线元素
4. 几何意义:二次型代表什么?
二次型的几何意义非常直观。方程
-
如果
是单位矩阵 :
。这是一个圆。 -
如果
是对角矩阵 (且 ):
。这是一个椭圆,其主轴沿着坐标轴方向。 -
如果
是一个通用的对称矩阵:
定义的图形仍然是二次曲线(如椭圆、双曲线),但它们的主轴方向是 的特征向量方向,轴的“拉伸”程度由 的特征值决定。
核心思想:二次型描述了一个空间中的“碗”状或“鞍”状的曲面。
5. 正定性:二次型的分类
二次型最重要的性质是它的符号。对于任何非零向量
类别 | 定义 (对所有 |
几何形状 (想象一个碗) | 关联的特征值 |
---|---|---|---|
正定 (Positive Definite) | 一个朝上开口的碗,最小值在原点 | 全部为正 ( |
|
负定 (Negative Definite) | 一个朝下开口的碗,最大值在原点 | 全部为负 ( |
|
半正定 (Positive Semidefinite) | 一个平底碗,可能有“零点”线/面 | 全部非负 ( |
|
半负定 (Negative Semidefinite) | 一个平顶碗,可能有“零点”线/面 | 全部非正 ( |
|
不定 (Indefinite) | 一个马鞍的形状 | 有正有负 |
6. 应用:为什么二次型如此重要?
- 最优化理论:在微积分中,函数的二阶导数(Hessian 矩阵)决定了一个临界点是局部最小值、最大值还是鞍点。Hessian 矩阵的正定性就是通过其二次型来判断的。正定意味着局部最小值。
- 物理学:动能、势能等很多物理量都以二次型的形式出现。例如,一个系统的势能必须是正定的,以保证其稳定性。
- 机器学习与统计学:
- 协方差矩阵:它是一个半正定矩阵,其二次型与数据的方差有关。
- 核方法 (Kernel Methods):在支持向量机 (SVM) 等算法中,核矩阵必须是半正定的,这保证了映射后的空间距离是有效的。
- 距离定义:
(当 正定时)可以用来定义一种广义的距离,称为马氏距离的平方。
总而言之,二次型是连接矩阵代数、多项式函数和几何三者的桥梁,是理解许多高级应用的关键。