1. 核心定义:它是什么?

简单来说,矩阵的二次型是一个函数,它接受一个向量作为输入,然后输出一个标量(一个数)。这个函数由一个固定的方阵 A 和一个变量向量 x 定义。

其数学表达式为:

Q(x)=xTAx

其中:

一句话概括:二次型就是将一个向量“夹”在一个矩阵的两侧进行运算,最终得到一个标量的过程。

2. “二次型”这个名字的由来

为什么叫“二次”型?我们来看一个具体的例子。

假设 x=(x1x2) 并且 A=(abcd)

我们来计算 xTAx

xTAx=(x1x2)(abcd)(x1x2)=(x1x2)(ax1+bx2cx1+dx2)=x1(ax1+bx2)+x2(cx1+dx2)=ax12+bx1x2+cx2x1+dx22=ax12+(b+c)x1x2+dx22

观察最终得到的这个多项式:ax12+(b+c)x1x2+dx22
它的每一个项x12,x1x2,x22)的变量次数之和都是2。这就是它被称为二次型(Quadratic Form)的原因。

3. 与对称矩阵的关系(非常重要)

在上面的例子中,我们看到混合项的系数是 (b+c)。现在思考一个问题:
如果有一个非对称矩阵 A=(1234),它的二次型是:
Q(x)=x12+(2+3)x1x2+4x22=x12+5x1x2+4x22

现在我们看另一个对称矩阵 Asym=(12.52.54),它的二次型是:
Qsym(x)=x12+(2.5+2.5)x1x2+4x22=x12+5x1x2+4x22

结论:非对称矩阵 A 和它的“对称化”版本 Asym=12(A+AT) 产生的二次型是完全相同的。

正因为如此,在讨论二次型时,我们通常只考虑对称矩阵。因为任何非对称矩阵的二次型都可以由一个唯一的对称矩阵来表示,这样可以大大简化理论和计算。从现在开始,我们默认二次型中的矩阵 A 是对称的。

对于对称矩阵 A=(abbd),二次型就有一个更简洁的形式:

Q(x)=ax12+2bx1x2+dx22

这里,对角线元素 a,d 对应平方项的系数,非对角线元素 b 对应混合项系数的一半。

4. 几何意义:二次型代表什么?

二次型的几何意义非常直观。方程 xTAx=c(其中 c 是一个常数)在二维或三维空间中定义了二次曲线或二次曲面

核心思想:二次型描述了一个空间中的“碗”状或“鞍”状的曲面。

5. 正定性:二次型的分类

二次型最重要的性质是它的符号。对于任何非零向量 x0xTAx 的值是正、是负、还是都有可能?这引出了对矩阵(及其二次型)的分类,即正定性 (Definiteness)

类别 定义 (对所有 x0) 几何形状 (想象一个碗) 关联的特征值
正定 (Positive Definite) xTAx>0 一个朝上开口的碗,最小值在原点 全部为正 (>0)
负定 (Negative Definite) xTAx<0 一个朝下开口的碗,最大值在原点 全部为负 (<0)
半正定 (Positive Semidefinite) xTAx0 一个平底碗,可能有“零点”线/面 全部非负 (0)
半负定 (Negative Semidefinite) xTAx0 一个平顶碗,可能有“零点”线/面 全部非正 (0)
不定 (Indefinite) xTAx 的值有正有负 一个马鞍的形状 有正有负

6. 应用:为什么二次型如此重要?

总而言之,二次型是连接矩阵代数多项式函数几何三者的桥梁,是理解许多高级应用的关键。