线性代数高级--二次型--特征值与特征向量--特征值分解--多元函数的泰勒展开

简介: 线性代数高级--二次型--特征值与特征向量--特征值分解--多元函数的泰勒展开

目录


二次型


概念


示例  


性质和特点


特征值与特征向量


概念


示例


注意


性质和特点


特征值分解


注意


多元函数的泰勒展开


回顾一元函数泰勒展开


多元函数的泰勒展开




二次型


概念


二次型是一个关于向量的二次多项式,通常用矩阵表示。


考虑一个n维向量x = [x₁, x₂, ..., xn],对应的二次型可以表示为:


Q(x) = xᵀA𝑥


其中,xᵀ表示向量x的转置,A是一个n×n的实对称矩阵。

32.png

示例  


二次型可以使用向量与矩阵相乘的形式表示

33.png

为了研究方便,二次型使用x^T^Ax的形式表示,其中,中间的矩阵A为对称矩阵

34.png

性质和特点


1.对称性:如果系数矩阵A是对称矩阵,即Aᵀ = A,那么二次型Q(x)是对称的,即Q(x) = Q(xᵀ)。


2.标准形式:通过合适的线性变换,可以将任何二次型转化为标准形式。标准形式是指二次型只包含平方项,而没有交叉项和常数项。通过正交变换可以实现这样的转化。


3.矩阵特征值二次型的矩阵A的特征值与二次型的正负定性相关。如果A的所有特征值都大于零,则二次型是正定的;如果所有特征值都小于零,则二次型是负定的;如果特征值既有正又有负,则二次型是不定的。


4.几何意义:二次型在几何上表示为一个二次曲面或椭圆抛物面。二次型的正负定性与曲面的凸凹性和极值点的性质相关。


5.应用:二次型在优化问题、矩阵理论、统计学、物理学等领域中有广泛的应用。它们在最小二乘问题、二次规划、协方差矩阵分析、精确度矩阵等方面发挥重要作用。


特征值与特征向量


概念


设A是n阶方阵,如果数λ和n维非零向量x使关系式Ax = λx成立,那么,λ称为方阵A

的特征值;非零向量x称为A的属于特征值λ的特征向量。


示例

35.png则数3为方阵[4 -2,1 1]的特征值;非零向量(2,1)为方阵[4 -2,1 1]的属于特征值3的特征向量。


注意


  • 特征值与特征向量是针对方阵而言的

  • 特征向量是非零向量

  • 同一个特征值λ对应无穷多个特征向量


性质和特点


1.特征向量:特征向量v是与特征值λ关联的非零向量。它表示在矩阵A的作用下,保持在该方向上只发生伸缩变化而不改变方向。


2.特征值:特征值λ是与特征向量v关联的标量。它表示特征向量v在矩阵A的作用下发生的伸缩比例。特征值可以是实数或复数。


3.特征空间:特征空间是由所有与特定特征值关联的特征向量所张成的向量空间。对于特定特征值λ,特征空间包含所有满足A·v = λ·v的特征向量v。


4.特征分解:特征分解是将一个矩阵分解为特征向量和特征值的形式。对于一个可对角化的矩阵,可以表示为 A = P·D·P⁻¹,其中P是由特征向量组成的矩阵,D是对角矩阵,其对角线上的元素是矩阵A的特征值。


5.特征值与矩阵性质:特征值与矩阵的很多性质和行为密切相关。例如,特征值的个数等于矩阵的秩;矩阵的特征值之和等于其主对角线上元素之和(迹);特征值的乘积等于矩阵的行列式。


特征值分解


特征值分解是将一个矩阵分解成下面的形式:

36.png


其中Q是这个矩阵A的特征向量组成的矩阵,Σ是一个对角矩阵(只有对角线上有非0元


素的矩阵称为对角矩阵),对角线的值是由矩阵所有特征值构成的。


其中,Q是这个矩阵A的特征向量组成的矩阵,Σ是一个对角矩阵,每一个对角线元素


就是一个特征值,里面的特征值是由大到小排列的,这些特征值所对应的特征向量就是描述


这个矩阵变化方向(从主要的变化到次要的变化排列)。也就是说矩阵A的信息可以由其特


征值和特征向量表示。


对于矩阵为高维的情况下,那么这个矩阵就是高维空间下的一个线性变换。可以想象,


这个变换也同样有很多的变换方向,我们通过特征值分解得到的前N个特征向量,那么就对


应了这个矩阵最主要的N个变化方向。我们利用这前N个变化方向,就可以近似这个矩阵


(变换)。


注意


  • 特征值分解可以得到特征值与特征向量

  • 特征值表示的是这个特征到底有多重要,而特征向量表示这个特征是什么

  • 特征值分解是针对于方阵而言


多元函数的泰勒展开


回顾一元函数泰勒展开


函数 f(x)在含 x~k~ 的某个开区间 (a,b)内具有直到 n 阶导数,则对任意的 x∈(a,b)有

37.png

其中,x~0~是泰勒公式的展开点,R~n~(x)是泰勒公式的余项。


展开二项的形式为:

38.png

多元函数的泰勒展开


f(x~k~)是标量,而且是个常数;不过注意(x-x~k~)是个向量,然后T转置这里是把梯度和

(x-x~k~)做内积;二次项的内积,是和 hessian 矩阵做内积。

39.png

多元函数泰勒展开是非常有用的,例如在推导梯度下降法,牛顿法的时候会用的到的。

相关文章
|
机器学习/深度学习 存储 vr&ar
线性代数高级--矩阵的秩--SVD分解定义--SVD分解的应用
线性代数高级--矩阵的秩--SVD分解定义--SVD分解的应用
|
5月前
|
机器学习/深度学习 数据处理 Python
深入理解双变量(二元)正态投影:理论基础、直观解释与应用实例
本文探讨了统计学与机器学习中的二元投影技术,它基于二元正态分布,用于预测一个变量在给定另一变量值时的期望值。文章分为三部分:首先介绍了二元正态投影的基本公式及其在回归中的应用;接着通过直观解释和模拟展示了不同相关性下变量间的关系;最后运用投影公式推导出线性回归的参数估计,并通过实例说明其在预测房屋价格等场景中的应用。附录中详细推导了二元线性投影的过程。二元投影作为一种强大工具,在数据分析中帮助简化复杂问题并揭示数据背后的规律。
75 1
深入理解双变量(二元)正态投影:理论基础、直观解释与应用实例
|
7月前
线性代数——(期末突击)矩阵(上)-概念篇(矩阵的定义、矩阵的运算、特殊矩阵、初等变换)
线性代数——(期末突击)矩阵(上)-概念篇(矩阵的定义、矩阵的运算、特殊矩阵、初等变换)
159 7
|
存储 Java
数论——因子组合
数论——因子组合
线性代数(七)对称矩阵和二次型
线性代数(七)对称矩阵和二次型
170 0
|
机器学习/深度学习 人工智能
线性代数基础--矩阵
线性代数基础--矩阵
1544 0
|
移动开发
线性代数基础--向量
线性代数基础--向量
一元函数微分学中导数--定义--意义--基本公式--运算法则
一元函数微分学中导数--定义--意义--基本公式--运算法则
|
移动开发 JavaScript 算法
数学基础之——熵与散度的灵魂摆渡(解析大全)(二)
数学基础之——熵与散度的灵魂摆渡(解析大全)(二)
356 0