矩阵微分

矩阵微分

矩阵对于数量变量的微分

运算法则

数量函数对于向量/矩阵的微分

$f(x)=f(x_1,x_2,\cdots,x_n),\;x=[x_1,x_2,\cdots,x_n]^T$

定义为梯度:$grad[f(x)]= \bigtriangledown f(x)$

向量函数对于向量的微分

$a(x)=[a_1(x)\;a_2(x)\;\cdots\;a_m(x)]^T,\;x=[x_1\;x_2\;\cdots x_n]^T$

注:$a_i(x)$是关于 $x_1,x_2,\cdots,x_n$ 的函数,(2)中的矩阵称为雅克比矩阵

矩阵函数对于向量的微分

对 $x=[x_1\;x_2\;\cdots x_n]$ 求微分

对 $x=[x_1\;x_2\;\cdots x_n]^T$ 求微分

对一个变量 $x_t$ 微分

复合函数微分

$f=f(Y),Y=Y(x)$

$f=f(X,Y),Y=Y(x)$

求导法则:

导数与微分的联系(迹技巧):

矩阵形式

向量形式

函数对矩阵

若标量函数f是矩阵X经加减乘法、逆、行列式、逐元素函数等运算构成,则使用相应的运算法则对f求微分,再使用迹技巧给df套上迹并将其它项交换至dX左侧,对照导数与微分的联系,即能得到导数

特别地,若矩阵退化为向量,对照导数与微分的联系

先对特征式求导,再用迹技巧求微分

矩阵对矩阵


参考: