矩阵微分
矩阵微分
矩阵对于数量变量的微分
运算法则
数量函数对于向量/矩阵的微分
$f(x)=f(x_1,x_2,\cdots,x_n),\;x=[x_1,x_2,\cdots,x_n]^T$
定义为梯度:$grad[f(x)]= \bigtriangledown f(x)$
向量函数对于向量的微分
$a(x)=[a_1(x)\;a_2(x)\;\cdots\;a_m(x)]^T,\;x=[x_1\;x_2\;\cdots x_n]^T$
注:$a_i(x)$是关于 $x_1,x_2,\cdots,x_n$ 的函数,(2)中的矩阵称为雅克比矩阵
矩阵函数对于向量的微分
对 $x=[x_1\;x_2\;\cdots x_n]$ 求微分
对 $x=[x_1\;x_2\;\cdots x_n]^T$ 求微分
对一个变量 $x_t$ 微分
复合函数微分
$f=f(Y),Y=Y(x)$
$f=f(X,Y),Y=Y(x)$
求导法则:
导数与微分的联系(迹技巧):
矩阵形式
向量形式
函数对矩阵
若标量函数f是矩阵X经加减乘法、逆、行列式、逐元素函数等运算构成,则使用相应的运算法则对f求微分,再使用迹技巧给df套上迹并将其它项交换至dX左侧,对照导数与微分的联系,即能得到导数
特别地,若矩阵退化为向量,对照导数与微分的联系
先对特征式求导,再用迹技巧求微分
矩阵对矩阵
参考: