矩阵微分

矩阵微分

矩阵对于数量变量的微分

A=[aij(t)]m×ndAdt=[daij(t)dt]m×n

运算法则

An,(1)ddtetA=AetA=etAA(2)ddtcos(tA)=Asin(tA)=sin(tA)A(3)ddtsin(tA)=Acos(tA)=cos(tA)A

数量函数对于向量/矩阵的微分

f(x)=f(x1,x2,,xn),x=[x1,x2,,xn]T

df(x)dx=[fx1fx2fxn]T
df(x)dxT=[fx1fx2fxn]

定义为梯度:grad[f(x)]=f(x)

向量函数对于向量的微分

a(x)=[a1(x)a2(x)am(x)]T,x=[x1x2xn]T

da(x)dxT=[aixj]m×n
daT(x)dx=[ajxi]m×n

注:ai(x)是关于 x1,x2,,xn 的函数,(2)中的矩阵称为雅克比矩阵

矩阵函数对于向量的微分

A(x)=[a11(x)a12(x)a1l(x)a21(x)a22(x)a2l(x)am1(x)am2(x)aml(x)]m×l

x=[x1x2xn] 求微分

dA(x)dx=[A(x)x1A(x)x2A(x)xn]nm×l

x=[x1x2xn]T 求微分

dA(x)dx=[A(x)x1A(x)x2A(x)xn]n×ln

对一个变量 xt 微分

A(x)xt=[aij(x)xt]m×l

复合函数微分

f=f(Y),Y=Y(x)

dfdX=dYTdXdfdYdfdXT=dfdYTdYdXT

f=f(X,Y),Y=Y(x)

dfdX=fX+dYTdXfYdfdXT=fXT+dfdYTYXT

求导法则:

(A1)=A1AA1

导数与微分的联系(迹技巧):

矩阵形式

df=tr(fXTdX)

向量形式

df=tr(fxTdx)

函数对矩阵

若标量函数f是矩阵X经加减乘法、逆、行列式、逐元素函数等运算构成,则使用相应的运算法则对f求微分,再使用迹技巧给df套上迹并将其它项交换至dX左侧,对照导数与微分的联系,即能得到导数

特别地,若矩阵退化为向量,对照导数与微分的联系

先对特征式求导,再用迹技巧求微分

矩阵对矩阵


参考:

未找到相关的 Issues 进行评论

请联系 @acptek 初始化创建