Triad sou.

行列のスカラー微分のメモ

$\mathbf{A}$, $\mathbf{B}$ について、スカラー $\theta$ で微分する場合を考える。
だたし、
\[
\mathbf{A}= \left\{ a_{ij} \right\}, \frac{\partial \mathbf{A}}{\partial \theta}= \left\{ \frac{\partial a_{ij}}{\partial \theta} \right\}
\] とし、$\mathbf{B}$ も同様に定義する。

行列積の微分

行列積 $\mathbf{A} \mathbf{B}$ が定義できる場合、
\[
\frac{\partial \mathbf{A}\mathbf{B}}{\partial \theta}= \frac{\partial \mathbf{A}}{\partial \theta}\mathbf{B} + \mathbf{A}\frac{\partial \mathbf{B}}{\partial \theta}
\]

逆行列微分

$\mathbf{A}$ が正方行列で逆行列が存在するならば、
\[
\frac{\partial \mathbf{A}^{-1}}{\partial \theta}= -\mathbf{A}^{-1} \frac{\partial \mathbf{A}}{\partial \theta} \mathbf{A}^{-1}
\]

逆行列微分の導出

\[
\begin{align*}
\frac{\partial \mathbf{A}\mathbf{A}^{-1}}{\partial \theta} &=
\frac{\partial \mathbf{I}}{\partial \theta} \\
\frac{\partial \mathbf{A}}{\partial \theta}\mathbf{A}^{-1} + \mathbf{A}\frac{\partial \mathbf{A}^{-1}}{\partial \theta} &=
\mathbf{0}\\
\mathbf{A}\frac{\partial \mathbf{A}^{-1}}{\partial \theta} &= -\frac{\partial \mathbf{A}}{\partial \theta}\mathbf{A}^{-1} \\
\frac{\partial \mathbf{A}^{-1}}{\partial \theta} &= -\mathbf{A}^{-1}\frac{\partial \mathbf{A}}{\partial \theta}\mathbf{A}^{-1}
\end{align*}
\]

正方行列 $\mathbf{A}$, $\mathbf{B}$ について、
\[
\begin{align*}
\frac{\partial \mathbf{A}^{-1}\mathbf{B}\mathbf{A}^{-1}}{\partial \theta} &=
\frac{\partial \mathbf{A}^{-1}}{\partial \theta}\mathbf{B}\mathbf{A}^{-1} + \mathbf{A}^{-1}\frac{\partial \mathbf{B}\mathbf{A}^{-1}}{\partial \theta} \\ &= -\mathbf{A}^{-1}\frac{\partial \mathbf{A}}{\partial \theta}\mathbf{A}^{-1}\mathbf{B}\mathbf{A}^{-1} + \mathbf{A}^{-1}\frac{\partial \mathbf{B}}{\partial \theta}\mathbf{A}^{-1} - \mathbf{A}^{-1}\mathbf{B}\mathbf{A}^{-1}\frac{\partial \mathbf{A}}{\partial \theta}\mathbf{A}^{-1} \\ &=
\mathbf{A}^{-1} \left( \frac{\partial \mathbf{B}}{\partial \theta} -\frac{\partial \mathbf{A}}{\partial \theta}\mathbf{A}^{-1}\mathbf{B} -\mathbf{B}\mathbf{A}^{-1}\frac{\partial \mathbf{A}}{\partial \theta} \right) \mathbf{A}^{-1}
\end{align*}
\]

$\mathbf{A}$ の要素が全て定数の場合、$\partial \mathbf{A} / \partial \theta = \mathbf{0}$ より $\mathbf{A}^{-1} (\partial \mathbf{B} / \partial \theta) \mathbf{A}^{-1}$。