データサイエンス時代で活躍する人材になるために

データサイエンス時代で活躍できる人材になるために

純粋数学から応用数学までデータサイエンスに関わる様々なことについて取り上げます!

確率母関数による二項分布の平均・分散の導出方法


二項分布の平均や分散を求める問題は,大学の試験だけでなく統計検定やE資格などにも出題される可能性があります.二項分布の平均や分散を定義に通りに求めようとすると, 計算がとても大変になりもっと簡単に求める方法はないの?と思うことがあります.

二項分布の平均・分散の導出方法は以下の3通りがあります.(他にもひょっとするとあるかもしれません)

  1. 平均や分散の定義にもとづいた導出
  2. モーメント母関数を用いた導出
  3. 確率母関数を用いた導出

今回は,確率母関数を用いた二項分布の平均・分散の導出方法をご紹介します!

確率母関数の定義とk次の階乗モーメント

整数値をとる確率変数X確率密度関数p(x)として,tを任意の実数とするときX確率母関数は以下で定義されます.
p(t)=E(t^X)=\sum_xt^xp(x)

確率母関数を用いることで,k次の階乗モーメントを定義することができます.
離散型確率分布の場合,k次の階乗モーメントを用いることでモーメントが求めやすくなることがよくあります.k次の階乗モーメントは以下のように表すことができます.
\left. \frac{d^kp(t)}{dt^k}\right|_{t=1}=E[X(X-1)\cdots(X-k+1)

導出方法はとても簡単です.まずk=1のときを考えると,

\begin{align*}
\frac{dp(t)}{dt}&=\frac{d}{dt}E[t^X]\\
&=E\left[\frac{d}{dt}t^X\right]\\
&=E[Xt^{X-1}]
\end{align*}
となります.
同様に考えると,
\frac{d^kp(t)}{dt^k}=E[X(X-1)\cdots(X-k+1)t^{X-k}]であるため,ここにt=1を代入すれば求めたい等式を得ることができます.

二項分布の平均の導出

nは整数,0< p <1, q=1-pとします.
このとき,二項分布の確率母関数は以下で表されます.

\begin{align*}
p(t)&=E[t^X]\\
&=\sum_{x=0}^{n}t^x{_nC_x}p^xq^{n-x}\\
&=\sum_{x=0}^{n}{_nC_x}( tp )^x q^{n-x}\\
&=(tp+q)^n
\end{align*}
平均E[X]は,k=1の階乗モーメント\left. E[X]=\frac{dp(t)}{dt}\right|_{t=1}で求めることができます.

\begin{align*}
\frac{dp(t)}{dt}&=np(tp+q)^{n-1} \\
&=np(tp+1-p)^{n-1} 
\end{align*}
したがって,
\left. E[X]=\frac{dp(t)}{dt}\right|_{t=1}=npを得ることができます.

二項分布の分散の導出

分散の定義より,

\begin{align*}
\mathrm{Var}[X]&=E[X^2]-[E]^2\\
&=E[X(X-1)]+E[X]-[E]^2
\end{align*}
です.E[X]はすでに求めているので,2次の階乗モーメントを用いてE[X(X-1)]さえ求めれば良いことがわかります.

\begin{align*}
\frac{d^2p(t)}{d^2t}&=n(n-1)p^2(tp+q)^{n-2} \\
\end{align*}
であるので2次の階乗モーメントは,

\begin{align*}
\left. E[X(X-1)]=\frac{d^2p(t)}{d^2t}\right|_{t=1}=n(n-1)p^2
\end{align*}
です.
したがって,分散は

\begin{align*}
&=E[X(X-1)]+E[X]-[E]^2\\
&=n(n-1)p^2 +np -(np)^2\\
&=np(1-p)\\
&=npq
\end{align*}
となります.

確率母関数に関しては以下の書籍が参考になります.

ではまた!