Aritalab:Lecture/Basic/Probability Generating Function

From Metabolomics.JP
< Aritalab:Lecture | Basic
Revision as of 10:03, 7 August 2019 by Adm (Talk | contribs)

(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Jump to: navigation, search
Wiki Top Up one level レポートの書き方 Arita Laboratory

Contents

まとめ

確率母関数 G_X(z) が与えられたとき

  • 平均 E(X) = G_X'(1) \,
  • 分散 V(X) = G_X''(1) + G_X'(1) - G_X'(1)^2 \,
分布名 分布関数 母関数 平均 分散
一様分布 \frac{1}{n}\ \frac{1}{n} (1 + z + z^2 \cdots z^{n-1})\ \frac{n-1}{2}\ \frac{n^2 - 1}{12}\
ポアソン分布 e^{\lambda} \frac{\lambda^k}{k!}\ e^{\lambda (z-1)}\ \lambda\ \lambda\
指数分布 \lambda e^{- \lambda k}\ \frac{1}{1 - k/\lambda}\ 1 / \lambda\  2 / \lambda^2\

確率母関数

ある確率分布 Pr(X=k) の確率母関数 (probability generating function または pgf) を以下のように定義します。

\textstyle G_X(z) = \Sigma_{k=0}^{\infty}\mbox{Pr}(X=k)z^k

確率\mbox{Pr}(X=k)は全て正の値で k について全て足しあわせると 1 になります。

\textstyle G_X(1) 
= \Sigma_{k=0}^{\infty}\mbox{Pr}(X=k)z^k 
= \Sigma_{k=0}^{\infty}\mbox{Pr}(X=k) = 1

逆に係数が非負で G(1) = 1 であるようなべき級数 G(z) があれば、それは何らかの確率母関数といいます。

平均と分散

確率母関数を使うと平均と分散の計算が容易にできます。

\textstyle
\begin{align}
E(X) &= \Sigma_{k=0}^{\infty}k\mbox{Pr}(X=k) \\
&= \Sigma_{k=0}^{\infty}\mbox{Pr}(X=k) \cdot kz^{k-1} \bigg|_{z=1} \\
&= G_X'(1)
\end{align}

\textstyle
\begin{align}
E(X^2) &= \Sigma_{k=0}^{\infty}k^2\mbox{Pr}(X=k) \\
&= \Sigma_{k=0}^{\infty}\mbox{Pr}(X=k) \cdot \big( k(k-1) z^{k-2} + kz^{k-1} \big) \bigg|_{z=1} \\
&= G_X''(1) + G_X'(1)
\end{align}

したがって

\textstyle
V(X) = G_X''(1) + G_X'(1) - G_X'(1)^2

一様分布

n次の一様分布 (uniform distribution) とは確率変数が{0, 1, \ldots, n-1}の値を確率1/nでとるものです。

\textstyle
\mbox{Pr}(X=k) = 1/n

確率母関数は以下の等比級数になります。 \textstyle
\mbox{U}_n(z) = \frac{1}{n}(1 + z + \cdots + z^{n-1}) = \frac{1}{n}\frac{1-z^n}{1-z}

この式は1-zを分母に含んでしまうため、\mbox{U}_n'(1)\mbox{U}_n''(1)を求める際に不都合です。そこでテイラーの定理を応用します。


G(1+t) = G(1) + \frac{G'(1)}{1!} t + \frac{G''(1)}{2!} t^2 + \frac{G'''(1)}{3!} t^3 + \cdots

この係数、つまりG(z)の導関数を以下の式と見比べます。


\begin{align}
\mbox{U}_n(1+t) &= \frac{1}{n}\frac{(1+t)^n - 1}{t} \\
&= \frac{1}{n}\binom{n}{1} + \frac{1}{n}\binom{n}{2} t + \frac{1}{n}\binom{n}{3} t^2 + \cdots + \frac{1}{n}\binom{n}{t} t^{n-1}
\end{align}

ここから

\textstyle
\mbox{U}_n(1) = 1 \quad
\mbox{U}_n'(1) = \frac{n-1}{2} \quad
\mbox{U}_n''(1) = \frac{(n-1)(n-2)}{3} \quad

平均と分散は

\textstyle
\mbox{U}_n'(1) = \frac{n-1}{2} 
\quad
\mbox{U}_n''(1) + \mbox{U}_n'(1) - \mbox{U}_n'(1)^2 = \frac{n^2-1}{12}.

連続分布と積率母関数

積率母関数の説明を入れる。


ポアソン分布

ポアソン分布とは単位時間中に平均 \lambda 回発生する事象がちょうど k 回発生する確率をあらわしています。


\mbox{Pr}(X=k) = e^{-\lambda}\frac{\lambda^k}{k!}

離散型の確率母関数では


G(z) = \sum_{k=0}^{\infty} e^{-\lambda}\frac{\lambda^k}{k!} z^k 
= e^{-\lambda}\sum_{k=0}^{\infty}\frac{(\lambda z)^k}{k!}
= e^{-\lambda} e^{\lambda z} = e^{\lambda (z-1)}

平均と分散は


\mbox{G}'(1) = \lambda \quad \mbox{G}''(1) + \mbox{G}'(1) - \mbox{G}'(1)^2
= \lambda

連続型の積率母関数では

指数分布


\mbox{Pr}(X=k) = \lambda e^{-\lambda x}

確率母関数は 
\begin{align}
G(z) &= \lambda \sum_{k=0}^{\infty} e^{-\lambda k} z^k
= \lambda \sum_{k=0}^{\infty} (e^{-\lambda}z)^k
= \frac{\lambda e^\lambda}{e^\lambda - z}
\end{align}

平均と分散は

Personal tools
Namespaces

Variants
Actions
Navigation
metabolites
Toolbox