Aritalab:Lecture/Basic/Distribution

From Metabolomics.JP
< Aritalab:Lecture | Basic
Revision as of 16:34, 24 April 2012 by Adm (Talk | contribs)

Jump to: navigation, search

Contents

正規分布

よく見る釣鐘型の連続的な分布です。どんな分布であれ、その中から要素をランダムに抽出して和をとったものの分布は、正規分布に近づくという性質があります(中心極限定理)。期待値が0, 分散が1になるようにスケーリングしたものを標準正規分布といい、N(0,1)と書きます。正規分布はガウス分布とも呼ばれます。

f(x) = \frac{1}{\sigma \sqrt{2\pi}} \exp \{ -(x - \mu)^2 / 2 \sigma^2 \}

ここで σ は標準偏差、 μ は平均を表します。正規分布は同じ作業を繰り返し行った際によく見られます。また血清中のアルブミン量や、身長、体重なども正規分布に従います。

正規分布表

標準正規分布表の見方を説明しましょう。

z 0.0 0.2 0.4 0.6 0.8
0.0 0.5000 0.4207 0.3446 0.2743 0.2119
1.0 0.1587 0.1151 0.0808 0.0548 0.0359
2.0 0.0228 0.0139 0.0082 0.0047 0.0026
3.0 0.0013 0.0007 0.0003 0.0002 0.0001
JSBi-Std.png(図はWikipedia 正規分布より)

表における z の値は上から順に左 → 右方向にみます。値がだんだん小さくなっている点に注意してください。これらの値は、正規分布全体の面積を 1.0 としたときの、 z から上側の面積を示しています。例えば標準偏差が 2.0 以上の面積は 0.0228、2.2 以上の面積は0.0139 になります。

この表から

平均の ±1 σ 内に入る量 68%   (1 - 0.1587*2)
平均の ±2 σ 内に入る量 95%   (1 - 0.0228*2)
平均の ±3 σ 内に入る量 99.7%   (1 - 0.0013*2)

であることがわかります。

z 値と累積分布関数

正規分布に従う確率変数の値は、平均と分散の値を用いて規格化することにより z 値 を求められます。

 z = \frac{x - \mu}{\sigma}

ある z 値以下の面積を与える関数を累積分布関数 (cumulative distribution function) といい、F(z) と書きます。 標準正規分布表から、F(2) = 0.9772, F(-2) = 0.0228 です。

JSBi-Stdcdf.png(図はWikipedia 正規分布より)

対数正規分布

対数 (logarithm) を取ると正規分布に従うものを対数正規分布 (log-normal distribution) と呼びます。血清中の抗体量や、液体を噴霧して得られる液滴サイズが対数正規分布に従うことが知られています。正規分布から逆対数をとれば得られるので、正規分布と同様に扱えます。

二項分布

コイン投げをして表裏がでる回数を記録したときにできる分布です。離散的な分布ですが、回数が多くなると (30程度) 正規分布で非常によく近似できることが知られています。

ポアソン分布

稀にしか起こらない離散的な事象を数える際に用いる分布です。 単位時間中に平均 λ 回発生する事象が、ぴったり k 回発生する確率を

P(N=k) = \frac{e^{-\lambda}\lambda^k}{k!}

と定義します。

JSBi-Poisson.png(図はWikipedia ポアソン分布より)

JSBi-Poissoncdf.png(図はWikipedia ポアソン分布より)

Personal tools
Namespaces

Variants
Actions
Navigation
metabolites
Toolbox