Aritalab:Lecture/NetworkBiology/Barabasi-Albert Model

From Metabolomics.JP
Jump to: navigation, search
Wiki Top Up one level レポートの書き方 Arita Laboratory

Contents

Scale-free性

ネットワークの頂点に接続する辺の数を次数といい、全頂点のなかで次数 k の頂点の占める割合を p(k) と書きます。 ネットワークがスケールフリーであるとは次数の分布がべき則に従うことを意味し、式で書くと p(k) \propto k^{-\gamma} になります。

この定義は1999年の論文 Barabási A-L, Albert R "Emergence of Scaling in Random Networks" Science 286(5439):509-512 をきっかけに広まりました。

自然界にはべき則が普通に見られ、以下の例がよく知られています。(この表におけるL, Cの意味はリンク解析の項を参照。)

Network (size) \gamma L C
インターネット (1.5 x 105) \gamma_{in}=2.1, \gamma_{out}=2.7 3.1 0.11 Barabasi and Albert (1999)
部分的インターネット (3000-6000) 2.16 3.7 0.18-0.3 Faloutous et al. (1999)
映画俳優の共演関係 (2.2 x 105) 2.3 3.7 0.79 Watts and Strogatz (1998)
PubMedデータベースの共著関係 (1.5 x 106)  ? 4.6 0.066 Newman (2000, 2001)

べき則やそれを生み出すメカニズムの解析は最近始まったものではありません。科学界ではおよそ50年周期で話題になってきました。べき則を示す有名な例として、ジップの法則、パレートの法則などがあります。

  • 20世紀初頭
    • Pareto, V. (1896, 1897) Cours d’economie politique. Reprinted as a volume of Oeuvres Complètes (Droz, Geneva, 1896, 1965). Pareto, V. Cours d’Economique Politique (Macmillan, Paris, 1897) 所得の分布がべき則に従うことを示す
    • Yule, G. (1924) A mathematical theory of evolution, based on the conclusion of Dr. J.C. Willis. F.R.S. Phil. Trans. R. Soc. Lond Ser. B 213, 21–87 優先的選択のメカニズムを示す
  • 20世紀半ば
    • Zipf, G.K. (1949) Human Behavior and the Principle of Least Effort, Addison-Wesley 単語の頻度分布がべき則に従うことを示す
    • Simon, H.A. (1955) On a class of skew distribution functions. Biometrika 42, 425–440 乗算過程が漸近的にべき則に従うことを示す
  • 21世紀初頭
    • Barabási A-L, Albert R (1999) これまでの研究をネットワークの言葉に置き換える

またべき則に近い形である対数正規分布とべき則の関係についても多くの研究がなされました。

  • 乗算過程による対数正規分布の一般性
    • Kapteyn, J.C. (1903) Skew frequency curves in biology and statistics in Astronomical Laboratory, Noordhoff, Groningen
    • Gibrat, R. (1931) Les Inegalites Economiques, Libraire du Recueil Sirey, Paris
  • 乗算過程がべき則を生むメカニズム
    • Kesten, H. (1973) Random difference equations and renewal theory for products of random matrices. Acta Mathematica CXXXI, 207–248
    • Reed, W.J. and Hughes, B.D. (2002) From gene families and genera to incomes and internet file sizes: why power-laws are so common in nature. Phys. Rev. E 66, 067103

Barabási-Albert Model

Barabási, Albertがネットワークの成長モデルとして提唱したのは以下の過程です。(正確には初期条件が異なるが本質は同じ。)

  1. 時間ステップ1においてm本の辺で結ばれた2頂点からスタートする。
  2. 単位時間毎に頂点を1つずつ追加し、既に存在する頂点とm本の辺でつなぐ。
    新しい辺はそれぞれ確率\textstyle p_i = k_i / \sum_j k_j (ここでk_iは頂点iの次数) で接続先を決定する。

この過程は優先的選択(preferential attachment)と呼ばれ、一般にrich gets richerメカニズムなどともいわれます。


べき則のパラメータ\gammaについて

BAモデルから\gamma = 3 を簡単に導出できます。 初期条件として2頂点が m 本のリンクで結ばれている場合、t時間後には頂点数t+1、辺数 mt です。 頂点 i の次数 k_i は時間が経つと単調増加します。ここで、次数を k_i(t) という連続関数として考えてみます。頂点 i の次数は単位時間あたり次数 k_i に比例して増加するので

\frac{\partial k_i}{\partial t} = m \frac{k_i}{\sum_j k_j} = \frac{k_i}{2t}

これを解くと \textstyle k_i(t) = m(t/t_i)^{1/2}、 ただし t_i は頂点 i が追加された時間で k_i(t_i)=m となる値です(初期条件)。 これを式変形すれば、頂点の次数がある値 x になる時間は t=t_i(\frac{x}{m})^2 であることがわかります。

頂点の次数分布 p(k) を求めるために、まず頂点の次数が k より大きくなる割合(累積分布関数)を求めます。次数が x より大きくなるような頂点全体の割合は、時刻 t(\frac{m}{x})^2 より前に追加された頂点全体の割合に等しくなります。

Pr(k_i(t) > x) = Pr(t_i < t(\frac{m}{x})^2) = (\frac{m}{k})^2

左の等号は、頂点 i が追加された時間 t_i が、時刻 t に対して (m/k)^2 よりも早ければ(小さければ)、次数が x を超えることを示しています。 頂点が常に一定量ずつ追加されることを考えると、全体サイズを1とするなら、その割合は単純に (\frac{m}{k})^2 としてよいことがわかります。

次数分布 Pr(k_i(t) = k)Pr(k_i(t) > k) - Pr(k_i(t) > k+1) と書けるので、 - \frac{\partial Pr(k_i(t) > k}{\partial k}) になります。 さきの答えをkで微分するとPr(k_i(t) = k) = 2m^2/k^3。すなわち辺の次数はk^{-3}に比例します。

優先的選択でない場合

新しい辺が結びつく先が次数に比例する値ではなく、一様分布に従うと仮定してみます。

\frac{\partial k_i}{\partial t} = m/(n-1) = m/t

これを解いてk_i(t) = m(\log(\frac{t}{t_i})+1)。こちらも累積分布関数を計算してみる。

P(k_i(t) > k) = P(t_i < t(1-\frac{1}{\exp(k/m - 1)}) = 1-\exp(1-(k/m))

これを微分するとP(k_i(t)=k)=exp(-k/m)/m、すなわち辺の次数は指数的に減少することになります。

何がべき分布を作るのか

エッセンスだけ言うと、優先的選択の場合は次数の時間変化を規定する微分方程式が \textstyle \frac{dy}{dx} = \frac{y}{2x}と、yが微分値の分子に現れていた点がミソになります。これを解くとy=cx^{1/2}という答えが得られ(cは適当な定数)、この係数1/2が\gamma=-3を作り出します。だから異なる\gammaの値を作り出すにはy/2xにおける比の2を他にずらせればよいのです。

例えば

\frac{\partial k_i}{\partial t} = \frac{k_i}{pt}

という近似を何らかの形で導出すると、\gamma=p-1に設定できます。


Personal tools
Namespaces

Variants
Actions
Navigation
metabolites
Toolbox