Aritalab:Lecture/NetworkBiology/Degree Distribution

From Metabolomics.JP
< Aritalab:Lecture | NetworkBiology(Difference between revisions)
Jump to: navigation, search
(Created page with "==次数分布== 次数 k が全頂点の中で占める割合 p(k) を次数分布といいます。 <math>\textstyle \sum_{k=0}^{(n-1)} p(k) = 1 </math> その平均値...")
 
m (次数相関)
Line 27: Line 27:
 
<math> \sum_j j P_{adj}(j|k) = \sum_j j \frac{jp(j)}{\langle k \rangle} = \frac{\langle k^2 \rangle}{\langle k \rangle}</math>
 
<math> \sum_j j P_{adj}(j|k) = \sum_j j \frac{jp(j)}{\langle k \rangle} = \frac{\langle k^2 \rangle}{\langle k \rangle}</math>
  
 +
全頂点の次数が同じ時 <k<sup>2</sup>> = <k><sup>2</sup> となるので、隣接点の平均次数は <k> になります。また次数の偏りが大きくハブが存在する場合、隣接点の平均次数は <k> を大きくうわまわります。(つまり隣にハブが来やすくなる。)次数がポアソン分布に従う場合、<k<sup>2</sup>> = <k><sup>2</sup> + <k> が成り立ちます。ポアソン分布の場合は、隣接点の次数が正確に 1 増えています。
  
次数相関 ''r'' をピアソンの相関係数に従って定義しましょう。''M'' 本ある辺の両端点 ''u'', ''v'' の次数をそれぞれ ''k<sub>u</sub>'', ''k<sub>u</sub>'' とおきます。相関係数の分子は ''k<sub>u</sub>'', ''k<sub>v</sub>'' の平均からの差分を計算します。
+
===計算法===
 +
 
 +
次数相関 ''r'' をピアソンの相関係数に従って定義しましょう。M 本ある辺の両端点 ''u'', ''v'' の次数をそれぞれ ''k<sub>u</sub>'', ''k<sub>u</sub>'' とおきます。相関係数の分子は ''k<sub>u</sub>'', ''k<sub>v</sub>'' の平均からの差分を計算します。
 
分母は ''k<sub>u</sub>'' と ''k<sub>v</sub>'' の標準偏差の積ですが、実際には分散を計算します。
 
分母は ''k<sub>u</sub>'' と ''k<sub>v</sub>'' の標準偏差の積ですが、実際には分散を計算します。
  
  
 
<math>r = \frac{\sum_{(u,v)\in E}^M (k_u k_v - \langle k \rangle^2) }{M (\langle k^2 \rangle - \langle k \rangle^2) } </math>
 
<math>r = \frac{\sum_{(u,v)\in E}^M (k_u k_v - \langle k \rangle^2) }{M (\langle k^2 \rangle - \langle k \rangle^2) } </math>

Revision as of 12:37, 3 August 2016

Contents

次数分布

次数 k が全頂点の中で占める割合 p(k) を次数分布といいます。

\textstyle \sum_{k=0}^{(n-1)} p(k) = 1

その平均値を、平均次数といい <k> = Σ k p(k) と書きます。

隣接点の次数分布

隣接する頂点の次数を P_{adj} ( j | k ) と書きましょう。ここで次数 k と隣接する頂点の次数 j が独立に決まるとします(相関が0)。 すると次の式から、次数が j の頂点は相対的に j / <k> だけ、隣にきやすいはずです。

 P_{adj}(j|k) = \frac{j p(j)}{\sum_{k=0}^{(n-1)} k p(k)} = \frac{j}{\langle k \rangle}p(j)

隣の頂点には、ハブが来やすいことがわかります。その来やすさは、頂点の次数に正比例します。

次数相関

隣接する頂点どうしの次数が似る度合いを次数相関といいます。 辺がランダムに張られる場合は次数相関は 0 になりますが、映画俳優の競演関係といったネットワークはハブどうしが隣接する、つまり正の相関を持つ (assortative) ことが知られています。 生態系のような生物学ネットワークでは負の相関を持つ (disassortative) と考えられます。

次数相関の存在は次数 k の頂点につながる隣接点の平均次数を調べるとわかります。隣接点の平均次数は、次数分布や頂点の次数 k によらず一定値となります。


 \sum_j j P_{adj}(j|k) = \sum_j j \frac{jp(j)}{\langle k \rangle} = \frac{\langle k^2 \rangle}{\langle k \rangle}

全頂点の次数が同じ時 <k2> = <k>2 となるので、隣接点の平均次数は <k> になります。また次数の偏りが大きくハブが存在する場合、隣接点の平均次数は <k> を大きくうわまわります。(つまり隣にハブが来やすくなる。)次数がポアソン分布に従う場合、<k2> = <k>2 + <k> が成り立ちます。ポアソン分布の場合は、隣接点の次数が正確に 1 増えています。

計算法

次数相関 r をピアソンの相関係数に従って定義しましょう。M 本ある辺の両端点 u, v の次数をそれぞれ ku, ku とおきます。相関係数の分子は ku, kv の平均からの差分を計算します。 分母は kukv の標準偏差の積ですが、実際には分散を計算します。


r = \frac{\sum_{(u,v)\in E}^M (k_u k_v - \langle k \rangle^2) }{M (\langle k^2 \rangle - \langle k \rangle^2) }

Personal tools
Namespaces

Variants
Actions
Navigation
metabolites
Toolbox