Aritalab:Lecture/NetworkBiology/Degree Distribution
From Metabolomics.JP
< Aritalab:Lecture | NetworkBiology(Difference between revisions)
m (→次数分布) |
m (→次数相関) |
||
Line 24: | Line 24: | ||
隣接する頂点どうしの次数が似る度合いを次数相関といいます。 | 隣接する頂点どうしの次数が似る度合いを次数相関といいます。 | ||
− | |||
− | |||
− | + | ;次数相関 | |
+ | ピアソンの相関係数に従って定義します。M 本ある辺の両端点 u, v の次数をそれぞれ k<sub>u</sub>, k<sub>u</sub> とおきます。相関係数の分子は k<sub>u</sub>, k<sub>v</sub> の平均からの差分を計算します。 | ||
+ | 分母は本来 k<sub>u</sub> と k<sub>v</sub> の標準偏差の積ですが、ここでは分散を使ってしまいます。 | ||
+ | <math>r = \frac{\sum_{(u,v)\in E}^M (k_u k_v - \langle k \rangle^2) }{M (\langle k^2 \rangle - \langle k \rangle^2) } </math> | ||
− | |||
− | + | * 辺がランダムに張られるエルデシュモデルでは、次数相関は 0 になります。 | |
− | + | * 映画俳優の競演関係ネットワークではハブどうしが隣接しやすい、つまり正の相関を持ちます。 (assortative) | |
− | + | * 生態系ネットワークではハブどうしが独立し、負の相関を持ちます。 (dis-assortative) | |
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + |
Revision as of 08:53, 2 August 2017
次数分布
次数 k が全頂点の中で占める割合 p(k) を次数分布といいます。確率分布なので総和は 1 です。
その平均値を、平均次数といい と書きます。
隣接点の次数分布
隣接する頂点の次数を と書きましょう。ここで次数 k の頂点に隣接する頂点の次数が j です。
別の言い方をすると、頂点をランダムに選んで次数が j である確率は p( j) ですが、辺をランダムに選んでその先に来る頂点の次数が j である確率が p ( j | k ) です。辺をたどった先の頂点はハブが来やすく、その来やすさは、頂点の次数に正比例します。次数 j の頂点は相対的に j / <k> だけ、現れやすくなっています。
辺の先に来る頂点の次数平均を求めましょう。
この値は各所で用いますが、k から j をたどる辺 1 本ぶんを最初に引いておく場合もあります。このとき、値は になります。
次数相関
隣接する頂点どうしの次数が似る度合いを次数相関といいます。
- 次数相関
ピアソンの相関係数に従って定義します。M 本ある辺の両端点 u, v の次数をそれぞれ ku, ku とおきます。相関係数の分子は ku, kv の平均からの差分を計算します。 分母は本来 ku と kv の標準偏差の積ですが、ここでは分散を使ってしまいます。
- 辺がランダムに張られるエルデシュモデルでは、次数相関は 0 になります。
- 映画俳優の競演関係ネットワークではハブどうしが隣接しやすい、つまり正の相関を持ちます。 (assortative)
- 生態系ネットワークではハブどうしが独立し、負の相関を持ちます。 (dis-assortative)