Aritalab:Lecture/Algorithm/CooksTheorem

From Metabolomics.JP
< Aritalab:Lecture | Algorithm(Difference between revisions)
Jump to: navigation, search
m
Line 1: Line 1:
==クックの定理==
+
==クックの功績==
クックが1971年に証明した、論理式の充足可能性問題がNP完全であることを解説します。
+
[http://en.wikipedia.org/wiki/Stephen_Cook クック (Stephen Cook)] は1971年に論理式の充足可能性問題がNP完全であることを証明しました。
 +
この論文が計算量理論にもたらした功績は複数あります。
 +
* 問題を多項式時間で変換することの重要性を説いた
 +
* 非決定性の判定問題に焦点を当てた
 +
* 充足可能性問題がNP完全であることを証明した
 +
 
 +
この功績により、クックはTuring賞を受賞しています。
 
;参考文献 : Garey MR, Johnson DS "Computers and Intractability" ''WH Freeman & Co.'' 1979
 
;参考文献 : Garey MR, Johnson DS "Computers and Intractability" ''WH Freeman & Co.'' 1979
  
Line 18: Line 24:
 
となります。充足可能性を判定するには、2<sup>m</sup> 通りに近い真偽パターンを試す以外に方法が無さそうです。それゆえNP完全、クラスNPの中でも最も難しいとされる問題クラスに属しています。(ただしP &ne; NP は証明されていません。)
 
となります。充足可能性を判定するには、2<sup>m</sup> 通りに近い真偽パターンを試す以外に方法が無さそうです。それゆえNP完全、クラスNPの中でも最も難しいとされる問題クラスに属しています。(ただしP &ne; NP は証明されていません。)
  
==Cookの定理==
+
==クックの定理==
 
; 充足可能性問題 (SAT) はNP完全である
 
; 充足可能性問題 (SAT) はNP完全である
  
Line 28: Line 34:
  
 
{| class="wikitable"
 
{| class="wikitable"
+ ''M'' の記述に用いる変数
+
|+ ''M'' の記述に用いる変数
 
|-
 
|-
 
! 変数 || 意味 || パラメータ || 大雑把な個数
 
! 変数 || 意味 || パラメータ || 大雑把な個数
Line 46: Line 52:
 
ただし
 
ただし
 
: r ... 初期状態 q<sub>0</sub>、受理状態 q<sub>Y</sub>, q<sub>N</sub> も含めた全状態数 |Q| のこと、
 
: r ... 初期状態 q<sub>0</sub>、受理状態 q<sub>Y</sub>, q<sub>N</sub> も含めた全状態数 |Q| のこと、
: v ... 空白記号 (b = s<sub>0</sub>とする) や入力記号も含めた、テープ記号数 | &Gamma; | のことです。
+
: v ... 空白記号 (b = s<sub>0</sub>とする) や入力記号も含めた、テープ記号数 | &Gamma; | のことです。 r や v は NDTM の構造で決まる定数とみなせるので、変数の総数は p(n)<sup>2</sup> オーダーであることがわかります。
  
これらの変数を用いて次表に示す6つの節グループを作成し、NDTM ''M'' の動きを規定します。
+
これらの変数を用いて次表に示す6つの節グループを作成し、NDTM ''M'' の動きを規定しましょう。
  
 
{| class="wikitable"
 
{| class="wikitable"
Line 57: Line 63:
 
! width="15%"| 節の個数(大雑把に)
 
! width="15%"| 節の個数(大雑把に)
 
|-
 
|-
| rowspan="2"| 状態に関する制約
+
| rowspan="2"| 1. 状態に関する制約
 
| 時刻 i において ''M'' はいずれかの状態にある
 
| 時刻 i において ''M'' はいずれかの状態にある
 
| { Q [ t<sub>i</sub>, q<sub>0</sub> ],  Q [ t<sub>i</sub>, q<sub>Y</sub> ],  Q [ t<sub>i</sub>, q<sub>N</sub> ],  Q [ t<sub>i</sub>, q<sub>3</sub> ],  ... ,  Q [ t<sub>i</sub>, q<sub>r</sub> ] }  
 
| { Q [ t<sub>i</sub>, q<sub>0</sub> ],  Q [ t<sub>i</sub>, q<sub>Y</sub> ],  Q [ t<sub>i</sub>, q<sub>N</sub> ],  Q [ t<sub>i</sub>, q<sub>3</sub> ],  ... ,  Q [ t<sub>i</sub>, q<sub>r</sub> ] }  
Line 68: Line 74:
 
| p(n) * r<sup>2</sup>/2
 
| p(n) * r<sup>2</sup>/2
 
|-
 
|-
| rowspan="2" | ヘッド位置に関する制約
+
| rowspan="2" | 2. ヘッド位置に関する制約
 
| 時刻 i においてヘッドはいずれかのテープ位置にある
 
| 時刻 i においてヘッドはいずれかのテープ位置にある
 
| { H [ t<sub>i</sub>, -p(n) ],  H [ t<sub>i</sub>, -p(n)+1 ],  ...,  H [ t<sub>i</sub>, p(n)+1 ] }
 
| { H [ t<sub>i</sub>, -p(n) ],  H [ t<sub>i</sub>, -p(n)+1 ],  ...,  H [ t<sub>i</sub>, p(n)+1 ] }
Line 79: Line 85:
 
| p(n) * 2 p(n)<sup>2</sup>
 
| p(n) * 2 p(n)<sup>2</sup>
 
|-
 
|-
| rowspan="2" | テープに書く記号に関する制約
+
| rowspan="2" | 3. テープに書く記号に関する制約
 
| 時刻 i においてテープ位置 j にはいずれかの記号 k がある
 
| 時刻 i においてテープ位置 j にはいずれかの記号 k がある
 
| { S [ t<sub>i</sub>, j, s<sub>0</sub> ],  S [ t<sub>i</sub>, j, s<sub>1</sub> ],  ...,  S [ t<sub>i</sub>, j, s<sub>v</sub> ] }  
 
| { S [ t<sub>i</sub>, j, s<sub>0</sub> ],  S [ t<sub>i</sub>, j, s<sub>1</sub> ],  ...,  S [ t<sub>i</sub>, j, s<sub>v</sub> ] }  
Line 90: Line 96:
 
| p(n) * 2 p(n) * v
 
| p(n) * 2 p(n) * v
 
|-
 
|-
| rowspan="2"| ''M'' の初期設定に関する制約
+
| rowspan="2"| 4. ''M'' の初期設定に関する制約
 
| 時間0の初期状態では、テープが左端でヘッドは空白記号をみている
 
| 時間0の初期状態では、テープが左端でヘッドは空白記号をみている
 
|{ Q [ t<sub>0</sub>, q<sub>0</sub> ] },  { H [ t<sub>0</sub>, 1 ] },  { S [ t<sub>0</sub>, 0, s<sub>0</sub> ] }
 
|{ Q [ t<sub>0</sub>, q<sub>0</sub> ] },  { H [ t<sub>0</sub>, 1 ] },  { S [ t<sub>0</sub>, 0, s<sub>0</sub> ] }
Line 101: Line 107:
 
| p(n)
 
| p(n)
 
|-
 
|-
| 受理状態に関する制約
+
| 5. 受理状態に関する制約
 
| 時刻 p(n) には ''M'' が状態 q<sub>Y</sub> に到達
 
| 時刻 p(n) には ''M'' が状態 q<sub>Y</sub> に到達
 
| { Q [ t<sub>p(n)</sub>, q<sub>Y</sub> ] }
 
| { Q [ t<sub>p(n)</sub>, q<sub>Y</sub> ] }
Line 107: Line 113:
 
| 1
 
| 1
 
|-
 
|-
| rowspan="2" | 状態遷移に関する制約
+
| rowspan="2" | 6. 状態遷移に関する制約
 
| 時刻 i にテープ位置 j をアクセスしない場合 j の中身はs<sub>l</sub>のまま変化しない
 
| 時刻 i にテープ位置 j をアクセスしない場合 j の中身はs<sub>l</sub>のまま変化しない
 
| { ¬S [ t<sub>i</sub>, j, s<sub>l</sub> ],  H [ t<sub>i</sub>, j ],  S [ t<sub>i+1</sub>, j, s<sub>l</sub> ] }
 
| { ¬S [ t<sub>i</sub>, j, s<sub>l</sub> ],  H [ t<sub>i</sub>, j ],  S [ t<sub>i+1</sub>, j, s<sub>l</sub> ] }
Line 118: Line 124:
 
| 6 * p(n)<sup>2</sup>* r * v
 
| 6 * p(n)<sup>2</sup>* r * v
 
|}
 
|}
 +
 +
表の中にでてくる節は大きく分けて3パターンあります。
 +
* { L<sub>1</sub>, L<sub>2</sub>, ... L<sub>k</sub> } <br/> この形は、どれか一つでもTrueであれば満たされるので、選択肢を記述するために使われます。
 +
* { ¬L<sub>1</sub>, ¬L<sub>2</sub> } <br/> この形は、両方が真であるときに限り満たせないので、選択肢の排他性を記述するために使われます。
 +
表のうちグループ1からグループ3までの制約はこのパターンで書かれています。
 +
* { L } <br/> この形は L が必ず True であることを意味します。初期設定や受理状態など、グループ4とグループ5の制約がこのパターンで書かれています。
 +
* { ¬L<sub>1</sub>, L<sub>2</sub>, L<sub>3</sub> } <br/> この形は、( if L<sub>2</sub> then L<sub>1</sub> &rarr; L<sub>3</sub> ) という論理式に読みかえられます。
 +
* { ¬L<sub>1</sub>, ¬L<sub>2</sub>, ¬L<sub>3</sub>, L<sub>4</sub> } <br/>この形は、( L<sub>1</sub> &and; L<sub>2</sub> &and; L<sub>3</sub> &rarr; L<sub>4</sub> ) という論理式に読みかえられます。こうするとグループ6の式の意味がわかりやすくなります。
 +
 +
表に出てくる節の個数は p(n)<sup>3</sup> のオーダーで抑えられますし、各節の中には p(n) オーダーの変数しか現れません。
 +
結果として、 NDTM の全ての動きが p(n)<sup>4</sup> オーダーのSAT問題として記述できることがわかりました。
 +
 +
従って以下のことがわかります。
 +
{|
 +
| ある問題 x がクラスNPに属する || &hArr; || 多項式時間で解ける NDTM のプログラムが存在
 +
|-
 +
| || &hArr; || NDTM の動作を多項式時間で変換したSAT問題が充足できる
 +
|}
 +
どんなSAT問題を与えられても多項式時間で解けてしまうアルゴリズムがあるとするならば、クラス NP に属する全ての問題が (SAT問題に変換することで) 多項式時間で解けてしまうことになるのです。

Revision as of 14:25, 1 November 2010

クックの功績

クック (Stephen Cook) は1971年に論理式の充足可能性問題がNP完全であることを証明しました。 この論文が計算量理論にもたらした功績は複数あります。

  • 問題を多項式時間で変換することの重要性を説いた
  • 非決定性の判定問題に焦点を当てた
  • 充足可能性問題がNP完全であることを証明した

この功績により、クックはTuring賞を受賞しています。

参考文献 
Garey MR, Johnson DS "Computers and Intractability" WH Freeman & Co. 1979

論理式の充足可能性問題

ブール変数の集合 U = { u1, u2 ... um } に対する真偽の割り当て U → {T, F} を考えます。変数が m 個あれば、割り当てパターンは 2m 通りあります。 U に含まれる複数個のブール変数 u またはその否定 ¬u を論理和 (or) ∨ でつないだものを節といいます。 節が真になるとき、その節は充足されたといいます。 例えば{ u1, ¬u2, u3 } という節は、 u1 = F かつ u2 = T かつ u3 = F でない限り充足されます。(充足する真偽の割り当ては7パターンあります。)

節の集合 C が充足可能であるとは、C に含まれる節を全て充足するようなブール変数の集合 U に対する真偽の割り当てが存在することをいいます。この定義を用いて、充足可能性問題 (SAT: Satisfiability Problem) は以下のように書けます。

「変数の集合 U 上の節集合 C に対して、それを充足する真偽の割り当てが存在するか?」

例えばU = { u1, u2 } において

C = { {¬u1, u2}, {u1, ¬u2} } は充足可能 ( u1 = u2 = T のとき)
C = { {u1, u2}, {u1, ¬u2}, {¬u1} } は充足不可能

となります。充足可能性を判定するには、2m 通りに近い真偽パターンを試す以外に方法が無さそうです。それゆえNP完全、クラスNPの中でも最も難しいとされる問題クラスに属しています。(ただしP ≠ NP は証明されていません。)

クックの定理

充足可能性問題 (SAT) はNP完全である

SATがNPに入ることは明らかです。正解となる論理変数の割り当てを知っていれば、節が充足されることを検証するのは簡単です(線形時間しか要しません)。 SATがNP完全であることを示すには、NPに属するあらゆる問題が、SATの一例とみなせることを示さなくてはなりません。しかし、あらゆるNP問題を逐一SATに変換していては埒が明きません。 そのかわり、非決定性チューリング機械 (NDTM) の全動作パターンを、SATで特定できることを示します。

入力文字列を x 、計算が終わるまでに必要な多項式時間ステップを p(n) (n = |X|) とします (受理状態も含めます)。 この時間内で、NDTM M = (Γ, Q, δ, x) はテープ位置 -p(n) から p(n) + 1 の内側しか処理できないことを利用します。M の状態数やテープ記号数も有限ですから、これらに関する処理を有限個の変数で記述することが可能です。

M の記述に用いる変数
 変数 意味 パラメータ 大雑把な個数
Q[ti, qk] 時間 i において M が状態 qkにある時に限り True 0 ≤ i ≤ p(n)
0 ≤ k ≤ r
p(n) * r
H[ti, j] 時間 i において M のヘッドが
テープ位置 j にある時に限り True
0 ≤ i ≤ p(n)
-p(n) ≤ j ≤ p(n) + 1
2 p(n)2
S[ti, j, sk] 時間 i においてテープ位置 j に
記号 sk が書かれている時に限り True
0 ≤ i ≤ p(n)
-p(n) ≤ j ≤ p(n) + 1
0 ≤ k ≤ v
2 p(n)2 * v

ただし

r ... 初期状態 q0、受理状態 qY, qN も含めた全状態数 |Q| のこと、
v ... 空白記号 (b = s0とする) や入力記号も含めた、テープ記号数 | Γ | のことです。 r や v は NDTM の構造で決まる定数とみなせるので、変数の総数は p(n)2 オーダーであることがわかります。

これらの変数を用いて次表に示す6つの節グループを作成し、NDTM M の動きを規定しましょう。

グループ 意味 節の構成 変数の範囲 節の個数(大雑把に)
1. 状態に関する制約 時刻 i において M はいずれかの状態にある { Q [ ti, q0 ], Q [ ti, qY ], Q [ ti, qN ], Q [ ti, q3 ], ... , Q [ ti, qr ] } 0 ≤ i ≤ p(n) p(n)
時刻 i において M は二つの状態を同時に取らない { ¬Q [ ti, qj ], ¬Q [ ti, qj' ] } 0 ≤ i ≤ p(n),
0 ≤ j < j' ≤ r
p(n) * r2/2
2. ヘッド位置に関する制約 時刻 i においてヘッドはいずれかのテープ位置にある { H [ ti, -p(n) ], H [ ti, -p(n)+1 ], ..., H [ ti, p(n)+1 ] } 0 ≤ i ≤ p(n) p(n)
時刻 i においてヘッドは二つの位置を同時に取らない { ¬H [ ti, j ], ¬H [ ti, j' ] } 0 ≤ i ≤ p(n),
-p(n) ≤ j < j' ≤ p(n)+1
p(n) * 2 p(n)2
3. テープに書く記号に関する制約 時刻 i においてテープ位置 j にはいずれかの記号 k がある { S [ ti, j, s0 ], S [ ti, j, s1 ], ..., S [ ti, j, sv ] } 0 ≤ i ≤ p(n),
-p(n) ≤ j ≤ p(n)+1
p(n) * 2 p(n)
時刻 i においてテープ位置 j は二種の記号を同時に取らない { ¬S [ ti, j, sk ], ¬S [ ti, j, sk' ] } 0 ≤ i ≤ p(n),
-p(n) ≤ j ≤ p(n)+1,
0 ≤k < k' ≤ v
p(n) * 2 p(n) * v
4. M の初期設定に関する制約 時間0の初期状態では、テープが左端でヘッドは空白記号をみている { Q [ t0, q0 ] }, { H [ t0, 1 ] }, { S [ t0, 0, s0 ] }  - 3
テープに入力 x = k1k2...knのみ書かれている { S [ t0, 1, k1 ] }, { S [ t0, 2, k2 ] }, u... { S [ t0, n, kn ] },
{ S [ t0, n+1, b ] }, { S [ t0, n+2, b ] }, ... { S [ t0, p(n)+1, b ] }
- p(n)
5. 受理状態に関する制約 時刻 p(n) には M が状態 qY に到達 { Q [ tp(n), qY ] } - 1
6. 状態遷移に関する制約 時刻 i にテープ位置 j をアクセスしない場合 j の中身はslのまま変化しない { ¬S [ ti, j, sl ], H [ ti, j ], S [ ti+1, j, sl ] } 0 ≤ i ≤ p(n),
-p(n) ≤ j ≤ p(n)+1,
0 ≤ l ≤ v
2 p(n)2 * v
時刻 i における状態遷移が δ(qk,sl) = (qk',sl',Δ) で表現される { ¬H[ ti, j ], ¬Q[ ti, qk ], ¬S[ ti, j, sl ],
H[ ti+1, j + Δ ] }
{ ¬H[ ti, j ], ¬Q[ ti, qk ], ¬S[ ti, j, sl ],
Q[ ti+1, qk' ] }
{ ¬H[ ti, j ], ¬Q[ ti, qk ], ¬S[ ti, j, sl ],
S[ ti+1, j, sl' ] }
0 ≤ i < p(n),
-p(n) ≤ j ≤ p(n) + 1,
0 ≤ k ≤ r,
0 ≤ l ≤ v
6 * p(n)2* r * v

表の中にでてくる節は大きく分けて3パターンあります。

  • { L1, L2, ... Lk }
    この形は、どれか一つでもTrueであれば満たされるので、選択肢を記述するために使われます。
  • { ¬L1, ¬L2 }
    この形は、両方が真であるときに限り満たせないので、選択肢の排他性を記述するために使われます。

表のうちグループ1からグループ3までの制約はこのパターンで書かれています。

  • { L }
    この形は L が必ず True であることを意味します。初期設定や受理状態など、グループ4とグループ5の制約がこのパターンで書かれています。
  • { ¬L1, L2, L3 }
    この形は、( if L2 then L1 → L3 ) という論理式に読みかえられます。
  • { ¬L1, ¬L2, ¬L3, L4 }
    この形は、( L1 ∧ L2 ∧ L3 → L4 ) という論理式に読みかえられます。こうするとグループ6の式の意味がわかりやすくなります。

表に出てくる節の個数は p(n)3 のオーダーで抑えられますし、各節の中には p(n) オーダーの変数しか現れません。 結果として、 NDTM の全ての動きが p(n)4 オーダーのSAT問題として記述できることがわかりました。

従って以下のことがわかります。

ある問題 x がクラスNPに属する  ⇔ 多項式時間で解ける NDTM のプログラムが存在
NDTM の動作を多項式時間で変換したSAT問題が充足できる

どんなSAT問題を与えられても多項式時間で解けてしまうアルゴリズムがあるとするならば、クラス NP に属する全ての問題が (SAT問題に変換することで) 多項式時間で解けてしまうことになるのです。

Personal tools
Namespaces

Variants
Actions
Navigation
metabolites
Toolbox