User:Aritalab/Masanori Arita/Publication/Bioventure

From Metabolomics.JP
Jump to: navigation, search

Contents

Bioベンチャー(隔月刊) リサーチ&テクノロジー欄, 羊土社

2003: 1-2月号 アメリカとヨーロッパ

アメリカとヨーロッパ、研究の違いはビュッフェスタイルのアメリ カに対しコースディナーのヨーロッパと言えるだろう。アメリカは 新しいアイデアを好きなようにつまみ食いするのに対し、ヨーロッ パは定着したテーマを周囲と間合いをあわせて味わうのである。

バイオインフォマティクスはその急速な広がりから、ここ数年で勃 興した新分野のように思われている。しかしそんな分野にも、老舗 といえる国際会議が存在する。代表的なのは2002年が10 周年の Intelligent Systems for Molecular Biology(ISMB)と7年目の Pacific Symposium on Biocomputing (PSB)だろう。(PSBは HICCSという会議の一部が独立してできたため、歴史は7年以上ある。 ちなみに日本ではGenome Informatics Workshop(GIW)が今年で13 年目を迎える。ISMBより歴史は長い。)

ISMBは毎年アメリカとヨーロッパ間で開催地を移動はするがアメリ カ主体の国際会議(今年はカナダのエドモントン)、PSBは正月に ハワイで開催され、これもアメリカ主体のリゾート会議である(今 年はカウアイ島)。つまりアメリカ優位が一目瞭然なのだが、この 状況が今年から崩れそうだ。というのも、European Conference on Computational Biology(ECCB)という学会が、ヨーロッパ各国を 渡る形でスタートしたのである。第一回は15年以上の歴史がある German Conference on Bioinformatics(GCB)と共催でドイツ、来 年はFrench National Conference on Bioinformatics(JOBIM)と 共催でフランスで開催される。いわばヨーロッパをまとめようとす る会議である。

今年はISMBとECCB両方に参加してみたが、その性格は初めに述べた 通り。その違いは、招待講演の内容に既に現れていた。ISMBではタ ンパク質の立体構造予測問題で抜群の実績を誇るロゼッタアルゴリ ズムの開発者David Baker(Univ of Washington)が今年のOverton Prize受賞者として計算機シミュレーションの有用性について語っ た。またIsidore Rigoutsos(IBM)は計算機パワーを駆使した配列 パターン検出と自動アノテーションシステム構築、Stephen Altschul (NCBI)はROCスコアがいかにPSI-BLASTの予測精度向上 に役立ったかについて述べた。一言でいえば、各研究グループがい かに最先端を走っているか、優れた成果を出しているかをアピール する講演内容と言えるのである。

これに対し、ECCBではヨーロッパにおける国際協調や大規模プロジェ クトをアピールする傾向があった。例えばオープンソースの遺伝子 アノテーション計画について語り、講演の最後に遺伝子配列の特許 化に強く反対したTim Hubbard (Sanger Institute)、エストニア 国民全体を対象にSNPデータベースを構築する予定のAndres Metspalu(Univ of Tartu/Estonian Biocentre)、ゲノム計画がま だ進行途中であることを強調したPeer Bork(EMBL)などはその好 例だろう。

一般講演でも、ISMBはプロテオーム解析や発現量解析が多かったの に対し、ECCBではDNA配列解析の割合が多い。研究者の目にはアラ インメント等の配列問題が解決されているとは言い難いため、ヨー ロッパの傾向は非常に納得がいく。しかし、活気という点でISMBに はとても及ばなかったのも事実だ。来年以降、この両者がどう動い てゆくのかは興味深いところである。ちなみに、企業スポンサーの つく流行の国際会議だけあって両方とも昼食は無料で振舞われた。 言うまでもないことだが、ISMBはビュッフェスタイルで、ECCBはコー スだったことを最後に付け加えておこう。

参考WWWサイト

  • バイオインフォマティクスの国際会議へのリンク
http://www.genome.ad.jp/about_genomenet/announce.html
  • 招待講演者の公演内容については
ISMB 2002 http://www.ismb02.org/
ECCB 2002 http://www.zbi.uni-saarland.de/ECCB2002/

2003: 3-4月号 昇格の時代

バイオインフォマティクスでは様々な用途の予測ツールが開発される。同じ目 的のツールが多くなると必ず登場するのが、メタツールと呼ばれる代物である。 簡単に言うと、既存ツール(社員)を集めて結果の優劣をを見極め、総合結果 を自分の予測値として報告する「部長」ツールである。たいてい、有能な社員 ツールが昇格して部長的働きを兼ねるようになる。当然ながら部長の守備範囲 は広く、単独の社員より総合的な予測力も向上する。というより、精度が向上 するように判断基準を定めたのが部長ツールだともいえる。

部長ツールが日常的に輩出する分野が、遺伝子領域の予測である。遺伝子アノ テーションの過程では、隠れマルコフモデル(Hidden Markov Model; HMM) に よる予測値、Blastによる既知遺伝子との類似度の高さ、コドン利用率やシグ ナル配列の有無等を勘案して遺伝子領域を決定する。このプロセスを(スクリ プトでも書いて)統合できれば部長の出来上がりである。最近は、遺伝子領域 を予測する部長ツールを複数集めて結果の集計を図る、社長ツールまで現われ た。

部長と社長だけでは会社が成り立たないように、メタツールばかり作っていて も予測手段の本格的精度向上は望めない。ソフトウェアの世界でも、良い所取 りをされるばかりの社員が発奮し軽装のベンチャー企業として独立できるよう に、社会の仕組みを整える必要がある。

こんな様相が顕在化したのが、第5回を迎えた隔年のタンパク質立体構造予測 コンテスト、CASP(Critical Assessment of Techniques for Protein Structure Prediction)である。数十のタンパク質構造を一夏にまたがり予測 するコンテストで、その結果は年末に挑戦者が集まる米国アシロマーで報告さ れる。なんと2002 年のコンテストで上位を占めたのは、皆「部長」であった。 開催者側もこの状況を憂慮したようで、次回からは、コンテストを部長部門と 社員部門の二つに分けることを検討するという。(参加者の予測手法や結果は CASPのホームページ http://predictioncenter.llnl.gov/ を参照してほしい。 過去の優秀手法は雑誌Proteinsの特集号に掲載されている。)

おしよせる部長化の波は避けられないと感じさせるのが、システムズバイオロ ジーという分野である。その定義は人により異なると思うが、既存の解析手法 を組み合わせたり、従来の結果を理論風にまとめる研究がシステム的と捉えら れるようである。つまり、よい部長とは何かを考えるような分野である。その システム流の研究が、いま流行の最先端になっている。ノーベル賞授賞式の余 韻が残るストックホルムで開催された今年のシステムズバイオロジー国際会議 (International Conference on Systems Biology http://www.ki.se/icsb2002/ )は、勢いを象徴するかの如く豪華キャストで演 題が構成され、参加者で会場もいっぱいであった。(実は筆者はそのサテライ ト会議なるものに参加したが、充実した内容の割に参加者が少なく残念であっ た。)

確かに、メタツールというのは社員の意見をまとめて報告するだけの、いわば ダメ部長であった。社員に対し、何を発見すべきか指示できるような有能な部 長を作ることは重要であろう。しかし、社員なくして部長は存在しない。予測 率や簡潔さにこだわると作成中のツールがだんだん部長らしく昇格してゆくの はわかるが、もっと汗水流すヒラ社員のようなツールがどんどんできていいの では、と思うこの頃である。

2003: 5-6月号 情報か生物か、それが問題か?

バイオインフォマティクス(以下BI)はいまや大流行の兆しを見 せている。もともとバイオ産業自体が10年で10倍以上に成長すると 見込まれており、その発展のカギを握るのがBIといわれる。 (http://www.hkd.meti.go.jp/hokii/bioinformatics/index.htm  によいサーベイがある。)既に文科省はBI人材養成コースを設置、 養成プログラムは飽和状態である。講座の多くは学生が対象だが、 社会人を受け入れる場合もあるので問い合わせるといい。各養成機 関にはhttp://www.genome.ad.jp/Japanese/gakko.html からアクセ スできる。

BIはバイオとインフォマティクス両方の人たちに興味を持たれて いると思われるかもしれないが、分野を志す学生の出身は圧倒的に バイオ系が多い。5つの人材養成コースが共同で実施した「BI春 の学校」の参加者も大多数がバイオ系だった。バイオ系の特徴をた とえるならば実直な貴乃花組である。肝のすわったコツコツ人間が 多い。実験結果の解析にコンピュータが不可欠となった今、多くの 貴乃花は、体力の限界を感じながらもバイオを愛しているがゆえに 研究に精進する。ではインフォマティクス系はどうか。こちらは根 性よりも時流に乗ることを重視するお兄ちゃん(若乃花)組である。 自分の能力を様々な分野に適用しようと試み、分野を去るときに 「もともと好きじゃない」などと言ってしまったりする。こうした お兄ちゃん組のモットーは、体力を使わずに成果を出すことである。 ここまで書けば、BIに貴乃花組が多く集まる理由はよくわかる。 お兄ちゃん組はBIに興味はあるものの、アメフトやちゃんこなど 他の興味に流れてしまうのだ。

では実直な貴乃花組が揃ったBIは必ず成功するかというと、そう 簡単でもない。そもそも貴乃花組は体力の限界を感じてBIに流れ ているわけだから、体力を使わずに成果を出すコツを学ばねばなら ない。一番の解決策は、お兄ちゃん組と協調して問題に取り組むこ とである。しかしお兄ちゃん組にしてみれば、いまさら貴乃花組と じっくり取り組む作業は真っ平ごめんである。ちやほやされるほう に魅力を感じるので、流行のテーマとばかり取り組みたがる。こん な理由で、今のBIにはダブルスタンダードが存在する。「情報」 と文字だけくっつけた生物学と、例題だけ「生物」から借りてきた 情報学である。ちなみに、語順にこだわる一部の人にとっては情報 生命科学が前者に近く、生命情報科学が後者に近いのだそうだ。

個人的な見解を言わせてもらえば、どんな名前で呼んだところで、 BIという分野の香りに変わりはない。ちなみに英語には computational biologyという言葉もあるが、bioinformaticsより 情報科学寄りの内容を指す。BIの一番大きな国際学会も International Society of Computational Biologyである。英語圏 で語順の議論があるかどうかは大いに興味のあるところである。い ずれにせよ重要なのは、どちらの分野がエライとか軸足だとかいう ことではない。BIという新しい学問を創れるかどうか、BIが学 問に値する視点やトピックを提供できるかという点にある。つまり 若貴時代と呼べるものを後世に残すことがBI研究者の使命といえ る。このたび東京大学の柏キャンパスに情報生命科学専攻 (Department of Computational Biology http://www.cb.k.u-tokyo.ac.jp/)が新設され、筆者もスタッフと して参加する。今後ますます増えるであろうBI専攻の学生には、 バイオでもなくインフォマティクスでもない、新世界(brave new world)へ乗り込む気持で学問に取り組んでもらいたいものである。

2003: 7-8月号 メタボローム

Genome(ゲノム)という人造語がgene(遺伝子)とchromosome(染色体)から 作られた話は有名である。一般にオーム(ome)という接尾辞は大量の情報を網 羅的に解析する意味で使われている。オーム解析の代表格はゲノム(遺伝子) 、トランスクリプトーム(転写産物)、プロテオーム(たんぱく質)であろう。 最近は、代謝産物の網羅的解析を意味したメタボロームという言葉も広まって きた。ちなみにオミクス(omics)も同じ意味で使われる接尾辞だが、Googleな どで検索すると、トランスクリプトのような長い単語には比較的使われないよ うだ。(オームのリストは http://www.geocities.com/pribond/bioinfo/glossary/omes.htm を見て頂き たい。)

メタボローム(またはメタボロミクス)という分野が盛んになった理由は、質 量分析器の急速な性能向上にある。今でも値段は少々高いが、大学の研究室で も0.1 ミリマスの位まで測定ができるようになった。(炭素12を12マスユニット として計算する。)物質の同定はプロファイリング(profiling)と呼ばれ、検 出された質量ピークと近い値になる組成式を計算機で選び出す作業にあたる。 物質の種類によっても測定法は異なるが、例えば脂質の場合、炭素鎖の長さの みならず、どの部位に二重結合が入るかまでわかるらしい。驚くべき精度であ る。

メタボローム研究は対象とする化合物の構造や機能、同定法が既によく知られ ている点で、他のオーム研究とは異なっている。ゲノムやトランスクリプトー ムの網羅的解析では、大量データの取得や自動分類(クラスタリング)を成果 として発表できた。これは研究対象が機能未知の要素を含むからこそ認められ る逃げ道でもある。つまり機能が未知の場合、同じクラスに分類された対象を 機能上関連する(だろう)と言ってしまえる。メタボロームの世界ではこの手 が通用しない。代謝物を同定するだけでもひと苦労だが、同定された代謝物の 関係が代謝マップにより示される以上、同定結果を代謝経路とからめて解析せ ねばならない。分類だけで結果が出せないことは、バイオインフォマティクス の力が如実に現われる分野だともいえる。メタボロームで特に注目される解析 ツールはデータベース、シミュレーション、そして反応モデルといった分野で ある。

4月にドイツのポツダムで開催された2nd International Conference on Plant Metabolomics(http://metabolomics-2003.mpg.de/ )は、そうしたバイオ インフォマティクスへの期待が伝わってくる会議であった。参加者が約200人 という小規模の会議で参加者の大多数が実験家だったが、ほぼ全員がメタボロー ム向けデータベースの必要性、重要性を唱えていた。しかし駆け出しの分野ら しく意見は様々に分かれた。実験家は質量分析器の出力(raw data)を全て電子 化したいし、解析屋は同定結果(derived data)だけでも十分という。すると、 解釈した結果を記述するなら、そのオントロジー(用語の統一)を先に考えて はどうだろう、といった具合である。むろん小さな学会で決着のつく問題では ないのだが、メタボロームといっても人により解釈が異なり、前途が多難であ ることを思わせた。解析屋の代表格であるMendesの総説からもそうした分野の 現状を伺うことができる[1]。

伝統的なオーム研究はその地位を確立したが、後追いでオームをつけた分野 (メタボロームもそのひとつだろう)はここ数年が頑張りどころのように思え る。オームという接尾辞は流行語大賞を超えるヒット作なのだが、早く廃れて しまう流行語もある。後の世に「そんな言葉もあったねぇ。」と言われないよ うに頑張って欲しいものである。

1. Mendes, P. "Emerging Bioinformatics for the Metabolome", Briefings in Bioinformatics 3(2) pp.134-45, 2002.

2003: 9-10月号 大人のたまごっち

ひとむかし前「たまごっち」というゲームが大流行した.ポケベル位のゲーム 機内でペットを飼うシミュレーションで,定期的に餌をあげたり運動をさせて やらないと(といってもボタンを押すだけだが)病気になったり死んでしまっ たりする.小学生が学校の授業に集中できない等,社会問題までひき起こして いた.さて,研究者の間にそのブームが再来しているのを皆さんはご存知だろ うか.システム生物学と呼ばれる分野で注目を集めるペットは大腸菌である.

6月末に慶応義塾大学の鶴岡キャンパスで開催された第一回 IECA(International Escherichia coli Alliance)国際会議 (http://ieca2003.jtbcom.co.jp/ )には錚々たる顔ぶれが揃った.2002年度 のノーベル医学生理学賞受賞者Sydney Brennerを招待講演者に迎え,S-system の開発で知られるMichael SavageauとEberhard Voit,線形計画法を用いた代 謝流量の解析法で一躍名をはせたBernhard Palssonなど,生化学モデルの大御 所が勢揃いした.(しかも参加費は無料であった.)IECAは実験屋と解析屋が 協調して大腸菌をとことん解析しようという国際コンソーシアムであり,上記 の著名人以外にも多くの実験系研究者が名を連ねている.国内では慶応義塾大 学の冨田勝氏(E-Cellプロジェクト)と森浩禎氏(大腸菌K12-W3110 配列決定 と解析)が中心メンバーだ.さて,今回の会議でコンソーシアムの面々の話を 聞いて驚いたのは,細胞丸ごと「たまごっち」計画が世界各地でおこなわれて いるという事実である.E-Cellシステムを知る人は多いと思うが,IECA 内だ けでも4グループ(表1)が大腸菌の数理モデルを作成している.

表1

E-Cell Project(日本) http://www.e-cell.org/

Project CyberCell(カナダ) http://129.128.166.250/

Amsterdam Silicon Cell(オランダ) http://www.bio.vu.nl/hwconf/Silicon/

Moscow State University(ロシア) 詳細は未公開.大腸菌代謝の微分方程式モデル.

IECA以外でもVCELLのような類似プロジェクト(http://www.nrcam.uchc.edu/ ) が存在するから,開発費数億円のたまごっちは世界のあちこちで作られている らしい.モデル手法は大きく分けて二通り.時間軸に沿った物質濃度変化を微 分方程式により記述する方法(代表はE-Cell)と個々の分子をオブジェクトと して表現し確率的に変化させて離散反応過程を模倣する方法(代表は CyberCell) である.後者は分子数が少ない系の現象をモデルするのに適して おり,大腸菌のべん毛に関するシグナル伝達経路のシミュレーションがよく知 られている(http://www.zoo.cam.ac.uk/comp-cell/ ).この手法を細胞レベ ルに拡大するには膨大な計算量を必要とするが,推進メンバーは大規模PCクラ スタを用いれば可能だと主張する.

高級たまごっちはお金がかかっている分,中身も複雑である.どんなモデル法 にせよ,数百以上のパラメータ設定が必要になる.このままシミュレーション 自体が成功したとしても,難しいことを難しく説明する結果になりかねない. そこで思うのは単純明快な原理原則に基づくたまごっち作りを目指してほしい ということだ.ヒット商品になる位,つまり小学生が熱中するくらい簡単で面 白いほうがよい.なにせモデルしている相手は単細胞生物なのだから.

2003: 11-12月号 ネバー ミス コンテスト

最近はミスコンへの風当たりが強いそうだが,美はもちろんのこと,何でも切 磋琢磨することはよいことである.2003年度のミス・ユニバース日本代表は宮 崎京さん.(http://www.missuniversejapan.com/index_jp.html )世界大会で は5位入賞を果たした.入賞の秘訣は,着物を着る伝統を捨てて忍者の衣装な ど斬新なアイデアでアピールしたことらしい.選考規定にも外面の美しさだけ でなく知性,感性,誠実さといった内面の輝きが求められるとあり,様々な努 力と工夫が必要なのだろう.

バイオインフォマティクス分野でも今年,切磋琢磨を促すべくプログラミング コンテストなるものが開催された.(http://contest.genome.ad.jp/ )文部科 学省の特定領域研究「ゲノム情報科学」班の主催で,2 月末に応募〆切,8月 下旬に博多で優秀者の表彰式があった.今年の出題数は4問,それぞれモチー フ抽出,遺伝子発現量の判別分析,配列アセンブル,ネットワーク可視化に関 するものであった.応募者は好きな問題に解答でき,問題ごとに受賞者(最優 秀賞,優秀賞,特別賞)が決まる.応募数にばらつきはあったものの,今回の 倍率は平均5倍.もちろん全問応募してもよいので,複数受賞の栄誉に輝いた 者もいる.問題および受賞者の解答と講評は上記のウェブサイトで公開されて いるため,興味のある方は見てもらいたい.

このコンテストは,ミスコンに比べるとはるかに荒らしがいがある.なぜなら (1) 誰でも応募できる(ミス・ユニバースは18才から27才の未婚女性),(2) 優勝商品が最新のパソコンで,30万円は下らない製品を受賞者が選べる(世界 大会の5 位入賞は1000ドルとHOYAのクリスタルトロフィー.もちろんトロフィー は選べない),(3) 倍率が低い(宮崎京さんは1517人中から選ばれ,世界大会 で75ヶ国の代表と競った)からである.ここで奮起した読者のために入賞のコ ツを伝授しておきたい.ちなみに筆者は特定領域研究とは関わりがなく,責任 は一切とれないことを明記しておく.

まず,研究者集団が開催しているという点を重視すべきである.例題を解く形 式のコンテストではあるが,応用の利く解法と有効性の裏づけが求められてい る.可視化の問題でいえば,見せ方の美しさだけでなく知性,感性,正当性と いった内面の輝きが求められているのである.よって学術論文を書く意識で応 募したほうがよいだろう.解答と称した感想文は減点である.次に,伝統を意 識しすぎないことである.誰もが想定するような模範解答では面白くない.性 能は抜群でなくとも,あっと言わせる発想で解答した時点で入賞は堅いと思わ れる.出題分野における基本的な手法と比較した上でユニークなアイデアを披 露すると効果は倍増する.求められるのは,外面と内面両方の美しさであり, 様々な努力と工夫を重ねてそれを追い求める精神は,時代や分野を越えている のである.

2004: 1-2月号 かいぎより始めよ

優秀な人材を集めるにはどうするか。生物学の世界だと、有名研究室に優秀な 人材が集まってくる。世界レベルの研究室ともなると、ポスドクの地位でさえ 競争は熾烈である。有名になるには優秀な人材が必要だから、最初の立ち上が りが肝心ということになる。さて、人集めで感心した会議が9月末にギリシャ のサントリーニ島で開かれた第一回"Pathways, Networks, and Systems: Theory and Experiments" である。風光明媚なエーゲ海の島々で学会を開催す るためだけの非営利組織、Aegean Conferences (http://www.aegeanconferences.org/ )が主催している。仕掛け人のJoe Nadeau は「個人旅行で来たら良い所だったので会議にした」と語っていた。 それ以外にエーゲ海である理由はない。それでも不便さを厭わず有名人が集まっ たのは、殆んどが招待講演というプログラムに加え、開催地の魅力が有利に働 いたに違いない。この学会は2004年度も10月にクレタ島で計画されているので、 旅好きの人は手帳にメモしておこう。

その名の通りシステムバイオロジー(以下SB; 英語ではsystems biology)の 集会ではあるが、複数の数理的手法を組み合わせて実験結果を多面的、総合的 に解析する発表が殆んどを占めた。もし複数の手法を駆使して解析するアプロー チ全体をSBと呼ぶならば、生物学は今後全てSB化するといっても過言ではない。 その意味で、この会議は近い将来の研究スタイルのショーケースでもあった。 セッション毎にオーガナイザが講演者を選んだため、彼らが所属する研究組織 の動向がよくわかったので簡単に紹介しよう。会議の要旨集は上記のウェブア ドレスから取得できる。

・Case Western Reserve大学(オハイオ州クリーブランド) J. Nadeauらが医学に近い分野でのシステム解析を推進している。DNAチップの 統計処理など手法に特色はないが、疾患モデルマウスを用いた遺伝形質の解析 に代謝を含む複数の視点から取り組んでいる点が、生物学の王道をいく雰囲気 を感じさせる。

・Keck Graduate Institute (カリフォルニア州クレアモント) D. Galasなど「生命をシステムとして理解する」という狭義のSB推進派が多い。 講演内容も遺伝子ネットワークのグローバルな特徴や、蛋白質ネットワークを 電子回路とみなした解析法など、非常に前衛的な発表内容が面白かった。

・California大学 San Diego校 Alliance for Cellular Signaling (AfCS; http://www.signaling-gateway.org/ )でデータ解析を担当するS. Subramaniam や、大腸菌の解析で知られるB. Palssonなどを擁し、バイオインフォマティク ス(BI) 研究のメッカになりつつある。組織が大きい分、研究を一言でまとめ るのは難しいが、SBというよりはBIの研究拠点という印象を受けた。

・Institute of Systems Biology (ワシントン州シアトル) L. Hoodは来られなかったが、Cytoscape(http://www.cytoscape.org/ )を用い た研究で知られるT. Idekerらが参加した(IdekerはWhitehead Institute に 移籍)。好塩菌や酵母など、微生物を徹底的に調べ上げる研究を手がけており、 手堅い路線である。

話を人材に戻そう。環境が良いと人は集まるようだが、満たされた状態から素 晴らしいアイデアが生まれるかどうかは、実は未知数である。ギリシャの乾燥 した風土と力強い太陽はさぞかし重厚な赤ワインを作るだろうと思いきや、あ まりに良い気候で葡萄が熟しすぎるため、殆んどが早く飲み頃を迎える白ワイ ンなのだそうだ。環境が良すぎるため逆に第一級になれない例である。日本で は沖縄に(広義の)SBを主眼とする大学院大学を設立する計画が進行中である (http://www.tokyo.jst.go.jp/okinawa/ )。 すでに豪奢なリゾート会議もやってみせた(http://www.okinawasympo2003.jp/ )。あとは天下の士が集まるの を待つのみだが、その味やいかに。

2004: 3-4月号 名刺と年賀状とタウンページ

日本バイオインフォマティクス(BI)学会は、毎年12月の中旬にGIW (Genome Informatics Workshop; http://giw.ims.u-tokyo.ac.jp/ )という国際会議を東 京近郊で開く。2003年で14回目を迎えた老舗の会議だが、初期は科学研究費の 研究報告会を兼ねていたそうで、プログラム委員の半分が外国人になったり Medline に載ったりしたのはここ数年の出来事である。

科学技術振興機構(JST)の人から、会議における口頭発表とポスター発表の違 いを聞かれたことがある。そもそもコンピュータ系の会議の場合、口頭発表は ジャーナルと同じpeer-review方式で選ばれ、優れた成果しか発表できない。 質の高い国際会議は採択率が1/3以下であり、1/7を切るものさえある。だから 平均的なポスター発表は落選組というイメージがある。(もちろん不運な優良 株も多い。)しかも白黒A4サイズを並べるだけのポスターが多いから、さなが ら名刺を並べたかのように味気ない。これに対し生物系の会議の場合、口頭発 表がpeer-review 方式で選ばれない。(悪くいえばオーガナイザが勝手に選ん でいる。)だから一般参加者にとってはポスターが全てであり、その質も玉石 混交である。各人がポスターに工夫を凝らし、そうした作品が数百も林立する 様はさながらタウンページの広告欄ともいえよう。

この違いには分野の性格が影響している。論文には書かないが、生物系は失敗 例が重要な分野である。同じ失敗を繰り返さないように、実験プロトコルや実 験対象など、様々な情報を収集することが非常に役に立つ。しかしコンピュー タ系にとっては、失敗例などまるで役に立たない。むしろ成功例ばかり見て目 を肥やすことが重要な分野である。では両者の中間に位置するBIはどうだろう か。

GIWにおけるポスター発表のよい所は日本のBI研究を一望できる点にある。科 研費の報告会という前身の名残もあってか、国内の研究者にとってGIWポスター とは進捗報告のようなものである。予稿集には口頭発表の論文だけでなくポス ターにも2 ページのスペースが与えられるため、実際にポスターを見なくても 研究の概略がわかる点もありがたい。つまり、予稿集のポスター部分がBIのレ ビューになっており、ポスター会場が同窓会のような情報交換の場になってい る。このスタイルはRECOMB(International Conference on Research in Computational Molecular Biology; http://recomb04.sdsc.edu/ )という国際 会議でも踏襲されている。名刺やタウンページに較べると、年賀状のような面 白さがある。

しかしGIWポスターの数が200を越えた昨年は、この同窓会スタイルの限界が迫っ たことを感じさせた。同窓会である以上、特に新しい成果が出なくても人だけ は集まってくる。会議が大きくなるにつれて予稿集は重くなり読む気を喪失さ せる。かくして年賀状は初期のイモ版画時代から印刷時代を経てタウンページ へと成長してゆくのである。

GIW2003における25件の口頭発表はシンガポールと韓国から約1/3、日本から約 1/3、残りが他の国という内訳であった。流行を反映してサポートベクトルマ シンなど機械学習を利用した解析の報告が多かったが、個人的にはBlast を上 回る高速アライメントツールPattern Hunterに興味をもった。 (http://www.bioinformaticssolutions.com/products/ph.php ) こうした日進 月歩の分野にあってGIWが来年以降も極端な拡大路線を避け、世界の年賀状 (クリスマスカード?)が集まる会議になってもらえると嬉しい。

2004: 5-6月号 タンパク質の出会い系

タンパク質の世界ではお見合い産業が大流行である。細胞内におけるタンパク 質の働きを見い出すためにネットワーク解析が盛んに行なわれているが、研究 に使われる実験データは「タンパク質の合コン結果」にほかならない。2ハイ ブリッドと呼ばれる手法では、行動をチェックしたいタンパク質に仲人(GFPレ ポーター) を用意し、どのタンパク質と物理的に結合するかを網羅的にテスト する。こうして得られたタンパク質どうしの関係(くっつく/くっつかない) はネットワークとして表現され、PPI(プロテイン・プロテイン・インタラク ション)ネットワークと呼ばれる。

案の定、酵母の2ハイブリッド法に基づくPPIは研究グループによって大幅に 異なることがわかっている。Ito et al.とUetz et al.2つの研究グループが 共通して相互作用すると見出したタンパク質はそれぞれの2割にも満たない [1]。本来一致すべきデータであるなら、合コン会場の様子がだいぶ異なって いたと言わざるを得ない。しかし中には捜し求めていた相手をうまく見つけた タンパク質もいるはずである。そこで最近、意味のあるペアを上手に抽出して タンパク質の機能予測に役立てる手法が発表されはじめた。

一つ目は似た機能がまとまった小集団を抽出し、その中に含まれる機能未知タ ンパク質も同じ機能だと類推する手法である [2]。合コンで医者どうし盛り上 がっているテーブルがあれば、その周辺は医療関係者だろうと推論する。簡単 なアイデアだが、小集団の選びかた(クラスタリングの一種)に工夫をこらす。 最適解を求める必要はないので、焼きなまし法などのアルゴリズムが用いられ る。

二つ目は、本人の相性以外の情報、つまり家柄や友人関係を調べ上げる興信所 方式である [3]。系統プロファイル(phylogenetic profile) と呼ばれる手法 は、各生物種で進化上保存されている遺伝子群を同定、機能予測につなげる。 機能的に関連した遺伝子群はまとまって保存される傾向にあるため、進化系統 樹とあわせて考えることで、1対1のBlastサーチでは検出できない微かな機能 的つながりを見つけ出せる。

こうして様々な手法が発表されてくると、次第に浮き彫りになるのは判断基準 の問題である。タンパク質の機能を言い当てられれば「よい」手法だと言われ るが、はたしてタンパク質の機能を私達は正しく把握、記述できているのだろ うか。今のところ、タンパク質のクラス分けにはMIPSデータベースの記述やGO オントロジーの記述、立体構造による分類などが採用されている。しかしそう した表記法の整備自体が学問の対象とされるくらい整理の足どりは遅いし、た とえ整備されたとしても、その基準はお見合いにおける学歴や年収、家柄など と似たり寄ったりかもしれない。

お見合いデータでは学歴や見かけが完璧な人でも、実際会ってみると性格が合 わないということはよくある話である。タンパク質の機能や立体構造もpHや温 度によって大幅に変化し得るのだから、お見合いくらい解くのが難しい(解け ない?)問題かもしれない。だからといってPPIの研究が不毛だというわけで はない。タンパク質の密会を報道するゴシップなどの裏ネタが尽きないほど、 研究者にとっては面白い分野なのである。いま世の中では離婚産業なるものが 出現しているが、タンパク質の世界でも離婚のスクープ記事がこれから増える に違いない。

[1] Ito T, Chiba T, Ozawa R, Yoshida M, Hattori M, Sakaki Y. "A comprehensive two-hybrid analysis to explore the yeast protein interactome" Proc Natl Acad Sci U S A. 2001, 98(8):4569-4574.
[2] Spirin V, Mirny L.A. "Protein complexes and functional modules in molecular networks." Proc Natl Acad Sci U S A. 2003,100(21):12123-12128.
[3] Date SV, Marcotte EM. "Discovery of uncharacterized cellular systems by genome-wide analysis of functional linkages." Nat Biotechnol. 2003, 21(9):1055-1062.

2004: 7-8号 100年の夢

遺伝子ファミリーや発現量の分布をシミュレーションで検証する論文が相次い でいる [1,2]。遺伝子の中立(ランダム)進化や「変化量がそのサイズに比例」 する過程(乗算過程)が「パワー則」を満たす、というこれらの研究成果は、 実に100年以上も研究者を魅了してきた話の一変奏曲にすぎない。

「パワー則」とは自然界における出来事の確率が、べき分布($p=k^{\gamma}$ の形) をなすという法則である。スケールフリー性とも呼ばれるが、古くから Paretoの法則、Zipf の法則と呼ばれてきたものと基本は等しい。例えば、英 単語を最もよく使われる順番に並べると$i$番目の単語の生起確率は$1/i$に比 例する(Zipf の法則)。都市を人口の順番に、または企業を収益の順番に並べ ると同じ現象が見られる(Paretoの法則)。こうした分布のlog-logプロットを とると標本点がきれいに直線上に並ぶ。

Paretoの法則は1896 年に発表されているが、これを世界的に有名にしたのは Zipfの著作(1949)および1950年代のSimon とMandelbrot の論争である [3]。 Mandelbrotは、言語が生まれるときに各単語の情報量を最適化する選択圧がか かってパワー則が成り立つと主張したが、Simon はそのような自然界の原則が なくても、細胞増殖に似た乗算過程でZipf の法則が成り立つことを示した。 また同時期にMillerは、サルがタイプライターをランダムに叩いているだけで も(単語を分けるためスペースバーだけは他のキーより打つ確率を高くする)、 Zipf則が成り立つことを示している [4]。

結局のところ、遺伝子やタンパク質のネットワークが満たすパワー則もランダ ム過程から生じているにすぎない [5]。それでもこの主題が100年以上長生き している理由は、log-logプロットが直線になるという整然とした美しさに陶 酔した研究者が、ランダムと異なる、自然界の大原則や構造が裏に潜んでいる と夢見ることにあるのだろう。

正体がランダム性だとはいえ、夢は世のためにもなっている。計算機科学の分 野ではランダムなネットワークの成立過程でもクラスターが生じる理由が明ら かにされたし、その性質はサーチエンジンなどに応用されはじめている。これ からの研究者は、こうして開発されたサーチエンジンを駆使して、昔と同じ議 論を繰り返す手間を省くことができるのである。Zipfの法則に興味のある人は、 まず参考文献3のウェブサイトを"Zipf's law"とググって(Google)もらいたい。

(注:乗算過程から生じる分布は対数正規分布といい、べき分布とは少々異な りますが、紙面の都合上話を簡略化させてもらいました。)

参考文献

[1] van Noort V, Snel B, and Huynen MA. EMBO Rep 5(3):280-284, 2004.
[2] Ueda, HR et al. Proc Natl Acad Sci U S A 101(11):3765-3769, 2004.
[3] Zipf G. "Human Behavior and the Principle of Least Effort" Addison-Wesley, Cambridge MA, (1949). 詳細はZipfの法則のウェブページ http://linkage.rockefeller.edu/wli/zipf/
[4] Miller GA. American Journal of Psychology, 70:311-314 (1957).
[5] Reed, WJ. Physical Review E 66:067103 (2002). http://www.math.uvic.ca/faculty/reed/ より取得可能。

2004: 9-10月号 天下の回りものか、先立つものか

平均的なアメリカ人は給料の2カ月分以下しか貯金していないらしい。これは 研究所でも同じで、(実際に何をしたのか筆者は知らないが)DNAシーケンサー で有名なLeroy Hoodが設立したInstitute for Systems Biology (ISB) は定収 入ゼロである。それでも年間予算は約2500万ドル、7つの研究グループと170人 以上のスタッフを抱えている (http://www.systemsbiology.org/ )。常に最新 のトピックをアピールして、自転車操業さながら競争的研究資金や企業献金を 稼いでいる。

ISBは毎年春にシンポジウムをおこなう。3回目を迎えた今年はNational Institute of General Medical Sciences (NIGMS; http://www.nigms.nih.gov/ ) の方針を色濃く反映していた。医学生物学の研 究を推進するNIGMSは、異なる分野や機関の研究者を「のり付け」して共同研 究させる大型研究資金Glue Grantや、システムバイオロジー向けの研究費 Complex Biological Systems Initiativesを審査する政府機関である。システ ムバイオロジーは今、こうした研究資金の題目にあわせて医療への応用、実用 化を強調する方向に進んでいる。

例えばISBシンポジウム講演者の一人で酵母遺伝子欠損株プロジェクトでも有 名なRonald Davis (http://www-sequence.stanford.edu/group/yeast_deletion_project/ )が、 Inflammation and the Host Response to InjuryというテーマのGlue Grant (http://www.gluegrant.org/ ) に参加している。SNPやDNAチップ解析により、 トラウマによる人の死を防ぐのが最終目標という。(しかし、DNAチップから 構成した遺伝子ネットワークは全く解釈できないとも話していた。)

また同じく講演者のPeter Sorgerがディレクターを勤めるMIT Computational and Systems Biology Initiative (CSBi; http://csbi.mit.edu/ ) はNIGMSに よりCenter of Excellence in Complex Biomedical Systemsの指定を受けてい る。CSBiでは実験的に得られたシグナル伝達経路のデータを400本の常微分方 程式を用いてシミュレートする試みがなされているが、最終目標はアポトーシ スの解析、さらにはガンの治療だという。

おこなっている内容と目標のギャップには驚かされるばかりだが、こうして資 金の流れを作り出すことは重要である。Glue Grantには他にもシグナル伝達ネッ トワークに関するAlliance for Cellular Signaling (AFCS)-Nature Gateway (http://www.afcs.org/ ) や、脂質代謝に関するLIPID MAPS (http://www.lipidmaps.org/ ) があり、大きな話題を呼んできた。(夢はそれ ぞれ、薬剤応答の細胞シミュレーションと、細胞内脂質の全ネットワーク解明 である。)とにかくニュースを作って資金を回す戦略なのだ。

これに対して我が国では、「回りもの」ではなく「先立つもの」という考え方 が強い。今年6月に文部科学省が「ゲノムネットワーク」と称するプロジェク トを立ち上げたが、当初より大幅に予算がカットされたらしく、転写因子の解 析を網羅的におこなうだけのプロジェクトになってしまった (http://www.mext-life.jp/genomenetwork/ )。特にバイオインフォマティクス 分野は、「ダイナミックな情報の交流システムを構築」や「ヒトを中心とした 統合データベースの構築」という漠然とした目標になってしまった。

本来は両者の中間に位置する目標が妥当だろう。後先考えずに突っ走るか、資 金にみあったペースを保つかは、お国柄の違いである。しかし、科学の分野だ と(貯蓄率と違って)手の届く目標設定をしているほうが「負けている」と感 じるから、不思議なものである

2004: 11-12月号 内容はハードに、基準はソフトに

ハードウェアアルゴリズムという言葉をご存知だろうか。ソフトウェアのアル ゴリズムを専用回路で実現し、低消費電力、しかも高速に解こうという分野で ある。家電や携帯電話には、パソコン用ペンティアムのように高価なCPU を搭 載する必要はない。お馬鹿なCPUと専用回路を組み合わせて、いかに高機能、 低消費電力、低価格を達成するかが腕の見せ所になる。

汎用性とハードウェア化はトレードオフの関係にある。最近の通信業界では規 格がどんどん変化し、また個々の規格で大量生産が望めないため、FPGA (Field Programmable Gate Array)とよばれる、中道をいくハードウェアが躍 進している。プログラマブルという名前のとおり再構成が可能なゲート回路で、 パソコン等で設計した回路図をFPGA にダウンロードすると、任意のハードウェ アを実現できる(ただし、速度は少し遅い)。試作品を作るときに便利で、携 帯電話などの設計には必ず使われる。ハードウェアの構成を進化的に改良でき るため、筋電制御の義手に搭載して患者一人一人について制御を最適化する技 術まで実用化されている(http://unit.aist.go.jp/asrc/asrc-5/ )。

あまり目立たないが、バイオインフォマティクスでも専用計算機が開発されて きた。古くは動的計画法を解くための専用機に始まり、BLASTを高速計算する 専用機まで商品化されている(例えばタイムロジック社 http://www.timelogic.com/ )。 そしてこの夏、Nature BiotechnologyにFPGA による細胞シミュレーションの高速化が載った。著者の一人はたんぱく質の 3D-1Dプロファイルでも有名なDavid Eisenbergである [1]。

アイデアはいたって簡単。数理モデルとして微分方程式を解くのではなく、個々 の分子数をそのまま確率的に増減させる(stochastic)シミュレーションを考え る。例えば反応

        A + B → S

を(分子Aの数 > 乱数)&(分子Bの数 > 乱数)&(反応速度定数 > 乱数) という条件で進めれば、定数項をうまく設定すると化学反応のシミュレーショ ンになっている(図1)。乱数発生器もFPGAで作れるため、FPGA のサイズに 比例した量の反応式を、ソフトウェアのアルゴリズムに較べて10倍以上高速に 実行できる。論文では、11反応が関与する原核生物のlacZ 遺伝子発現シミュ レーションをおこない、有名なGillespie アルゴリズムと結果が一致すること も確認している。

これまでの専用機の歴史をみても、FPGAの単純利用が確率的シミュレーション の主流になるとは考えにくい。しかし、巨大なPCクラスタを用いた細胞シミュ レーションのプロジェクトもある位だし、スピード狂やメカおたくにはたまら ない魅力を放つのかもしれない。内容や実用性はさておき、こうした論文が Nature Biotechnology に載るのは驚くべきことである。なぜならこの論文は ぜんぜん自然科学ではないのだ!この雑誌は今年度からComputational Biology というセクションも設け、バイオインフォマティクスの論文も柔軟に 受け付けるようである。PRIMERと題される初心者向けの解説記事まで載りだし た。今後、特に注意したいコーナーのひとつである。

[1] Salwinski, L & Eisenberg, D. In silico simulation of biological network dynamics, Nat Biotechnol 22(8) 1017-1019, 2004

Bioテクノロジー ジャーナル(隔月刊) バイオテク ムーブメント欄, 羊土社

2005: 1-2月号 ゴミの中から一億円

モチーフという言葉は文様や楽曲において繰り返し使われる構成単位を意味す る。バイオインフォマティクスでは最近、ネットワークモチーフという言葉が でてきた。生体ネットワークに”頻出”する、特定の機能を担う相互作用パター ンのことらしい。たとえば、微生物の遺伝子転写制御ネットワークでは フィー ドフォワードループ(FFL)と呼ばれる構造が多く現れる。だから何だい、多 く見つかるだけで実際の機能は何もわからないではないか、という貴方は至極 まっとうな生物学者である。生物学とは個々のタンパク質や配列機能を具体的 に調べてきた分野であり、周りにごろごろしている要素なんてゴミなのである。 例えばヒトゲノムの約半分はリピート配列と呼ばれる頻出パターンである。こ れらは実にひどい扱いを受けている。配列のACGTがわかっていても全てNで置 き換えられて公開される。研究者の目に触れることすら禁じられた、究極のゴ ミ扱いなのである。

ネットワークモチーフという言葉を使い出したのはUri Alonが率いる研究グルー プである(http://www.weizmann.ac.il/mcb/UriAlon/ )。彼らは大腸菌、枯草菌、 酵母の転写制御ネットワークにおいて10数種のモチーフの出現頻度を調べ、 微生物間に驚くほど共通したモチーフ組成があることを示した[文献1,2]。当 然ながら、保有するモチーフ組成が異なるネットワークも存在する。ショウジョ ウバエやウニの転写制御ネットワークは、線虫の神経回路やSTKEと呼ばれるデー タベース(http://www.stke.org/ ) に登録されるシグナル伝達経路と類似のモチー フ組成を示す。また、自然言語において隣接する単語を結んだネットワークは、 英語、仏語、西語、日本語で共通したモチーフ組成を示す。つまり、ネットワー クのタイプ毎に異なるモチーフ組成が存在し、いずれもランダムネットワーク のそれとは明らかに異なるらしい。

だから何だい、である。進化はランダムじゃないから異なって当然である。そ こをAlonらは、モチーフの統計量がランダムネットワークと異なる理由は「進 化における淘汰の影響」だと言い出したのである。進化という言葉は生物学に おいて印籠のような影響力を持つ。これを出されると、たいていの生物学者は 訳もわからずひれ伏してしまう。批判できる猛者もいることはいた。例えば、 進化の複雑さにはるかに及ばない単純モデルでもFFLは頻出する等など[文献3]。 しかし提唱者のAlon らは反論する。単純な理論モデルで全てを説明しきれな い以上、進化による淘汰の可能性は捨てきれないと。まさに印籠である。

少なくとも筆者には、単純な統計で見つけたモチーフが生物学的に重要だとか、 進化の真髄を反映するなんて思えない。(ヒトゲノム中でリピート配列が一番 重要だといっているようなものである。)むしろAlonらの偉いところは、見事 な視点によりゴミの山から論文の山を築いているところなのである。いまや Alon 流の統計処理がバイオインフォマティクスのモチーフになりつつあり、 計算機による統計だけでNature誌にもScience誌にも載るようになった。この 啓蒙活動こそがAlon らの偉業ではなかろうか。

[1] Milo, R. et al. Science 298(5594) 824-827, 2002.
[2] Milo, R. et al. Science 303(5663) 1538-1542, 2004.
[3] Artzy-Randrup Y et al. Scinece 305(5687) 1107, 2004.

2005: 3-4月号 未来予想図

未来予想はあまり研究らしくない話題ではあるが、面白い。オミクス(omics) とも呼ばれる網羅的研究の中で、酵母(Saccharomyces cerevisiae)はとりわけ 解析が進んでいる生物である。Yeast Proteome Database (YPD; http://proteome.incyte.com/ )によると、酵母の遺伝子機能が現在のペースで 解明され続ければ、2007年の4月には約6000ある酵母遺伝子の全てが「わかっ た」(known)とされるらしい[1]。ヒトゲノムの例を考えると、その時期は更に 早まる可能性さえある。

例えば1992年にCyrus Chotiaはタンパク質の立体構造(フォルド)は1000 種 だと言い出した(当時の既知フォルドはおよそ100個)[2]。その後立体構造の 研究は爆発的に進んだが、800個を機に新規フォルドは見つかりにくくなって いる。どうやら1000という数は大御所の妄言だとは言い切れないらしい。では 2007年には酵母の機能が全て「わかり」、システムバイオロジーの全盛期を迎 えるのだろうか。

悲観的な予想では、実験ベンチに向かい続ける日々は2007年以降も延々続くら しい。Saccharomyces Genome Database (SGD; http://www.yeastgenome.org/) によると、現在Gene Ontology(GO)によって注釈されている酵母タンパク質の 実に40%がunknown molecular functionである。また、30%がunknown biological processに関与するとされる[1]。システムバイオロジーに重要な、 立体構造レベルから入手できる相互作用データは1000 個に満たない。では、 立体構造までわかっている相互作用データから、未知の相互作用がどのくらい 残っているか推定したらどうなるだろう。

まず、既知のタンパク質相互作用を立体構造のバリエーションをもとに分類す ると全部で1800個になる。次に、タンパク質ファミリーの情報を基にして全生 物種をあわせた相互作用タイプの数を外挿すると、多くて10000 タイプになる。 つまり、我々が現在知っている相互作用タイプは全体のわずか1/5という結果 である[3]。酵母に限ってみても、約2/3 が未知と考えられる。毎年明らかに なる新規の相互作用タイプは高々2-300個なので、酵母の機能情報をあと数年 で知り尽くすのはまず無理だろう。

立場によって予想図も大きく変化するオミクス研究だが、全ての機能情報を明 らかにしたいというシミュレーション屋さんの夢(dreams)は遅かれ早かれかな うと思われる。最近の世界経済が二極化しているように、研究費においても貧 富の差は拡大する一方である。そしてオミクスこそ、研究費を総ざらいする一 握りのブルジョワジーがこぞって推進する研究テーマなのである。これからの 時代、日々の研究費をこつこつ稼ぐにはまずグラントーム(grantome)について 学ばねばならない。(この言葉を初めて用いたのは酵母研究者である伊藤隆司 氏である。)ただ、そう悲観する必要もないだろう。全機能情報に向けてデー タを生産するのは、いつもいつでも我々プロレタリアートなのだから。GO FOR IT!

[1] Hughes, TR. et al. Current Opin. Microbiol. 2004, 7:546-554.
[2] Chotia, C. Nature 1992, 357:543-544.
[3] Aloy, P. & Russell, RB. Nature Biotechnol. 2004, 10:1317-1321.

2005: 5-6月号 ライフドア

バイオインフォマティクス(BI)を極めるには、情報系、生物・医学系の総合知 識が必要になる。領域横断的な学問を学びにくい日本の学校教育の中で、学生 や研究者をどう育成するかは大きな課題とされている。文部科学省は平成13 年度から、BI分野のプロフェッショナルを養成するプログラム(科学技術振興 調整費の一部)を実施し、16 年度までに10 の大学部局を採択、現在も募集を 継続する。それぞれの拠点では、大学における通常授業に追加する形でいわゆ る「BI 総合学習」を実施している。初期に採択された拠点は既に中間評価を 終え、おおむね「ビジョンを持って質の高い学生や研究者を輩出する授業をし ろ」と言われているようだ。養成人数や、その人たちの到達スキルまでが評価 対象になっている。

こんなことを言われるようでは養成する側も大変である。数億円ずつばらまく だけで一流の研究者が筍のように生えてきたら、日本の科学はとっくに世界制 覇を遂げているだろう。ましてBIとは何かも定まっていない時期に、数年で優 秀な人材を育成しろとは無理難題もいいところである。そもそも、プログラム を履修した学生が優秀になったかどうかをどう測れというのだろう。

分野を成功させる秘訣は、多くの学生に興味を持ってもらうことに尽きる。日 本のサッカーが強くなった理由は(潜在的に)スポーツに優れる若手がサッカー を目指すようになったからである。サッカーの練習法が良くなったからではな い。アメリカのBIが強い理由はBIを志す学生の圧倒的な層の厚さと、それを支 えられる社会の厚さである。たかだか数百時間の授業内容ではないのである。

もし人材を増やしたかったら社会の受け皿から作らなくてはならない。今BIを 学んでも企業の就職口は多いとはいえないし、研究職の数も少ない。普通の学 生なら、人材養成を実施する先生達みたいに薄給でキツイ仕事をこなすより、 大学を見限って第二のホリエモンになるほうが魅力的に感じるだろう。いつの 時代も若者はヒーローに憧れるのである。人材養成プログラムによってどんな ヒーローが生まれているだろうか。どんなキャリアパスを学生に伝えられてい るだろうか。文部科学省にはぜひこの点を考えてもらいたい。人材養成にこそ 「ゆとり教育」が必要である。人材養成プログラムは、学生が自分の将来につ いてビジョンを持てる入り口(ドア)として機能すべきなのだ。

今のままでは上がりそうにないBI株だが、当事者として宣伝させていただこう。 採択拠点の多くは、講義内容をインターネット上で発信するなど様々な努力を 行なっている。役に立つ授業資料が掲載されているサイトもあるので、ぜひ多 くの人に活用してもらいたい。

16年度までの全採択拠点

・生物情報科学学部教育特別プログラム(東京大学)http://www.bi.s.u-tokyo.ac.jp/ ・生命情報科学人材養成コース(産業技術総合研究所)http://www.cbrc.jp/training/ ・システム生物学者育成プログラム(慶應義塾大学)http://www.bio.keio.ac.jp/ ・蛋白質機能予測学人材養成ユニット(奈良先端科学技術大学院大学)http://isw3.aist-nara.ac.jp/IS/Bio-Info-Unit/home-ja.html ・ゲノム情報科学研究教育機構(京都大学)http://www.bic.kyoto-u.ac.jp/egis/index_J.html ・クリニカルバイオインフォマティクス人材養成ユニット(東京大学)http://cbi.umin.ne.jp/ ・クリニカルバイオスタテッスティックスコア人材養成ユニット(久留米大学)http://www.med.kurume-u.ac.jp/med/gmed/bio/index.html ・システム生命科学人材養成ユニット(九州大学)http://www.sls.kyushu-u.ac.jp/kyouiku.html ・クリニカル・ゲノム・インフォマティクス(神戸大学)http://www.tri-kobe.org/clinical-genome/ ・農学生命情報科学の大学院教育研究ユニット(東京大学)http://www.iu.a.u-tokyo.ac.jp/

参考:

文部科学省 科学技術振興調整費のホームページ(採択課題、評価など) http://www.mext.go.jp/a_menu/kagaku/chousei/index.htm


2005: 7-8月号 研究の産業構造

インターネットが普及し、論文や雑誌の評価も株価のように短期で上下する時 代になった。引用数が高い論文はますます引用される。有名雑誌はますます有 名になる。こうなると、地道な製造業型の研究より「波に乗る」ことを重要視 するサービス業型の研究が表にでてくる。

スケールフリーという言葉をご存知だろうか。ちょうど一年前の号にも関連記 事を書かせてもらったが、自然界における出来事の確率がべき分布、すなわち y=xγ の形をなすときに見られる性質である。べき分布はlog-log プ ロットをとると標本点が傾きγの直線上に並ぶ (log y = γlog x)。 さらにx軸の尺度をK倍変更しても(x = Kx') この傾きが変化しない (log y = γ log x' + γ log K)。つまりx軸のスケーリングに依存しないから スケールフリーという。

これまで、自然界のネットワークは軒並みスケールフリー性を持つと喧伝され てきた。インターネットから、伝染病の感染経路、タンパク質や代謝ネットワー クまでスケールフリーとされている [1]。しかし驚くべきことに、このスケー ルフリーという言葉、ネットワークにおける正確な定義がなされていない [2]。 文字どおりに考えると、スケールに依存しないのだからネットワークを巨視的 に見ても微視的に見ても同様の構造が観測できることを意味するはずである。 しかし大抵の論文は、頂点におけるリンクの接続数の統計がべき分布になれば 「スケールフリー」と言ってしまう。これは早とちりである。リンクの接続数 の分布が揃っても、リンク先をどこにするかに任意性が残されている。したがっ て意地悪なネットワークを考えると、べき分布をなしても巨視、微視的な見方 で異なる構造を持たせることができる [2]。最近の結果では、代謝のネットワー クは、スケールフリーどころかスケールによって構造の異なる「スケールリッ チ」なネットワークであることが明らかになっている [3]。代謝のように淘汰 圧の高いネットワークでは、生化学的に意味のあるリンクだけが張られるため にリッチになるらしい。

そもそも、生体ネットワークがスケールフリーだとすると、細胞内小器官から 細胞レベル、さらに組織レベルまで類似のメカニズムに支配されることにつな がるから、なかなか信じがたいことではあった。しかし流行とは恐ろしいもの で、比較的簡単に示せるスケールフリー性がもてはやされるや否や、肯定する サービス論文が怒涛のごとく発表されてしまう。それはさながらバブル経済の ようである。今回のスケールリッチな話が、バブルの泡をはじけさせるのか、 バブルの波に飲み込まれてしまうのかは、まだわからない。今後、製造業型の 研究価値があまり下がらないとよいのだが。

1. バラバシ, AL (2002) 「新ネットワーク思考」(青木薫 訳) NHK出版
2. Li, L, Alderson, D. et al. (preprint) arXiv:cond-mat/0501169
3. Tanaka, R Phys. Rev. Lett. (2005) 94:168101

2005: 9-10月号 進化する国際会議

日本のバイオインフォマティクス(BI)分野は元気がない。確固とした証拠 があるわけではないが、ヒトゲノムの解読完了以降、何となく活気が失せた。 しかし海外の国際会議に参加すると、そんな雰囲気を吹き飛ばす勢いを感じる ことができる。

今回、実に3年ぶりにBI最大の国際会議ISMB2005 (http://www.iscb.org/ismb2005/)に参加した。場所はミシガン州デトロイト。 BI分野の広がりを受け、ISMBでは昨年から本会場を2つ並行して進める プログラムになったらしい。査読つき論文発表の採択率が13%というハイレ ベルな学会で、日本人がほとんど採択されないことでも名高い。

ISMBは国際学会ISCB(http://www.iscb.org/ )のドル箱会議であるため、 新規学会員の獲得を狙って様々な試みをおこなっている。チュートリアルの開 催はもちろんのこと(今年は14テーマ)、昼休みの空き会場では会議開催中に テーマが決まるBirds of Feather(BOF)討論会や、NIH(National Institue of Health), NSF(National Science Foundation), DOE(Department of Energy)の人を招いた「グラントの取り方講座」、「今後の国家プロジェク ト講座」なども開かれている。つまり、文科省や経産省のお役人が若手研究者 を相手にグラントの書き方や審査方式を講義してくれる。これは凄いことであ る。日本でも産官学連携という言葉はよく聞くが、グラントの説明会を学会中 に見ることはない。

キーノート講演以外は本会場から参加者が分散する点も注目に値する。参加者 は1000人を越えるはずなのに本会場には100人程度しか集まらない。そ の原因は、ポスターから選ばれる口頭発表(採択率7%)とソフトウェアデモ を扱う7つの小会場にある。こうした小会場の人気は、テーマが細分化してき たことを反映している。分野として十分大きく育ったので、そろそろ分裂する 時期に来ているのかもしれない。その証拠に、本会議にまさる活気を示したの が直前におこなわれるサテライト会議(SIG)である。SIGとは当該分野 に興味を持つ人が集まるSpecial Interest Group の略で、計算機科学の伝統 である。今年は選択的スプライシングや機能予測をテーマにした8つのSIG 会議が並行しておこなわれた。筆者が参加したSIGBiopathways 会議では、 タンパク質の相互作用ネットワークと遺伝子発現量をあわせた解析で2種類の ハブが同定できるという発表や、頂点と接続数の関係がべき分布でなく幾何分 布であるという、スケールフリー性を否定する発表など、最新のトピックがほ ぼカバーされていた[1,2]。

ISMBのすごいところは、SIGのようなプログラムや口頭発表の採択形式 が刻々と進化しているところである。あくまで一流の国際会議なのだが、イベ ント的要素もふんだんに盛り込まれている。日本のBIに活気が失せたように 見えるのは、こうしたダイナミズムが感じられないからであろう。日本のBI 分野も単にアカデミックな雰囲気から一歩踏み出し、活気を取り戻す工夫が必 要ではないだろうか。

[1] de Lichtenberg, U., Jensen, L.J. et al. Science 307, 724-727, 2005.
[2] Przulj, N., Corneil, D.G. et al. Bioinformatics 20(18), 3508-3515, 2004

2005: 11-12月号 研究の副作用

バイオインフォマティクスの研究対象は幅広い。したがって、さまざまな関連・ 派生分野が存在する。DNA コンピューティングと呼ばれる分野では、生体分子 の形態変化や自己会合を利用して、並行計算や自己組織化といった計算機科学 分野の情報処理を実現しようとしている。例えば、短いDNA フラグメントの配 列を巧妙に設計し、数本で平面状のタイルを構成するように設定する。2次元 にうまく敷き詰められるようにタイルを用意して反応条件を整えると、さまざ まな構造やタイルパターンの生成を制御できる。これは今、DNA ナノテクノロ ジー分野とも呼ばれる技術に成長した[1]。また最近は、分子通信というアプ ローチもあるらしい。こちらは生体分子の化学反応を情報伝達にみたて、新し い通信機構の開発に応用しようとしている[2]。

真の融合領域とか、ブレイクスルーと呼ばれる発見のたぐいは、こうした新し い試みから生まれてくるのかもしれない。今の新興分野は計算機科学のアイデ アが底流をなす場合が多いようだ。計算機科学が全盛期を過ぎつつあり、多く の研究者が新しい研究テーマを模索していると思われる。しかし、計算機科学 の知恵が必ずしも成功への鍵にはならないこと、努力や研究費の量が必ずしも 成果につながらないことを痛感するのが、創薬の世界である。候補化合物から 新薬が実用化される率は1万分の1とも言われ、計算機によるハイスループッ ト解析が可能になった今もほとんど改善されていない。臨床開発試験には3つ のフェイズがある。フェイズⅠとⅡは少数の患者に対して有効性を確認する段 階で、新しい抗がん剤や中枢神経系用剤(抗うつ剤など)は多くがこのフェイ ズに属する。それに対してフェイズⅢは多数の患者を対象に試験をしている段 階で、このフェイズをパスできる新薬はごく僅かである。業界第2位のグラク ソ・スミスクライン社を牽引するAllen Roses 氏が8月末に開催されたCBI 学 会全国大会の基調講演で強調したのは、まさにその点であった [3]。いかにフェ イズⅢをパスできるかが、ゲノム創薬成功の鍵であると。

製薬企業では研究開発費の多くが水泡に帰してしまう。それでも大手企業の研 究開発費が総売上の15 から20%に達するほど重要視される理由は、偶然できて しまう副産物的ヒット商品も無視できないからではなかろうか。例えば業界第 1位のファイザー社が売り出す勃起不全治療薬のバイアグラも育毛剤のプロペ シアも、もとは血圧降下薬の副産物である。バイオインフォマティクス研究に も同じことが言えそうだ。分子計算とか分子通信といった、計算機科学者が試 みるアプローチには、分子生物学や医学の人から眺めると意外な利用法がある のではないだろうか。手柄は発見した人のものだから、宝の山と思って眺めて みてもらいたい。

[1] DNAナノテクノロジーの学会HP http://www.cs.duke.edu/~reif/FNANO/
[2] 須田達也ほか 日経バイト 9月号 page 68, 2005
[3] CBI学会のHP http://www.cbi.or.jp/

2006: 1-2月号 なんちゃってバイオインフォマティクスのすすめ

インフォマティクスからバイオの世界に入って驚くことの一つに学術論争があ る。生物学は不完全なデータをもとに仮説を主張しあう学問なので、ダーウィ ンに始まるその歴史は「このアプローチによる結果は間違っている」という、 訂正の系譜でもある。しかし、真っ向から訂正していると学問としての積み重 ねが無くなってしまうので、知名度の高いドグマであれば、誤ったコンセプト でも教科書で語り継ぐという宗教的側面も持つ。それでも生物学が理系に属し てこられた理由は、生命という、自然界に実在するモノを扱ってきたからであ る。ところが、バイオインフォマティクス(BI)という流行は、かろうじて 保ってきたこの理系性を、人知れず、いとも簡単に洗い流してしまった。そも そもBIとは解析の手法を研究する学問である。しかし最近、データベースに 蓄積された情報を処理する、モノを扱わない生物学(以降、なんちゃってBI と呼ぶ)も指すようになり、文系以上に文系らしい宗教論争が繰り広げられる ことになる。

ここ数年白熱している面白いトピックのひとつが、タンパク質の進化速度であ る。発端は、今から30年も前の「欠損すると生存に影響が出る重要な遺伝子ほ ど、進化速度は遅くなる」という仮説である[1]。その後ゲノム情報が手に入 るようになり、Hurstらがヒトとマウスの相同遺伝子比較でこの仮説が成立し ないことを示した[2]。それに対しHirshらは、酵母でこの仮説が成立するとし た[3]。そこでHurstらは発現量が多い遺伝子ほど進化速度が遅いことを示し、 遺伝子発現量こそ進化速度に影響する因子だと主張した[4]。最近、Hirshらは 4種の酵母ゲノムを比較し、進化速度は遺伝子発現量と重要度の両方に独立に 依存するという折衷案に至っている[5]。この論争はまだ続いており、遺伝子 の機能ではなく発現量こそ重要だという報告も最近出た[6]。

この宗教論争を世の中では、網羅的データに基づいたBI解析と呼ぶ。しかし、 数学やインフォマティクスの人から見ると、とどのつまり、偏ったデータに基 づいたピアソン相関値について水掛け論をしているにすぎない。近い将来にデー タが更新されれば、結論はすべてひっくり返る可能性があり、これまでの様々 な考察もアイデアも(全てではないにしても)昔話になってしまう。こうした 研究がモノに基づかない生物学「なんちゃってBI」であり、オミクスに基づ くBI研究の大半を占める。

当然のことだが、なんちゃって版のほうが本物より面白い。理論的側面にこだ わるBI研究は枝葉末節に拘泥しがちである。進化について想像をかきたてて くれる宗教論争のほうが楽しいし、社会の興味もひきやすい。そもそもタンパ ク質の進化速度なんて現代社会にはどうでもよい内容なのだから、たくさん論 争をして、世の中に研究のドラマを提供したほうが勝ちなのだ。しかし、こう した宗教ドラマ作りこそ、日本人が最も苦手とする分野である。筆者も論争を 傍目に見ては感心するばかりの日々なのだが、もっと宗教にどっぷり浸かれる ようでないと、いわゆる一流誌には載れないだろう。

[1] Wilson AC, Carlson SS, White TJ (1977) Annu Rev Biochem 46:573-639
[2] Hurst LD, Smith NG (1999) Curr Biol 9:747-750
[3] Hirsh AE, Fraser HB (2001) Nature 411:1046-1049
[4] Pal C, Papp B, Hurst LD (2003) Nature 421:496-497
[5] Wall DP, Hirsh AE et al. (2005) PNAS USA 102:5483-5488
[6] Drummond DA, Bloom JD et al. (2005) PNAS USA 102:14338-14343

2006: 3-4月号 分野を超える変身ヒーロー

Ehud Shapiroはイスラエル人だが、日本の第五世代コンピュータプロジェクト (1982-92)における立役者の一人である。第五世代プロジェクトとは「考える コンピュータの実現」を目標に通産省が先導した10年計画で、述語論理の推論 を並列実行できるコンピュータや、その中核となる並列論理プログラミング言 語GHC(実用版はKL1)が開発された。その論理型言語の設計において、完成版 に近いお手本だったのがShapiroの作った言語、Concurrent Prologであった [1]。つまり彼は、500億円プロジェクトの中身を一人で先にやっていたような 人物なのだ。その後、並列Prolog言語によるメッセージ通信を扱うベンチャー 企業を創設し、最終的にはAOLやIBM に買収してもらっているから、今は大金 持ちに変身したのだと思う。

こうした先見性を持つ人は他にもたくさんいるだろうし、特に珍しい話ではな い。しかしShapiroの偉いところは、その後に分子生物学を独学で学んでアカ デミア、しかも異分野に戻ってきた点である。彼が目をつけたのはDNA計算。 ヘアピン構造をとるDNA分子を巧妙に用いて、特定のmRNA が多く存在するか否 かをYes/Noで判定する分子機械を設計した。そして遺伝子発現が一定のパター ンをとる場合にのみ、薬剤として働く機能性DNA(今のところ仮の配列)を高 い確率で放出するシステムを実現した[2]。研究スタイルは着実で用意周到。 DNA 計算の分野には計算機科学出身の人も多いので、まず‘帰ってきた Shapiro’に驚き、そしてアイデアに感心したのであった。

そのShapiroはバイオインフォマティクスも手がけており、高等真核生物の細 胞系譜を再構築するという論文を出している[3]。試算すると、ヒトやマウス のマイクロサテライト(MS)部位には、一回の細胞分裂あたり50の突然変異が 入るらしい。体細胞におけるMS部位の突然変異を解析すれば、進化系統樹と同 じ手法で細胞系譜を描けることは想像に難くない。DNAのミスマッチ修復遺伝 子をノックアウトした細胞株であれば、MS部位を800箇所読むことで、40回体 細胞分裂をした後でもほぼ間違いなく細胞系譜を再構築できるらしい。(40回 の体細胞分裂とはマウスの新生児に相当する。)理論におわらず、細胞サンプ ルを自動処理する装置まで作って有効性を実証している点も、Shapiroの偉い ところである。

論文には、ヒトの細胞系譜プロジェクトに役立つだろうとある。遺伝子の個体 差どころか、個体内の差を解析するプロジェクトとは、いかにも実現されそう な話ではないか。オヤジ世代が待ち望むヒーロー復活なるか。

[1] Shapiro, E. ACM Comput Survey 21:413-510, 1989.
[2] Benenson, Y et al. Nature 429:423-429, 2004.
[3] Frumkin, D et al. PLoS Comput Biol 1: 382-394, 2005.

2006: 5-6月号 切手収集でエーンデすか

バイオインフォマティクス(BI)が始まって20年、ヒトゲノム読了から5年が 経った。この間、BIはおそろしく幅広く、かつ曖昧な学問へと発展した。オン トロジー併合はその好例だろう。そもそもオントロジーとは「特定分野で使わ れる語彙どうしの関係を体系化した定義集」という意味の哲学用語であった。 しかし、機械可読性を強調することで計算機科学の風味をおび、扱う文献を生 物系に限定したことで、BIの一部であるかのように扱われている。ネットワー ク研究の併合もしかり。インターネット等を題材に発展した理論を生物系のデー タに適用しただけで、生体ネットワーク解析と呼ばれるBIの一分野になってし まう。そして今、質量分析の世界もBIと交わりつつある。5月に開催される日 本質量分析学会の総合討論会プログラムを見ると、プロテオミクス、メタボロ ミクスという言葉のほかにも、生物学に関連したトピックがずらり並んでいる。 「質量分析用語」と題されたオントロジーのワークショップまである。これら の研究はそのままBIと言っても通用しそうである。

BIが、ネバーエンディングストーリーの「虚無(nicht)」さながら既存世界を 次々に飲み込むスタイルは、計算機科学から受け継いだ血統かもしれない。し かし20年を経た今でもBIの教育内容は定まらないし、「BIとは何か」という 議論も尽きない。良い教科書も少ないし、検定試験や大学のカリキュラム作り をする人は苦労の連続である。明らかに、計算機科学とは何かが異なっている。

その違いとは「BIが本質的な抽象化を目指さない」点だろう。計算機科学や理 論物理学の真骨頂は枝葉を抽象化して純化するプロセスにある。しかしBIでは、 せっかく純化した理論を再度どろどろの現実に当てはめて侃々諤々(かんかん がくがく)するところも重要なのだ。自然を対象にする以上、避けられない足 枷である。

虚無の中から進むべきひとつの方向は、オミクスデータに基づく、工学を視野 に入れたシステムバイオロジーだろう。本当の意味での「生物工学」という分 野ができつつあるように思う。昨年創刊したばかりのMolecular Systems Biologyという雑誌は、この志向を非常によくあらわしている。2月には奈良先 端大と慶応義塾大に所属する森グループ渾身の大作、大腸菌の全遺伝子ノック アウトライブラリーの論文が発表された[1]。大腸菌には約4400個のORFがある が、いまだに1800個が機能未知である。今回、303個の生育に必須なORFが同定 され、その機能分類も明らかになった。多くは転写や翻訳、分裂や膜形成に関 するものだが、補酵素合成や脂質代謝などにも多い。科学面でも公共リソース 面でも、シミュレーション研究を含むすべての微生物研究に大きなインパクト を与えるだろう。

原子物理学の父ラザフォードは"All science is either physics or stamp collecting."と言った。システムバイオロジーは生物学にどこまで物理寄りの 道を歩ませることができるだろうか。

[1] Baba, T. Ara, T. et al. Mol. Sys. Biol. (2006) doi:10.1038/msb4100050

関連リンク

Gene Ontology http://www.geneontology.org/

質量分析学会総合討論会 http://db1.wdc-jp.com/mssj/conf/

文科省ライフサイエンス http://www.lifescience-mext.jp/

Molecular Systems Biology(オープンアクセス) http://www.nature.com/msb/

2006: 7-8月号「その時」歴史は繰り返す

配列の相同性検索がこれほど隆盛を極める理由は、相同性に基づく機能推定が 成功しているからである。配列の比較手法は、Jukes/Cantorや木村による塩基 突然変異のモデル(分子進化学)、Needleman/Wunschによるダイナミックプログ ラミング(計算機科学、ただしNeedlemanとWunschは生物学者)、Dayhoff や Henikoff によるアミノ酸置換マトリクス(分子生物学) という堅牢な理論の上 に成り立っている。つまり、同一の塩基/アミノ酸配列に由来する配列どうし が近くなるように進化距離が定義されており、その距離における最適なアライ メントを正確に計算する仕組みができている。

当たり前に思われる理論ほど、発見の「その時」には様々なドラマがつきもの である。百家争鳴の研究分野で誰の名前が残るかも、時の運によるところが大 きい。例えば、今でこそSmith/Watermanアルゴリズムと呼ばれる手法は、 Stanislaw Ulam やWalter Goad, Peter Sellersらの名前を冠していてもおか しくない。そして今、「その時」を迎えるテーマといえば、生体ネットワーク の比較問題ではないだろうか[1]。

たんぱく質の網羅的な相互作用データはウェブから入手できる。ネットワーク を生物種間で比較することで構成要素の機能が解析できたら、相同性検索に比 肩する成果を出せる。そう思う人はたくさんいて、比較のアルゴリズム部分は 計算機科学の分野で盛んに研究されている。ただし、基本的に部分グラフの相 同性というNP-hard問題に属するので、良いアルゴリズムの設計は難しい。残 されている課題は、ネットワーク頂点間の距離をいかに定めるか、そして、そ れをネットワーク探索のアルゴリズムといかに組み合わせるかであろう。

この問題に対し、複数生物種で共通するネットワークの評価スコアを Needleman/Wunschと同様に

 ∑(マッチ数) - ∑(ミスマッチ数) - ∑(重複数)                 (重複は配列のギャップペナルティに相当)

と計算する手法[2]や、Blastのようにランダムネットワークの中で観測される 確率(P-value)を計算する手法[3]が提唱されている。しかし、いずれも配列比 較で生み出されたアイデアの転用という雰囲気は否めず、「その時」となるブ レイクスルーはまだない。

過去の研究をひもとくと、人の発想は今も昔も全く変わらないことがわかる。 配列比較という分野を生み出した前出のStan Ulamは、30年前にネットワーク 比較の基準も考案している。生体ネットワーク解析に、ネットワークのいわゆ るUlam分解が役立つ時がきたら、今度こそ貢献者として名前を残したいものだ。 最後に、GoadによるUlamへの追悼文の末尾を紹介しよう。

Speaking of sequence analysis, Genbank, and all that, Stan once said, "I started all this." Yes.

参考文献

[1] R. Sharan & T Ideker Nature Biotechnol. 24(4) 427-433, 2006.
[2] M. Koyuturk et al. Proc. 9th RECOMB Conference 48-65, 2005.
[3] R. Sharan et al. J. Comput. Biol. 12, 835-846, 2005.

Ulamの功績については以下の追悼号を参照してほしい。 LOS ALAMOS SCIENCE, NUMBER 15, 1987 Special Issue, Stanislaw Ulam 1909-1984 http://library.lanl.gov/cgi-bin/getfile?number15.htm 余談だがKEGGの金久實教授(京都大学)はGoadの一番弟子である。

2006: 9-10月号 複雑系としてのシステム生物学

システム生物学という言葉ほど眉唾なものはない。その定義として「これまでの生物学は個々のたんぱく質や遺伝子といったパーツの研究であったが、今後はそれらを総合的に捉え、システムとして生命を研究する新しい学問」という文句をしばしば耳にするが、こんな定義は、生物学をつくりあげてきた偉大な、今は亡き研究者たちへの侮辱である。生理学などにおける積み重ねを知らない無知な研究者ほど、システム生物学と言って騒いでいる。

ヘルシンキで開かれた酵母の国際会議The 25th International Specialised Symposium on Yeasts[1]でこう言い切ったのは、米国バークレー、分子科学研究所のRoger Brentである。典型的なアメリカ人といえる性格で、発酵や微生物工学といった専門外のトピックにも盛んに質問を繰り返し、会場全体を盛り上げた。この人自身は細胞内分子を定量するためのタンパク質とDNAのハイブリッド分子"Tadpole"[2] の開発者であり、分子ネットワークをシミュレーションするプロジェクトの中心人物でもある。世の中からみれば彼こそシステム生物学者であるため、ことさらにインパクトのある講演だった。

彼の意見は全くその通りである。システム生物学といっても、これまで細胞生理学とか、細胞生物学と言われてきた分野に計算機が導入されただけである。しかも計算機は実験系研究者のアイデアの再確認に使われるだけで、研究の本質的な部分ではない。大規模データを取り扱えるようになったとはいえ、信頼性の低いデータを統計処理したところで生物学的に面白い結果は出てこない。(統計と予測の違いがよく理解できない人は、経済学者に質問するとよい。)

システム生物学というパラダイムの現実的に重要な機能は、生物学実験の自動化、大規模化を促したこと、多額の研究資金を引き出したことにある。同じくらい信頼性の低いデータでも、大学院生が出した結果では論文にならないが、怪しげな機械装置が出した結果だとよさげな論文になる。文献を精査して厳選した分子相互作用300個では論文にならないが、素人技術員を雇用して3000論文からデータを入力させれば論文になる。とどのつまり、頭を使わずとも人とお金を使えば論文になる世の中を整えているのである。この流れは、大学院重点化、ポスドク1万人計画の重要な受け皿としてあっぱれな解決策である。

したがって、システム生物学は学問の最先端として捉えるより、複雑系という言葉のような、一種の社会ムードとして理解したほうがよい。例えば、生命システムの特徴は、ロバストさと、ある角度から攻めれば全体がダウンする脆弱さとのトレードオフにあるという[3]。こういう難しい概念を、周知の事実だとか、複雑系だとか言うこともできるが、システム生物学の未解決問題だと言えば、予算を配分する人たちも、資金が流れてくる人々も喜ぶのである。

かくいう筆者もシステム生物学を大学で教えており、システム生物学さまさまである(教える内容には困るけれど)。しかし、その傘下で秘密裏に追求するのは「遺伝子など個々のパーツの解明」である。しかし、Roger のように大物でない輩がそんなことを言えるはずがない。おまんまの食い上げである。

[1] ISSY25 http://issy25.vtt.fi/
[2] I.E. Burbulis, K. Yamaguchi, A. Gordon, R. Carlson & R. Brent "Using protein-DNA chimeras to detect and count small number of molecules" Nature Methods 2005, 2:31-37
[3] H. Kitano "Biological Robustness" Nature Reviews Genetics 2004, 5:826-837

2006: 11-12月号 リメークでも面白い物語

需要の多い遺伝子は活性化因子によって制御され、少ない遺伝子は抑制因子によって制御されるらしい。昔々、M. Savageauという偉い人がいて、こう説明した[1]。「需要が多い場合、抑制因子に変異がおきて機能不全になっても影響はないが、活性化因子が機能不全をおこすと致死になる。よって活性化因子が進化的に保存されやすい。需要が少ない場合はその逆である。」

この議論は、関与する因子の適応度に差がないことが前提である。それから30年後、U. Alonのグループは遺伝子発現量のゆらぎを軸に物語をリメークした[2]。「DNAがむき出しだと非特異的な相互作用のためにエラーが多い。よって調節因子が常に結合した状態が選択されやすい。」このモデルは数式を用いて検証できるし、大腸菌のlacオペロンの実験的知見とも一致した。とても面白い。

生物学の世界は面白いストーリー作りが勝負である。生物学用語ではもったい ぶって「仮説」などというが、どんなに有名なドグマであれ、利己的な遺伝子であれ、その内容は映画「チャーリーとチョコレート工場」と大差ない。生物学では自然現象の意味(semantics)や演出に興味はあっても、構造(syntax)や論理的帰結には興味がないのである。だから逆の立場にある計算機科学者と理解しあえないのは当然かもしれない。「何を言うか、きちんとデータや理論で実証しているではないか」とお叱りを受けそうだが、数学者の藤原正彦が「国家の品格」で述べているように、生物学のような揺らぎの多い世界は、どうにでも論証できるのである。

ではなぜAlonらのストーリーを取り上げるのかというと、この稀代の語り手は、システム生物学という社会現象に含まれる、構成生物学(synthetic biology)というアプローチをしっかり見据えているからである。構成生物学は、これまた優れた研究者であるS. Leiblerらが始めた、生命現象をデザインするという危険思想である[3]。これまでに振動子やスイッチだけでなく、代謝物の拡散によるパターン形成や光センサーまでデザインされている[4]。この思想の大事な点は、これまで適当に意味づけして語ってきた自然現象を、人工物として構成しなおして検証する部分にある。生物学者を構造(syntax)サイドへ惹きつける、インフォマティクス業界も驚きの変化なのだ。Alonらの場合は、エラー最小化という工学的概念で制御因子の淘汰を説明しているのだが、その検証法として、転写制御メカニズムを再構築し人工進化させることを主張している。ちょっと考えると簡単な作業ではないのだが、そこは語りのうまさでカバーしている。こうして、新分野のすそ野が広がっていくのであろう。

注目を浴びつつある構成生物学を今後も取り上げたいところだが、筆者は今年で任務を全うすることになった。読者にはAlonやLeiblerらのラボで働くウンパルンパたち(上記映画に登場するポスドクやテクニシャンたちのこと)の論文をお勧めする。長い間、連載を楽しみにしてくれた読者に感謝したい。また会う日まで。

[1] Savageau, MA (1974) Proc Natl Acad Sci USA 71, 2453-2455.
[2] Shinar, G et al. (2006) Proc Natl Acad Sci USA 103(11), 3999-4004.
[3] Hartwell, LH et al. (1999) Nature 402, c47-c52.
[4] Chin, JW (2006) Nat. Chemical Biol. 2(6), 304-311.
Personal tools
Namespaces

Variants
Actions
Navigation
metabolites
Toolbox