Developers -研究成果への道-

Vol.3:新パラダイム創造への基盤〜GPCR遺伝子の網羅的解析〜

諏訪 牧子
MISSION
"SEVENS"プロジェクト:GPCR遺伝子データベースの構築
MEMBERS
諏訪 牧子 : CBRC
小野 幸輝 : 情報数理研究所
インタビュー:2009年1月14日
Page. << 1 | 2 | 3 >>
バイオインフォマティクスの専門家が集うCBRCだからこそできた研究。
手探り状態でのプロジェクト進行

ヒトのゲノムからGPCR遺伝子を網羅的に解明する。CBRCの設立と前後して、諏訪のプロジェクトはスタートした。しかし、必ずしも順調な始まりとは言えなかった、と諏訪は言う。「当時としては、前例のないプロジェクトなので、どこから手を付けるか、どうやって進行するか、模索しながらの始まりでした」。

もちろん、プロジェクトの進行に関する見通しが、まったくなかったわけではない。並列計算環境の専門家である秋山氏、数理モデルの専門家である浅井氏と共同研究を行うことで、高度な数学的手法を応用した強力な解析ができると考えていたという。「“こうすればできる”というイメージは、当初から持っていました。そのイメージを伝え、実現化する方法を一つずつ議論しながら考え出していったのです」。

諏訪の考えたイメージは、GPCRの配列・構造特徴を意識しながら複数の解析用ツールを「パイプライン」型に組み合わせ、GPCR遺伝子の同定を行おうというものだった。遺伝子発見、配列検索、モチーフ同定、膜貫通ヘリックス予測などを行うための既存のプログラムを用意し、各プログラムが処理したデータに対して適切な閾値を定め、データを相互に受け渡して行き、最終的な解析結果を出す、という構造だ。

プロジェクトがスタートしてからは、このパイプラインの構成に心を砕いた。「1本のパイプラインで効率的に、しかも感度や選択性などの精度を高めてGPCR遺伝子を見極めるには、1年以上に亘る基礎研究が必要になりました。遺伝子予測は単なるお天気予報と受け止められてはダメで、非常に高い感度・選択性で解析できなければ、意味がありません」。一つのプログラムで解析したデータを次のプログラムに渡すときの閾値をどのような値にするか? それぞれの感度や選択性はどうなのか? プログラムを組み合わせる順番をどのようにしたら良いのか?といった評価を繰り返し、改良を施す日々が続いたという。また同時に、パイプライン全体の構造にも検討が加えられた。計算機の能力を活かしつつ精度を上げ、しかも効率的に自動解析を行うにはどうすればいいか、という点だ。「パイプラインに改良を加えるごとに書き換えた構成図です」と、諏訪が見せたのは、厚さ3cmを超えるファイルだった。

SEVENSの完成とGRIFFINの開発

試行錯誤を繰り返しながら、諏訪のプロジェクトは進行していった。データベースを構築する過程では、それまで未知だったGPCR遺伝子を数百以上も同定。「そのまますぐに、創薬につながるものではなかった」と振り返る諏訪だが、新規遺伝子の発見による特許出願、開示などでインパクトをもたらす成果を達成した。

2001年に始まったプロジェクトが、一応の完了を見たのは2003年。諏訪が『SEVENS』と名付けたGPCR遺伝子データベースの完成とWEB公開であった。前述したパイプラインによって同定されるGPCR遺伝子の感度は99.4%、精度は96.6%という高いものになった。「もちろん、これで完全にできあがったというわけではありませんでした。2003年にいったん公開した後でも、さまざまな改良を加えています」。諏訪が目指したのは、可能な限り機能情報を追加したデータベースを構築することだった。公開したSEVENSにアクセスした研究者からのフィードバックも参考にしながら、研究者にとって使いやすいデータベースに改良していく作業が現在でも続けられている。 平行して諏訪が取り組んだのが、GPCR遺伝子がどのようなGタンパク質と選択的に結合するかを予測するツール『GRIFFIN』の開発だ。GRIFFINは、リガンド情報とGPCR配列を入力すると、結合するGタンパク質を予測する。ツールの開発に当たっては、結合選択性に本質的な領域を抽出し、それを基にGPCRを機能分類する手法が採られた。すなわち、リガンド、GPCR、Gタンパク質の各部位の物理化学的な特徴量から、Gタンパク質選択性に効果的に効くN個の特徴量を抜き出してGPCRをN次元のベクトルとして表現する。これをN次元空間上で、結合リガンド、Gタンパク質共に既知のGPCRの領域にプロットすることで予測を可能にした。機械学習手法であるSVM(サポートベクターマシン)を利用して、それぞれのGタンパク質に対して、90%近くの感度、選択性で予測できたという。

Page. << 1 | 2 | 3 >>

page top