平成23年度の主な研究成果

1. 秘密計算による化合物データベースの検索技術

研究成果の概要
創薬などに用いられる化合物の情報は企業秘密として厳重に管理されるため、外部データベースに情報を送って類似化合物の検索を行うことが難しかった。今回開発した技術により、ユーザー側とサーバー側の双方が互いに情報を開示することなく、互いのデータを暗号化したままで比較し、検索結果だけを得ることができる。この技術では、データを加法準同型暗号により暗号化し、加算だけで検索を行えるアルゴリズムによって、大量のデータに対して実用的な速度で検索を実行できる。今回開発した技術は、企業間での安全かつ効果的な情報交換を促進し、創薬におけるオープンイノベーションに貢献すると期待される。また、本技術はゲノム等、他のデータにも応用することが可能。

平成23年度計画との関連
小項目:II-1-(3)-<3> バイオデータベース整備と利用技術の開発

開発技術の用途
・フォーカスドライブラリの検索
・個人ゲノムによる疾患診断

図1-1 全工程で暗号化されたデータを使用、情報漏えいのリスクが大幅に低下 図1-2 化合物検索の概要
図1-1 全工程で暗号化されたデータを使用、情報漏えいのリスクが大幅に低
図1-2 化合物検索の概要
図をクリックすると別ウィンドウに大きな図が開きます。
2. ライフサイエンス情報統合基盤技術開発

研究成果の概要
・プラットフォームを用いデータベースと解析ツールを組み合わせた大規模大量データ解析を可能とする技術開発
 ライフサイエンス研究分野では、その細分化や専門化に伴い、様々なデータベース、解析ツール、予測ソフトウェアが開発され膨大な数に達しており、これらを有効かつ効率よく利用するには様々な課題を克服する必要があります。生命情報工学研究センターでは、これら分散するソフトウェア解析やデータベース検索等を、一つ一つユーザが実行するのではなく、一連の処理の流れを定義することにより、効率的に短時間に実行するためのワークフローに関する技術開発を進め、統合化を目指した実用的な情報基盤開発に取り組んでいる。(図1)

平成23年度計画との関連
小項目:II-1-(3)-<3> バイオデータベース整備と利用技術の開発
・遺伝子や生体分子に関する情報の高度な利用を促進する解析サービスやワークフロー等を構築する。また、ヒトの遺伝子、RNA、タンパク質、糖鎖情報の整備及び統合を行うとともに、診断技術等の利用技術を開発する。

開発技術の用途
・ライフサイエンス研究分野における専門化・細分化された様々なデータベースと解析ツールのシームレスな連携・統合による知的プラットフォームとして利用できる。(図2)

図2-1 CBRC統合DB情報基盤サイト 図2-2 プラットフォームによる解析例
図2-1 CBRC統合DB情報基盤サイト 図2-2 プラットフォームによる解析例
図をクリックすると別ウィンドウに大きな図が開きます。
3. 高速近傍探索法を用いた類似リガンド結合部位の網羅的発見とそのデータベース化

研究成果の概要
・タンパク質は多くの場合、他の分子(リガンド)との相互作用を介して機能を発現することが知られています。つまり、タンパク質が持つ他分子と結合する領域(リガンド結合部位)は、タンパク質の機能を特徴付ける非常に重要な場といえます。本研究では、SketchSortと呼ばれる非常に高速な近傍探索アルゴリズムを開発しました。この方法を用いることによって、通常のPCで、120万の既知及び潜在的リガンド結合部位の類似ペア(約8000万点)の列挙を約4時間で行うことが可能になりました。一般の研究者がこの類似度ネットワークを用いて研究を行えるよう、データベースPossumを立ち上げ、Web上に公開した。

平成23年度計画との関連
小項目:II-1-(3)-<3> バイオデータベース整備と利用技術の開発
・遺伝子や生体分子に関する情報の高度な利用を促進する情報データベースやポータルサイト等を構築する。また、ヒトの遺伝子、RNA、タンパク質、糖鎖情報等の整備及び統合を行うとともに、診断技術等の利用技術を開発する。

開発技術の用途
・創薬における副作用探索
・次世代シークエンサーデータの高速アセンブリ
・製薬企業に蓄積されている多数の化合物の検索、クラスタリング

図3-1 SketchSortアルゴリズムの概要 図3-2 Webサーバ
図3-1 SketchSortアルゴリズムの概要
図3-2 Webサーバ
図をクリックすると別ウィンドウに大きな図が開きます。
4. ヒト細胞・細胞分化データベースCELLPEDIA

研究成果の概要
・平成21年度に公開したヒト細胞の網羅的分類体系に基づく細胞情報データベースを著名な学術論文の出版社であるOxford JournalのDatabase誌に報告した。ヒト分化細胞2,260種および幹細胞66種の独自分類バックボーン上へ遺伝子発現、細胞画像、論文等を統合して検索できるようにした細胞情報データベースシステム。

平成23年度計画との関連
小項目:II-1-(3)-<2> システム生物学的解析を用いた創薬基盤技術の開発
・転写制御、シグナル伝達、代謝に代表される、細胞内のネットワーク、パスウェイ等の推定やシミュレーションにより、創薬に必要な化合物の設計と合成、標的分子を推定する技術を開発する。

開発技術の用途
・異なる細胞間での比較遺伝子発現解析を行うことで細胞分化に有効な転写因子等の探索が可能である。
・今後、増加すると考えられる人工細胞の検査のため、リファレンス細胞として情報を提供することが期待される。
・細胞進化の解析支援が可能。

図4-1 ヒト細胞を大学、研究所、UCSF、Stanford大、企業などから画像、遺伝子発現、論文を登録して公開。Hatano et al. Database, Vol. 2011, bar046, 2011.
図4-1 ヒト細胞を大学、研究所、UCSF、Stanford大、企業などから画像、遺伝子発現、論文を登録して公開。Hatano et al. Database, Vol. 2011, bar046, 2011.
図をクリックすると別ウィンドウに大きな図が開きます。
5. タンパク質間相互作用制御化合物のインシリコスクリーニング

研究成果の概要
・NEDO「化合物等を活用した生物システム制御基盤技術開発」PJにおいて、タンパク質タンパク質ドッキング計算から相互作用部位を予測し、リガンドドッキング計算や分子動力学計算を用いて化合物をスクリーリングする戦略を基本に、様々なタンパク質間相互作用標的と制御化合物の探索を実施した。複合体タンパク質の結晶構造を用いた統計解析によれば、タンパク質-タンパク質間相互作用表面は、800Å2を1区間とした複数のパッチ構造で形成されていることが知られており、PJで実施した複合体タンパク質標的をこの基本構造や天然物スクリーニング結果等を参考に、図のような分類を新規に提案した。(図1)

平成23年度計画との関連
小項目:II-1-(3)-<1> 配列情報と分子構造情報を用いた創薬支援技術開発
・創薬タンパク質-タンパク質相互作用を標的としたバーチャルスクリーニングでは、複合体形成の作用機序別に効率よく実験と計算機を連携することでスクリーニング効率を向上する。

開発技術の用途
・ライフサイエンス研究分野における専門化・細分化された様々なデータベースと解析ツールのシームレスな連携・統合による知的プラットフォームとして利用できる。(図2)

図5-1 インシリコスクリーニングにむけたタンパク質間相互作用の分類 図5-2 合成化合物と天然物による化合物空間の解析と、タンパク質間相互作用様式ごとの阻害剤分布の対応付け
図5-1 インシリコスクリーニングにむけたタンパク質間相互作用の分類 図5-2 合成化合物と天然物による化合物空間の解析と、タンパク質間相互作用様式ごとの阻害剤分布の対応付け
図をクリックすると別ウィンドウに大きな図が開きます。
6. 哺乳類ゲノムに保存された新規非コード因子の予測

研究成果の概要
・情報学的手法によって、哺乳類ゲノムから新規非コード因子の予測を行った。RNA情報工学チームがこれまで開発してきたRNAに特化した配列解析ツールを利用して、従来よりも高精度な予測を目指して新たな予測を実施したところ、3,000以上の因子を予測し、従来の予測には含まれない、1,200以上の新規因子を検出した。
 これらの因子の機能は未知だが、全体の半数以上が転写因子結合部位に存在することから、転写制御に関与していると見ており、RNAによる全く新しい転写制御機構の発見につながると期待する。

平成23年度計画との関連
小項目:II-1-(3)-<1> 配列情報と分子構造情報を用いた創薬支援技術開発において、遺伝子発現制御に関与する新規遺伝子の発見は、新規創薬標的の開拓へとつながる重要テーマ。

開発技術の用途
・マイクロRNAなどとはまったく別種の遺伝子発現制御機構を利用した新規の創薬標的となる可能性がある。

図6-1 予測パイプライン 図6-2 予測された非コード因子の例
図6-1 予測パイプライン 図6-2 予測された非コード因子の例
図をクリックすると別ウィンドウに大きな図が開きます。
7. ネットワーク解析技術に基づく高精度・高効率創薬基盤技術開発

研究成果の概要
・平成22年度に改良した制御ネットワーク候補の絞り込み技術をiPS細胞、ES細胞、始原生殖細胞等の多能性幹細胞や前立腺がん、肝がん、糖尿病等の疾患細胞に適用し、少数要因候補制御因子を同定し、共同研究者により実験検証が開始された。さらに新規に、予後データ等のアウトカムデータから分子機能を推定する技術の開発と網羅的タンパク質量計測システムの開発とを開始した。

平成23年度計画との関連
小項目:II-1-(3)-<2> システム生物学的解析を用いた創薬基盤技術の開発
・要因候補遺伝子の絞り込みを10分子程度に限定する。
・アウトカム重視の解析法により、信頼性の高い要因候補を同定可能にする。
・網羅的タンパク質量計測システムの開発を完成し、プロテオミクスデータについて要因候補タンパク質の同定を行う。

開発技術の用途
・疾患等の要因遺伝子の実験検証を促進し、創薬開発の効率化に貢献する
・直接的機能を担うタンパク質候補やアウトカム指向の分子機能同定により、高精度な創薬開発に貢献する。

図7-1 ネットワーク解析による少数要因候補制御因子の絞り込み 図7-2 アウトカムデータ指向の分子機能推定技術の開発
図7-1 ネットワーク解析による少数要因候補制御因子の絞り込み 図7-2 アウトカムデータ指向の分子機能推定技術の開発
図をクリックすると別ウィンドウに大きな図が開きます。
8. タンパク質・核移行シグナル予測法の開発

研究成果の概要
・癌遺伝子(P53など)とウィルス・タンパク質(HIV-1 Revなど)の制御に重要である配列要素、核外移行シグナル(NES)の予測法(NESsential)を開発した。NESと天然変性領域の関係をモデルに取り入れ、予測精度を高めた。更に、性能比較を行い、NESsentialが新規NES候補のスクリーニングに有効である、世界初かつ唯一の手法であることを示した。

平成23年度計画との関連
小項目:II-1-(3)-<1> 配列情報と分子構造情報を用いた創薬支援技術開発。H23年度計画には、NES予測には明確に触れていないが、新たに発展したテーマ。

開発技術の用途
・ゲノム配列から新規NES候補の発見
・新型ウィルスにおける変異の影響予測
・癌腫瘍における癌遺伝子変異の影響予測
・NES変異が関与している薬剤耐性獲得の解析

図8-1 NESsential、NES予測の流れ図 図8-2 正解率は従来法を大幅に上回る
図8-1 NESsential、NES予測の流れ図 図8-2 正解率は従来法を大幅に上回る
図をクリックすると別ウィンドウに大きな図が開きます。
9. 次世代創薬標的探索のためのインターフェイス予測技術の開発

研究成果の概要
・Gタンパク質共役型受容体(GPCR)は市販薬物の3割が標的とする、創薬における重要なタンパク質です。近年、GPCR同士が複合体を形成して機能することが明らかとなり、また、この複合体形成とパーキンソン病など様々な疾患との関連性が指摘されています。複合体を形成する際のインターフェイスを高精度で同定し、既存のGPCR標的薬とは異なる作用機序に基づく、創薬支援を目指している。

平成23年度計画との関連
小項目:II-1-(3)-<1> 配列情報と分子構造情報を用いた創薬支援技術開発
・アミノ酸配列情報と立体構造情報を利用し、GPCRが複合体を形成する際のインターフェイスを予測するサービスとDBを構築している。

開発技術の用途
・医薬品・実験試薬が標的とすべき領域の同定
・GPCR多量体形成が関与する疾患メカニズムの理解

図9-1
図をクリックすると別ウィンドウに大きな図が開きます。