○今井 賢一郎1、藤田 直也12、マイケル・グロミハ1、ポール・ホートン1
○産総研 生命情報工学研究センター 配列解析チーム 産総研特別研究員
1産総研 生命情報工学研究センター
2東京大学医科学研究所
ミトコンドリアは、祖先とされるグラム陰性菌と同様、その外膜にはβバレル型の外膜タンパク質(BOMP)が存在する。ミトコンドリアのBOMP(MBOMP)は、タンパク質のミトコンドリアへの輸送やミトコンドリアの形態維持など重要な役割を担っている。また、アポトーシスの制御とも関連しており、アポトーシスの調節の乱れは、癌やアルツハイマー病などの多くの疾患を生み出すことから、MBOMPは、抗ガン剤をはじめ創薬の新しいターゲットとして注目されている。これまでに同定されているMBOMPは、5種類である。以前のグラム陰性菌のBOMPをもとにした配列解析による見積もりでは、ミトコンドリアには、100種類以上のMBOMPがあると報告されているものの、いったいいくつの種類のMBOMPが存在するかという問いに対する明確な答えは未だに出ていない。しかし、昨年、初めてMBOMPの外膜挿入シグナル、βシグナルが実験的に同定され、βシグナルの特徴を用いた配列解析により、新規のMBOMPの探索だけでなく、MBOMPの種類についても見直せる機会を得た。そこで、我々は、真核生物のプロテオームに対し、βシグナルの進化的保存性、二次構造予測、局在シグナル予測、Gene Ontology などのアノテーション情報を組み合わせた手法とミトコンドリアとグラム陰性菌のBOMPのアミノ酸組成、膜貫通βストランド領域の位置特異的スコア行列や両親媒性の性質といった物性情報をもとにBOMPを予測する手法を開発し、新規MBOMPの網羅的探索を行った。その結果、信頼度の高い新規MBOMPの候補はほとんど見つからなかった。これより、MBOMPは、これまでの予想と大きく異なり、非常に限られた種類のグループである可能性が高い。おそらく、MBOMPの種類は、わずかに一桁程度であろうと考えられる。
References:
K. Imai, M. M. Gromiha, P. Horton, Cell, 135: 1158-9, 2008.
S. Kutik, et al, Cell, 132: 1011-124, 2008.
W. Wimly, Current Opinion in Structural Biology, 13: 404-11, 2003.
○浜田 道昭1、 佐藤 健吾2,1、木立 尚孝3,1、光山 統泰1、浅井 潔3,1
○みずほ情報総研(株) サイエンスソリューション部
1産総研 生命情報工学研究センター
2社団法人 バイオ産業情報化コンソーシアム
3東京大学大学院 新領域創成科学研究科 情報生命科学専攻
近年の機能性RNAの発見により、RNA配列の2次構造を正確に予測することの重要性が増している。最近著者らは、現時点で最高精度を有する2次構造ソフトウェアCentroidFoldを開発し(1)、ウェブサーバとして一般公開を行った(2)(http://www.ncrna.org/centroidfold)。本発表では、2次構造予測の精度をさらに向上させる一つのアプローチについて発表を行う。一般に、2次構造予測を行いたいターゲット配列が与えられた際には、同時にターゲット配列に相同な配列群が利用可能な場合が多い。そこで我々は、相同な配列群の情報を効果的に利用することにより、ターゲット配列の2次構造予測精度を向上させるための手法を開発した。(3)提案手法は、近年多くの分野で成功を収めている期待精度最大化原理に基づき、ターゲット配列と相同配列群の全ての準最適2次構造、および、ターゲット配列と各相同配列の全ての準最適ペアワイズアラインメントを考慮したロバストな手法となっている。計算機実験を行った結果、提案手法は、相同配列群の情報を利用することにより、通常の2次構造予測方法よりも高い精度でターゲット配列の2次構造を予測可能なことがわかった。
References:
(1) M. Hamada, et al. Bioinformatics, 25(4): 465-473, 2009.
(2) K. Sato, et al. Nucleic Acids Resarch, 37:(suppl2), W227-W280, 2009.
(3) M. Hamada, et al. Bioinformatics, 25(12): i330-i338, 2009.
○津田 宏治
産総研 生命情報工学研究センター RNA情報工学チーム 主任研究員
細胞内の機能は、複数のタンパク質からなる複合体によって担われている場合が多い。複合体の構成は、細胞の環境によって変化する場合があり、また、ひとつのタンパク質が複数の複合体に参加する場合も一般的である。 本研究では、タンパク質相互作用ネットワークから、複合体を密結合モジュールとして発見するアルゴリズムを提案する。従来の近似的手法と異なり、本手法は、逆探索法を用いて、密度がしきい値より大きいモジュールを全列挙する。 また、遺伝子発現データや、表現型プロファイルなどの付加的情報も考慮に入れて、興味深いプロファイルを持つモジュールを発見することができる。本手法は、イースト菌の既知の複合体を発見する計算実験において、他手法より優れた予測精度を示した。 また、ヒトのネットワークと、組織特異的発現データとの組み合わせによって、組織特異的な複合体の変化を同定することができた。
○中津井 雅彦1、堀本 勝久1
○産総研 生命情報工学研究センター 生体ネットワークチーム 産総研特別研究員
1産総研 生命情報工学研究センター
一般的な生体ネットワーク動態解析では、まず実験解析結果などの生物学的知見に基づき、分子反応モデルを構築する。次に、分子反応の様式に基づいて微分方程式を定式化する。そして最後に、実験計測データに基づいて、反応パラメータの数値解析を実行する。しかしながら、特に実験計測データが少数である場合において、反応パラメータを一意に同定できないことがある。我々は、この問題を克服するための試みとして、代数的アプローチを導入した。微分方程式モデルから、代数手法の一つである、Differential Eliminationによって反応パラメータ間の束縛条件を導出し、この束縛条件をパラメータの数値最適化における評価関数の一部に採用した。4分子の内1分子のみが測定可能なネットワークを想定し、そのシミュレーションデータを用いて、束縛条件を考慮する場合としない場合で反応パラメータの最適化を実行した。このとき、最適化の手法として実数値遺伝的アルゴリズムを用いた。その結果、束縛条件を考慮しない場合はパラメータすべてについて正しく推定できなかったが、考慮した場合はすべて推定できた。初歩的な解析ではあるが、Differential Eliminationによる束縛条件を数値最適化における評価関数に導入することは、少数の実験計測データのみからネットワーク動態解析を行うための有用な手法の一つと考えられる。
○Jean-Francois Pessiot1, Hiroto Hyakkoku2, Hirokazu Chiba1
Takeaki Taniguchi3, Wataru Fujibuchi1
○Computational Biology Research Center, AIST, Cell Function Design Team Research Staff
1Computational Biology Research Center, AIST
2Waseda University
3Mitsubishi Research Institute
Experimental identification of transcription factor binding motifs (TFBMs) is a difficult and time-consuming task. Therefore, in silico identification of TFBMs has recently attracted attention as a promising tool for discovering TFBM candidates. Previous works try to identify TFBMs through the modeling of gene expression levels.
In this work, our goal is to identify TFBMs using the binding affinities between a TF and its target genes. When a TF binds to the DNA, the binding affinity is determined by the presence of the binding site itself, but also by other motifs which may strengthen or weaken the binding. Therefore, if the presence of a given set of motifs is strongly correlated with a binding affinity level, then these motifs may be good TFBM candidates.
Based on this assumption we present PeakRegressor, a L1-norm log-linear regression approach for identifying the binding motifs of a given TF. Our approach successfully predicts the peak scores of STAT1 and RNA Polymerase II with correlation coefficients as high as 0.65 and 0.66, respectively. Using PeakRegressor, we are able to identify composite motifs for STAT1, as well as motifs which strengthen or weaken the binding.
○清水 佳奈1、藤 博幸1,2
○産総研 生命情報工学研究センター RNA情報工学チーム 研究員
1産総研 生命情報工学研究センター
2九州大学 生体防御医学研究所
本研究では、ヒトゲノムにおいて、特定の立体構造を持たないと予測されたタンパク質間の相互作用が期待されるよりも有意に多いことを明らかにし、双方のタンパク質に存在するディスオーダー領域がタンパク質間相互作用において重要な役割を果たしている可能性を示唆した。
具体的には、タンパク質間相互作用ネットワークから、ほぼ全長がディスオーダー領域に含まれると予測されたタンパク質(以下DR)、及び、ディスオーダー領域をほとんど含まないと予測されたタンパク質(以下ORD)から構成されるサブネットワークを抽出して、ランダムネットワークとの比較を行い、上記の結論を得た。
同様の解析を、特定のGO、KEGGのパスウェイに属するタンパク質に対して行ったところ、特に、ゴルジ体局在、代謝関連、ガンや神経変性疾患に関与するパスウェイ上のタンパク質間においてDR同士の相互作用がランダムよりも多かった。また、相互作用数との関連を調べたところ、ハブではないタンパク質間においてDR同士の相互作用がランダムよりも多かった。
ディスオーダー領域がターゲットとなる物質と相互作用する際には、結合と折りたたみが同時に起こると考えられている。近年の研究では、ディスオーダー領域と構造を持つ領域同士の相互作用だけではなく、ディスオーダー領域同士の相互作用も報告されており、タンパク質間で協調的に折りたたみが起こるメカニズムが提案されている。本研究の結果は、後者のメカニズムに基づく相互作用が多い可能性を示しているが、立体構造が不在にもかかわらず、特異性のある分子認識が可能なのかといった疑問も残る。一方で、柔軟性の高い立体配座は、より広い範囲でエネルギーの最小化探索を可能にすると考える仮説も報告されている。今後、ディスオーダー領域が関与する相互作用のメカニズムの解明がますます重要となるだろう。
参考文献:
K. Shimizu, H. Toh, Journal of Molecular Biology, 2009; 392(5):1253-65.
○根本航1、藤 博幸1,2
○産総研 生命情報工学研究センター 分子機能計算チーム 産総研特別研究員
1産総研 生命情報工学研究センター
2九州大学 生体防御医学研究所
構造ゲノミクスの進展に伴い、配列情報だけでは明らかにできないタンパク質同士の会合/制御様式など、より詳細な機能の解析が求められている。また、構造が解かれても依然として機能が明らかにならないタンパク質も増えてきている。この状況下でバイオインフォマティクスの立場からアプローチするべき問題の一つとして、タンパク質の機能部位予測があげられる。機能部位予測は配列情報に加え、立体構造情報も利用することで実用的かつより精緻な予測を行える。しかし、これまでに報告されている立体構造情報を利用する数多くの手法はいずれも固有の問題を抱えている。
今回、構造情報と配列情報の融合による機能部位予測の新規手法として、これまでタンパク質機能解析に用いられてこなかった統計解析を利用した手法を開発した。本手法は立体構造情報に加え、マルチプルアラインメントから抽出される進化情報を利用する。進化情報を用いる手法に特有の問題の一つは、進化情報がマルチプルアラインメントに含まれる配列に大きく依存し、予測の結果も大きく変わる場合があることである。『多様な配列を含むほど予測精度が良い』との経験則はあるが、進化的に極めて近縁な配列同士であっても異なる機能を有することもあるため、単に分岐した多くの配列を含めるだけでは正確な予測は行えない。我々は、機能部位予測に適したマルチプルアラインメントを作成するための配列選択の基準となる指標を開発した。この指標に基づいて配列を選択することで、高精度の予測を行うことができる。本発表では、予測手法の詳細と指標の妥当性について報告する。