
生体内の多くのタンパク質は糖鎖や脂質による修飾に機能を支配されており、これらの修飾に関わるタンパク質の同定や分類に関する研究が精力的に行われている。中でも糖転移酵素は糖鎖修飾に関わる最も重要なタンパク質のひとつとして生物学的にも医学的見地からも注目を集めている。そのような背景から、膨大なヒトゲノム情報の中から糖転移酵素を計算機により見つけ出す方法論の開発が急務となっている。
ヒトゲノムORFから有用な遺伝子を見つける一般的な方法には配列相同性検索があるが、糖転移酵素どうしの配列相同性は意外に低く、新規の糖転移酵素を見出すには限界がある。一方、糖転移酵素が細胞内小器官であるゴルジ体に存在する膜タンパク質であるという情報をもとに、細胞内局在予測の手法でゴルジ体局在と予測される膜タンパク質を糖転移酵素の候補とする方法も考えられる。しかしながら、はっきりとした移行シグナルやモチーフが存在しないゴルジ体への局在予測は、非常に優秀といわれている既存の局在予測ツールを用いても困難である。そのような理由で、我々は糖転移酵素のゴルジ膜貫通領域の特徴を抽出し、独自の糖転移酵素判別方法の開発を行った。
糖転移酵素がゴルジ体膜に貫通するヘリックスを1本だけ持ったII型の膜タンパク質という特徴を持っているため、我々は糖転移酵素とトポロジーが似ているタンパク質群(細胞膜上に局在するII型膜タンパク質・シグナルペプチド領域を持つタンパク質、図1)の膜貫通領域と比較して物理化学的な特徴を抽出し、糖転移酵素の膜貫通領域を判別するアルゴリズムを開発した。まず、これらタンパク質のN末端部分におけるアミノ酸配列の平均疎水性値が最も高い位置を基準にアラインメントを行い、アラインメント位置に特異的なアミノ酸出現頻度からPosition Specific Score Matrixを求めた。この位置特異的マトリックスを利用して積算スコアを算出(図2)した。各データセットから求められたスコア群の中心からのマハラノビス距離で判別して精度の評価を行ったところ、感度・選択性ともに好成績を収めた。
|