利用方法説明
タンパク質構造検索
(アミノ酸配列の相同性による構造検索)


メソッド :

相同性検索はSmith-Waterman法を用いている。
ローカルマッチングは配列全体で似ているかどうかではなく、2本の 配列の局所的な類似性を見いだすために行なう。検索対象配列と データベース(SWISS-PROTタンパク質配列データベース、または PDB-REPRDB構造データベース)内の全配列との局所的な類似性を Smith-Waterman法を用いて計算する。配列内で一番類似性が高かった 部分のみを抽出し、抽出した部分の3次元構造を出力する。
ギャップコストの値はa+bk(kはギャップ長)の一次式を使っている。 ここでaは入力画面のギャップ開始、bはギャップ延長に相当する。

文献 :

Needleman, S. B. and Wunsch, C. D. :
"A general method applicable to the search for similarities in the amino acid sequences of two proteins",
J. Mol. Biol., vol.48, pp.443-453 (1970).

使用方法 :

  1. 「サービス稼働状況」 をクリックして「タンパク質構造検索(アミノ酸配列の相同性)」のサービスが ON になっていることを確認して下さい。
  2. 「データベース」 を選択して下さい。
    PDB-REPRDB(PDB代表タンパク質チェインDB)が使用できます。
  3. 「類似度評価行列」を選択して下さい。
    'BLOSUM45', 'BLOSUM62', 'BLOSUM80', 'PAM120', 'PAM250' が使用できます。
  4. 「ギャップコスト」を指定して下さい。
    「デフォルト値」「ユーザ定義」が選べます。
    デフォルト値をクリックすると、「デフォルト値」を選択した場合に使用されるギャップコストの表を見ることができます。)
    「ユーザ定義」を選んだ場合は、各「ギャップ」のフィールドにギャップのペナルティコストを入力して下さい。
    「ギャップ」のペナルティコストは全て 0 以上 100 以下の範囲の整数 でなければなりません。
  5. 「検索の閾値」を設定して下さい。
    「相同性得点」順「残基一致率」順を選択します。 上限値、下限値に適切な値閾を設定して下さい。
    (両方とも同時に省略可能です。「相同性得点」の下限値の欄には,BLOSUM62を使用する場合に適切と思われる値があらかじめ入力されています。)
  6. 「最大報告数」を入力して下さい。
    この数を超える検索結果出力は省略されます。
  7. 「ラベル=」 フィールドにはデータのタイトルを入力して 下さい。
  8. 「検索するアミノ酸配列」のフィールドにアミノ酸配列データを 入力して下さい。
    以下の2つのデータ形式が使用できます。
    8.1
    単純なアミノ酸配列
    例:
    KLGQGCFGEVWMGTWNGTTRVAIKTLKPGTMSPEAFLQEAQVMKKLRHEKLVQLYAVVSEEPIYIVTEYMSKGSLLDFLK
    8.2
    FASTA形式
    例:
    >CSRC_HUMAN
    KLGQGCFGEVWMGTWNGTTRVAIKTLKPGTMSPEAFLQEAQVMKKLRHEKLVQLYAVVSEEPIYIVTEYMSKGSLLDFLK
    (「ラベル=」のフィールドが空白の場合にはデータフィールド一行目の「>」の後ろのラベルが配列のラベルとして使用されます。配列中のアルファベット以外の文字は除外されますが、「>」の文字は配列の終わりとみなされます。)

    入力できる配列長の下限は20残基です。

  9. 実行するサービスの稼働状況を見るには'Service status' ボタンをクリックします。
  10. 入力フォームを初期状態に戻したいときは 'Reset this form' ボタンをクリックして下さい。
  11. 'Submit' ボタンをクリックすると処理が開始されます。

PAPIAシステム, papia@m.aist.go.jp
Copyright (c) 1997-2000, 技術研究組合 新情報処理開発機構 並列応用つくば研究室
Copyright (c) 2001, 独立行政法人 産業技術総合研究所 生命情報科学研究センター