利用方法説明
タンパク質配列相同性検索
(類似度評価行列による検索)


メソッド :

ローカル−ローカルのアラインメント
Smith-Waterman法を用いている。 ローカルマッチングは配列全体で似ているかどうかではなく、2本の配列 の局所的な類似性を見いだすために行なう。検索対象配列とデータベース (SWISS-PROTタンパク質配列データベース、またはPDB-REPRDB構造データ ベース)内の全配列との局所的な類似性をSmith-Waterman法を用いて計算 する。配列内で一番類似性が高かった部分のみを抽出してくる。
ギャップコストの値はa+bk(kはギャップ長)の一次式を使っている。ここで aは入力画面のギャップ開始、bはギャップ延長に相当する。

グローバル−グローバルのアラインメント
Needleman-Wunsch 型ダイナミック−プログラミング法を使用する。 配列全体での類似性を計算する。検索対象配列とデータベース(SWISS-PROT タンパク質配列データベース、またはPDB-REPRDB構造データベース)内の 全配列との最適ペアワイズ・アライメントをNeedleman-Wunsch 型ダイナ ミック−プログラミング法で求める。
ギャップコストの値はa+bk(kはギャップ長)の一次式を使っている。ここで aは入力画面のギャップ開始、bはギャップ延長に相当する。ギャップ外側は アラインメントの結果、配列の外側に生じるギャップであり、2本の配列長 に大きな差がある場合は0にすると良い。

グローバル−ローカルのアラインメント
Needleman-Wunsch 型ダイナミック−プログラミング法を使用し、検索対象 配列は配列全体を対象とし、データベース内の配列は局所的に検索する。

文献 :

Smith,T.F. and Waterman,M.S. :
"Identification of Common Molecular Subseqences"
J. Mol. Biol., vol.147, pp.195-197 (1981).

Needleman, S. B. and Wunsch, C. D. :
"A general method applicable to the search for similarities in the amino acid sequences of two proteins",
J. Mol. Biol., vol.48, pp.443-453 (1970).


使用方法 :

  1. 「サービス稼働状況」 をクリックして「相同性検索」のサービスが ON になっていることを確認して下さい。
  2. 「データベース」 を選択して下さい。
    PDB-REPRDB(PDB代表タンパク質チェインDB)SWISS-PROT が使用できます。
  3. 「類似度評価行列」を選択して下さい。
    'BLOSUM45', 'BLOSUM62', 'BLOSUM80', 'PAM120', 'PAM250' が使用できます。
  4. 「ギャップコスト」を指定して下さい。
    「デフォルト値」「ユーザ定義」が選べます。
    デフォルト値をクリックすると、「デフォルト値」を選択した場合に使用されるギャップコストの表を見ることができます。)
    「ユーザ定義」を選んだ場合は、各「ギャップ」のフィールドにギャップのペナルティコストを入力して下さい。
    「ギャップ」のペナルティコストは全て 0 以上 100 以下の範囲の整数 でなければなりません。
  5. 「検索の閾値」を設定して下さい。
    「相同性得点」順「残基一致率」順を選択します。 上限値、下限値に適切な値閾を設定して下さい。
    (両方とも同時に省略可能です。「相同性得点」の上限値および下限値の欄には,BLOSUM62を使用する場合に適切と思われる値があらかじめ入力されています。)
  6. 「最大報告数」を入力して下さい。
    この数を超える検索結果出力は省略されます。
  7. 「メソッド」を選択して下さい。
    'Smith-Waterman 型 DP local local', 'Needleman-Wunsch 型 DP global local', 'Needleman-Wunsch 型 DP global global' が使用できます。
  8. 「ラベル=」 フィールドにはデータのタイトルを入力して 下さい。
  9. 「検索するアミノ酸配列」のフィールドにアミノ酸配列データを 入力して下さい。
    以下の2つのデータ形式が使用できます。
    8.1
    単純なアミノ酸配列
    例:
    KLGQGCFGEVWMGTWNGTTRVAIKTLKPGTMSPEAFLQEAQVMKKLRHEKLVQLYAVVSEEPIYIVTEYMSKGSLLDFLK
    8.2
    FASTA形式
    例:
    >CSRC_HUMAN
    KLGQGCFGEVWMGTWNGTTRVAIKTLKPGTMSPEAFLQEAQVMKKLRHEKLVQLYAVVSEEPIYIVTEYMSKGSLLDFLK
    (「ラベル=」のフィールドが空白の場合にはデータフィールド一行目の「>」の後ろのラベルが配列のラベルとして使用されます。配列中のアルファベット以外の文字は除外されますが、「>」の文字は配列の終わりとみなされます。)

    入力できる配列長の上限は2,000残基です。
    但しデータベースに SWISS-PROT を選択した場合は、 入力できる配列の長さは 300 残基以下になります。

  10. 実行するサービスの稼働状況を見るには'Service status' ボタンをクリックします。
  11. 入力フォームを初期状態に戻したいときは 'Reset this form' ボタンをクリックして下さい。
  12. 'Submit' ボタンをクリックすると処理が開始されます。
  13. 計算結果例

結果表示について :

  1. 検索条件に一致する配列が見つかった場合は、結果表示画面の最初に見つかった配列の件数と、配列のエントリ名の一覧が表示されます。

    一覧の中のエントリ名をクリックすると、その配列のペアワイズアライメント表示へジャンプできます。

  2. 一覧の下に、問い合わせ配列と見つかった配列それぞれとのペアワイズアライメント表示が続きます。

  3. ペアワイズアライメント表示部のエントリ名をクリックすると、PDB-REPRDB または SWISS-PROT の該当するエントリのページを表示します。

  4. ページの先頭にある「検索結果をマルチプルアライメントする」を選択するとここで見つかった相同配列をマルチプルアライメントさせることができます。
    またお使いのブラウザによっては残基の色分けが見にくいことがあります。そのような場合は「結果をプレーンテキストで表示」を選択して下さい。


PAPIAシステム, papia@m.aist.go.jp
Copyright (c) 1997-2000, 技術研究組合 新情報処理開発機構 並列応用つくば研究室
Copyright (c) 2001, 独立行政法人 産業技術総合研究所 生命情報科学研究センター