○中尾 光輝
情報・システム研究機構 ライフサイエンス統合データベースセンター 特任研究員
文部科学省委託研究開発事業である「統合データベースプロジェクト」(統合DB)において、ライフサイエンス統合データベースセンターは、ライフサイエンス分野での成果物のアクセス性の向上をとおして、日本の研究開発の生産性の向上を目指している。いままでの取り組みを紹介し、そこでの課題について議論したい。生命科学では、データベースは研究プロジェクトごとに散在しておりそれらのアクセス性や再利用性は必ずしもよくはなく、大型プロジェクトなどの時限制の研究プロジェクトでは完了後にそのデータが埋没しがちであり、また、データの統合的な利用のために必要な技術基盤の整備が立ち後れている、といった問題があった。このため、統合DBでは、国内の完了した研究プロジェクトのデータの公開状況を調査し、アーカイブへの収録、共有の学術用語などの辞書の整備、成果物のライセンスや公開方法の整理や提案などを行っている。このようにして、共有化され統合的に利用可能なデータの種類と総量を拡大することにより、国内での有用なデータの複合的な活用と再利用が促進され、データベースの組み合わせによる相乗効果を期待している。
統合DBでは、独立に存在している多種多様なデータベースを統合し、これまでに蓄積された情報の利用価値を高めるために、二つのアプローチをとっている。一つは先にあげた既存データの収集業務であり、国内のリソースを統合したレポジトリを構築しさまざまなデータベースに対する横断検索が可能なポータルサイトを提供している。ここでの課題は成果物にまつわる権利と法律である。もう一つのアプローチとして、分散したデータベースや解析サービスのウェブサービスによる仮想的な統合を行っている。ここでの課題は、標準化と価値あるワークフローの実現である。さらに、このような統合化したデータベースを活用するための人材育成や教材作成にも取り組んでいる。
○福井 一彦1、田代 俊行1、矢葺 幸光1,2、堀本 勝久1、野口 保1、浅井 潔1、情報統合班1
○産総研 生命情報工学研究センター 分子機能計算チーム チーム長
東京理科大学 理工学研究科 客員教授
早稲田大学理工学術院 バイオインフォマティクス特論 客員教授
奈良先端科学大学院大学 生体分子情報学 客員教授
産総研 生命情報工学研究センター
2(株)情報数理研究所
ライフサイエンス研究分野では、研究分野の複雑化・細分化にあわせて解析ツールやデータベースの多様化が求められており、個々のデータベース、解析ツール、システムの乱立や併存は、管理・運用に多大な労力を要し、研究分野の迅速な変化や新規技術への対応が困難であると考えられている。そこで生命情報工学研究センターでは、ライフサイエンス分野における統合データベースプロジェクトに関連して、これまで我々が開発した解析ツールやデータベースを組み合わせ、WEB等によるサービスとしてのワークフロー基盤技術開発を行っている。このワークフローは、固定型(WEBワークフロー)と可変型(アクティブ・ワークフロー)に大別され、固定型は予め定義された一連の処理を組み合わせており、ユーザは許された範囲内でのみパラメータ等の指定が可能であり、実行が容易なWEBサービスである。他方、可変型はユーザが処理の組み合わせを指定することが可能であり、柔軟性は高い、但し可変型は、固定型に比べ組み込む処理自由度を高まる必要から開発期間・コストの負担が大きいこと、またワークフロー構築に慣れるまで比較的時間がかかる等の課題がある。我々はユーザから求められている使いやすさとユーザがワークフローの流れを決定できるという柔軟性を加味し、直観的なGUIを用いた操作性に優れたKNIMEプラットフォームを使用している。本発表ではソフトウェアの利用者であるユーザが、解析用途に応じてバイオ分野における各解析要素技術(解析ツール)を組み合わせ解析構造体とし、一連の要素技術を連動して利用できる基盤技術環境(プラットフォーム)上でのアクティブ・ワークフローについて紹介する。