この研究は、がんの本態解明を目指した医学・生物学研究に、スーパーコンピュータを用いた計算システム生物学を融合して、これまでに無い新たな学術領域を創造するものです。増殖、遊走、分化、老化、細胞死の惹起などの正常な細胞の営みの進行は、ヒトゲノムの保持する様々な情報の読み出しがそれぞれ個別にのみならず、全体としての調和を持って正しいタイミングで必要十分なだけ行われることによって初めて保障されています。これに対し、過去半世紀近くに亘るがんに関わる遺伝子の研究は、がんの発生と進展の原因として様々な遺伝子の異常を明らかにし、同定した個々の遺伝子異常が関わる部分的なパスウェイやネットワークに関する知見を積み上げてきました。その結果、がん細胞の分子病態の本態は、ゲノムに生じた複数の遺伝子異常に起因した制御異常が複雑に相互に影響し合った状況下で、システムとしての統合的制御から逸脱した状態であることが明白になってきました。そして今、がん研究はこの本質的に極めて複雑な“システムを解く”という大きな問題に直面しており、その解決こそが飛躍的な進歩の鍵を握っています。
がん研究と並行して、ヒトゲノム計画により2004年にはヒトゲノムの完全解読が終了し、疾患特異的ゲノム異常探索の基盤ツールとなるリファレンス配列が整備されました。そして、我が国ではJSNPデータベースが整備され、国際HapMap計画ではその中心的役割を果たしてきた。このヒトゲノム計画の進展とともに、がんの分子レベルの解析において、一塩基多型(SNP)をベースにしたゲノムワイド関連解析(GWAS)によるがん関連遺伝子の探索のほか、次世代シーケンサーによる変異探索、DNAチップを用いたゲノムコピー数解析、網羅的遺伝子発現解析(トランスクリプトーム)、質量分析装置による網羅的蛋白解析(プロテオーム)、代謝物質解析(メタボローム)、さらに、がん特異的糖鎖修飾(グライコーム)などの研究が精力的に進められてきましたが、我が国のがんオミックス研究における貢献は、本領域の計画研究代表者らの業績にまさに象徴されています。がん研究はこれらの進展の結果、例を地球科学にとるならば、天上を周る人工衛星の登場によって、地上を這いながら行うしかなかった研究が、地球システムとして観測・研究できるようになったのと同質の大変革のチャンスを迎えています。しかしながら、洪水のようにゲノム網羅的な情報が集積する一方で、それらのゲノム上の個人差やゲノム・エピゲノム異常とそれに起因するプロテオーム・メタボロームの変化が関わる、がん化に伴う細胞内プロセスについての基礎的理解はいまだに十分ではなく、これまで研究されてきたがんの治療法や予防法がなぜ成功しなぜ失敗したのかを十分には評価できていません。そして、上述のような従前のアプローチによる情報の積み上げとデータ解析では大きな飛躍は望めず、閉塞感に満ちた現状を打破するものとして、がんのシステム的統合理解に基づく戦略に期待が寄せられています。このように、がん研究は、ゲノムの一次元地図の完備が起爆点となり、時間軸のある生命システムとしての超高次元空間の探索に向かっているといえるでしょう。
一方、システム生物学という言葉が流布されて10年以上になります。この方法論は、コンピュータを使った先端的な生命システムのモデル化・シミュレーションと、システムを理解するための実験データとを融合させることに、その核心を置いています。上述のゲノム研究の展開により生命システムを構成する個々の部品(ゲノムからメタボローム)とそのメカニズムについての知識が格段に増大しましたが、これまでシステム生物学では方法論の試験的な開発に重点が置かれ、ややもするとすでに実験的に明らかとなっていた生化学反応などのトイモデルをパソコンで計算し、in silicoで確認する程度に甘んじてきた傾向は否めません。また、多くの場合、大腸菌などの下等生物を実験系として用いており、特にヒトのがんという極めて複雑なシステムを対象に、この可能性に富むアプローチをもって挑戦し、新しい発見に直接的に寄与できることを実際に示し得たとする研究成果の報告は、現時点において残念ながらほとんど見当たらりません。また、創薬や治療などへの展開について計算的技術の裏打ちのないエッセイ的なメッセージが、研究現場に不適切な期待感を生みだしたことは遺憾です。
他方、気象学や経済学などは、数学による複雑なシステムの数理モデリングとコンピュータによるシミュレーションにより、すでに予測科学へと画期的変貌を遂げています。私たちは、これまでに生命システムとその計測データに特有の様々の困難を克服し、気象学や経済学で威力を発揮している状態空間モデル、データ同化、ベイジアンネットワークなどを駆使した新たな数理モデリングの方法を開発し、ヒトゲノム解析センターの「世界で2番目に速いライフサイエンス用スーパーコンピュータ」を活用して、予測能力をもった数千の分子のネットワーク(予測する地図)を解析する計算技術を実用レベルで開発しています。さらに、生体分子の動的ネットワーク解析のための、(ⅰ)パスウェイのモデリング・シミュレーションソフトウェア Cell Illustrator®、(ⅱ) 分子ネットワーク推定、可視化・シミュレーションなどのデータ解析の流れをグラフィカルに自在に組み立てることができるソフトウェア Cancer System integrative Pipeline (CSiP)、(ⅲ)ケースとコントロールデータから関与するパスウェイを推定するMetaGPなどのツール開発や、さらに、次世代シークエンサーデータのマッピングとアセンブルをする超並列システム(1000コア並列)の準備などを進めてきています。これらの生命システム解析技術は、技術的にゲノム・エピゲノムからメタボロームまでをシステムとして統合的に解析できるものであり、このようなスーパーコンピュータインフラと最先端の生命システム解析技術を有した研究グループは世界に類を見ません。
この研究は、以上のような学問的・研究準備の背景の下、がんをシステムとして解明しマネージするために、がんが関わっているシステムを構成するシステム要素とシステムの構成・動作原理解明のための網羅的解析(ゲノム、エピゲノム、遺伝子発現、マイクロRNA、プロテオーム、メタボローム解析など)、スーパーコンピュータを利用した大規模データ解析による生体分子ネットワークの解析、細胞・組織レベルでのシステムの動的モデリングとシミュレーションおよび実験的検証などを融合して、新たながん研究のパラダイムとなる革新的な領域の創成であり、がんの分子病態のシステム的な統合理解に基づいた精度の高い診断法、がんの個性や個人のシステムの違いを反映した治療法・予防法の開発を目指すものです。また、この研究で開発するシステム的方法論は、がん研究だけでなく、他の生命科学・医学研究へ波及するという効果も期待できます。
なお、研究では、システム生物学的なアプローチによるがんの分子病態解明と臨床応用に関する研究に加えて、がんの進行速度や浸潤転移などの個体レベルの臨床病態の予測に、数理的方法論や情報科学的方法論を導入した補完的な研究も組み入れる予定です。また、がん研究者とシステム生物学を始めとするバイオインフォマティクス研究者の共同研究を促進するためのインセンティブとしても公募研究を活用することも考えています。
このような研究領域の発展は、これまでの分子生物学的、遺伝学的解析が中心となっていたがん研究に、数学とスーパーコンピュータを駆使した計算システム生物学の方法論を導入することで、現在のがん研究が直面している限界をはじめて超えることが可能になり、がん研究の水準を飛躍的に向上・強化させることにつながります。本研究は、生物系(総合領域・腫瘍学・腫瘍診断学)と理工系・数物系科学(総合領域・情報学・生体生命情報学)の融合領域であり、前者はがん研究に対応し、後者は計算システム生物学に対応します。