2002年12月19日

cell computing大規模実証実験への参加について

東亞合成は、株式会社NTTデータが実施する「cell computing大規模実証実験」に参加します。cell computingは、家庭内や企業内のPCの余剰CPUパワーを統合し、仮想的なスーパーコンピュータとしての利用を実現するPCグリッド技術です。同様の試みはインテルやオックスフォード大学などでも行われ、140万人を集めたインテル癌研究プログラムでは、最近のスーパーコンピュータの1.5倍ほどの能力に相当したといわれています。

本実証実験における東亞合成の参加テーマは、「遺伝子病治療研究プロジェクト」で、その愛称は「BOLERO(Bio Odyssey of Lateen Explorer for Repeated Object)」です。30億個もの塩基からなるヒトのゲノムには、様々な繰返し配列が存在しています。近年、比較的短い繰返し配列と疾病との因果関係は、ハンチントン病をはじめ数多くの遺伝子病の解析により明らかになってきています。しかしながら、ヒトゲノムに潜むであろう長大(一万塩基以上)な周期性の探索研究、およびその周期性と遺伝子の変化により生じる疾病との関係等の研究については未だ進展していません。東亞合成がcell computing のために新規に開発したアプリケーション「LATEEN(Large-sequence Analytical Tool Energized by an Extensive Network)」は、ヒトゲノムに潜むこの長大な周期性を探索、特定することが可能です。この成果を、長大な周期性と病因遺伝子との関係の解明、さらには新薬開発の可能性へとつなげていきたいと考えます。

本件の詳細につきましては以下の通りです。なお、cell computing大規模実証実験の詳細に関しては、http://www.cellcomputing.jpを参照してください。

参加テーマ「遺伝子病治療研究プロジェクト」に関する詳細情報

背景
ゲノムプロジェクトの成果により、ヒトゲノムの約半分は生体機能への影響がほとんどわかっていない繰返し配列が占め、残りに様々な遺伝子が存在することがわかってきています。また、2~5個の塩基の繰返し配列であるSTRs(Short Tandem Repeat Sequence)の多くはゲノム中の遺伝子以外の領域にあり、個人によって繰返し回数が大きく異なることから多型マーカーとして注目されてきました。さらに、近年、ハンチントン病など数多くの遺伝子病が、原因遺伝子の中にある3塩基繰返し配列(トリプレットリピート)が伸長することが原因で発症することもわかってきています。このほかの比較的短い繰返し配列との関係については、生物の進化遺伝子や動物の性格・行動遺伝子などの面からも研究がなされています。しかしながら、ヒトゲノムに潜んでいる長大な一万塩基単位以上の繰り返し配列、および一部が変異しながら繰り返している長大な配列についての研究は未だ進展していません。
これらのことからゲノムの塩基配列の中に潜む一万塩基単位から数百万塩基単位の長大な未知の繰返し配列等の周期性探索、およびその周期性がどのようなDNA配列構造の中に存在し、どのようなパターンを有するかを解析することは、遺伝子病との関係を捉えるうえで非常に重要なものであると考えます。これらの解析により、遺伝子病の要因と考えられる遺伝子領域のDNA配列構造上の特徴等が解明できれば、遺伝子病治療の基礎的な方法の糸口になる可能性があると期待しています。
今回の実験に参加した目的
ヒトゲノム全領域にわたる未知長周期の探索およびそれらのパターンの探索は、分散処理が可能なデータ処理であるため、cell computingの特徴を十二分に活かすことができる研究テーマです。cell computing大規模実証実験を通じて、ヒトゲノムに潜んでいる未知の長大な周期性や未知のパターンを探索、解析することにより、遺伝子病とDNA配列構造との相関関係を明らかにし、遺伝子病の治療法の糸口を見つけだすことを目的とします。このような目的から、本実証実験における東亞合成の参加テーマ名を「遺伝子病治療研究プロジェクト」とし、その愛称をBOLERO(Bio Odyssey of Lateen Explorer for Repeated Object)としました。
なお、今回の大規模実証実験ではヒトの20番染色体から解析を始めます。20番染色体においては、すでに727の遺伝子が確認されています。この中には、クロイツフェルト・ヤコブ病の原因となるタンパク質「プリオン」の遺伝子や、生活習慣が引き金になって発症する「2型糖尿病」などの原因遺伝子が特定されています。
研究に用いる技術内容の紹介
  • 動的2次元色彩パターン化法
    動的2次元色彩パターン化法は、1次元配列の解析基点を連続的に変化させながら、列数を連続的に変化させた独自な2次元的な行列に変換し、それぞれを並列に配置、彩色する処理であり、人間の視覚能力を通して配列の特徴を動的に解析するものです。この方法により、配列情報構造の変化を、色彩情報構造の変化として動的に解析することが可能となります。これにより、一見すると規則性が認められないDNA塩基配列をはじめとする複雑な記号列に潜む未知のパターンを、顕在化させることが可能となります。

    基本的には、以下の手順に基づいて解析を行います。
    1. 1次元文字配列を一定の幅(例えば3とする)で折り返して、縦に細長い帯状配列をつくる。
    2. そのすぐ隣には、幅4で折り返したもの、幅5で折り返したもの、…という具合に、折り返し幅の異なる帯状配列を次々に並列していく。
    3. ここで、各文字に特定の色を対応させると、全体が一つの抽象デザイン画のようになる。これを、与えられた1次元配列から抽出された表象(2次元色彩パターン)とする。
    4. 1次元文字配列上の起点を一定の間隔で変えて、①から③をくり返す。
    5. 4を連続的に行うことで、2次元色彩パターンが視覚的に動的変化をする。この変化を利用して効率的に解析をする。
    なお本技術は、東亞合成の吉田徹彦主席研究員(当社新製品開発研究所)、大澤研二助教授(名古屋大学大学院多元数理科学研究科)、尾畑伸明教授(東北大学大学院情報科学研究科)らの共同研究チームにより完成された「記号列の特徴顕在化方法」(日本特許3149824号、米国特許6438496号および欧州公開特許089236号に記載の技術)を応用したものです。記号列の特徴顕在化方法につきましては、東亞合成が工業的所有権を有しています。
  • LATEEN(Large-sequence Analytical Tool Energized by an Extensive Network)
    2次元色彩パターン化法に基づいてヒトゲノム解析を行う領域候補を探索するために、東亞合成で開発したアプリケーションです。その動作原理は、配列の類似性解析に利用されるドットマトリックス法に準じたシンプルなものであり、染色体全領域においてある程度の長さの塩基配列を比較し、一定以上の確率で一致する領域のセットを探索するものです。対象データ領域の探索ジョブが容易に分割可能であるため、cell computingへの適用性が非常に高いものです。

以上

本件に関するお問い合せ先
東亞合成株式会社 新事業企画開発部 企画開発グループ
105-8419 東京都港区西新橋一丁目14番1号
03-3597-7372
TEL.03-3597-7240 または03-3597-7356