ft

ENCODEプロジェクト

ENCODEプロジェクトが大きな成果を出した模様です。

http://www3.nhk.or.jp/news/html/20120906/k10014836351000.html

ニュースに大雑把に書いてありますが、若干補足。
ヒトのdraft genomeが読まれたのが、complete genomeが読まれたのが2003年です。もう10年以上前の出来事ですね。

ヒトゲノム計画の最も驚くべき成果は、
「ヒトゲノム中の2%弱のみが遺伝子であり、98%は遺伝子ではない」
「ヒトに含まれている遺伝子は2万個であり、線虫とほぼ等しい」
という事です。ヒトゲノムが読まれる前までは、ヒトに含まれる遺伝子は10万以上と見積もれており、まさか線虫と同じ遺伝子数でこのような複雑なシステムが作られているとは考えていなかったのです。

そのため、ヒトゲノム解読後のゲノム生物学の重要な問いのひとつに、
「ゲノムの遺伝子でない部分はどのような働きを持つのか?(または持たないのか?)」
「どのようにして少ない遺伝子でヒトのような複雑なシステムを作り上げているのか?」
がありました。

それを解き明かすプロジェクトが、ENCODE(Encyclopedia of DNA Elements)プロジェクトです。なお、ヒトではなく線虫及びショウジョウバエでも似たようなプロジェクトが存在します。(The Model Organism Encyclopedia Of DNA Elements (modENCODE) project)

で、そのENCODEプロジェクトが昨日33本も論文を提出しました。
詳細はこちら
http://www.nature.com/encode/

Nature6本、Science2本、Cell1本、Genome Research18本、Genome Biology6本ととんでもない内容です。(Nature及びScienceは総合科学のトップジャーナル双璧ですし、Cellは生物学のトップジャーナル、Genome Researchはゲノム科学のトップジャーナル、Genome BiologyはGenome researchに次ぐゲノム科学のジャーナルです)

もちろん昨日いきなり「遺伝子以外の部分にも実は意味があったんだ!」と認識が変わったわけでなく、個別の実験で、遺伝子以外の部分にも転写因子の結合や非翻訳RNAクロマチン構造の形成に役割をなす、などといった領域があるのはわかっていたわけですが、それがヒトゲノム全体でどのようになっているのかはわかっていませんでした。

まだ一本も論文を読んでいないので大きなことは何ともいえないのですが、正直80%に意味があるというのは(若干大きめに言っていたとしても)私が想像していたよりは大きい数字です。さすがにもっとジャンクがあると思っていました。Bioinformaticianとしては非常にホットな話題で、学生の間では早速ENCODE勉強会の開催が企画されました。

今後は、また多様な細胞及び状態におけるゲノム動態の観察によるENCODEプロジェクトの深化、ENCODEのデータを用いた生物学のシステム的理解、またmodENCODEプロジェクトの進行などに伴う比較生物システム学が進むことと考えられます。