由美國(guó)人類基因組研究所資助的一個(gè)規(guī)模巨大的性項(xiàng)目,稱為DNA元素百科全書(ENCODE),9月5日,有6篇論文在《自然》、24篇論文在《基因組研究和基因組生物學(xué)》、2篇論文在《科學(xué)》發(fā)表。32個(gè)機(jī)構(gòu)和442個(gè)研究人員,參加了這個(gè)項(xiàng)目的研究。該項(xiàng)目發(fā)現(xiàn):人類基因組DNA,包括略少于21000個(gè)蛋白質(zhì)編碼基因,8800個(gè)小RNA分子,9600個(gè)長(zhǎng)非編碼RNA分子,11224個(gè)假基因。只有不到3%的基因組的基因,能夠編碼蛋白質(zhì)。約有80%的基因組是具有生物活性的?;蚪MDNA的76%轉(zhuǎn)錄成多種RNA。部分堿基,轉(zhuǎn)變成RNA鏈,執(zhí)行基因調(diào)控等功能。許多堿基在人類生物學(xué)中起作用,如有助于決定一個(gè)基因的起動(dòng)和終止。許多堿基僅落在化學(xué)修飾的位置,成為染色體的一些沉默片段。絕大多數(shù)堿基,沒有什么用處。400萬(wàn)個(gè)位點(diǎn)是控制基因活性的開關(guān),給每一類型細(xì)胞以*的基因組標(biāo)識(shí)。創(chuàng)建的ENCODE圖譜,可以放大查看自染色體到單個(gè)堿基和開關(guān),那些堿基是否產(chǎn)生RNA,或是在哪些地方與DNA調(diào)控蛋白相結(jié)合。一些科學(xué)家,正在利用ENCODE的信息于多種疾病和表觀遺傳學(xué)的研究。ENCODE的研究結(jié)果,將改變?nèi)藗儗?duì)人類基因組的思維方式
伊利莎白·派尼茜(ElizabethPennisi),美國(guó)科學(xué)促進(jìn)協(xié)會(huì),2012年9月5日
一個(gè)規(guī)模巨大的項(xiàng)目已經(jīng)發(fā)現(xiàn),人類基因組——1個(gè)人遺傳信息的總和——在學(xué)校學(xué)習(xí)的青少年的基因組,含有比編碼蛋白質(zhì)的基因多得多的遺傳信息。20世紀(jì)90年代后期,研究人員決定對(duì)人類基因組進(jìn)行序列測(cè)定,那時(shí),他們專注于發(fā)現(xiàn)那些傳統(tǒng)意義上的基因,以便鑒定出生命必須的全部蛋白質(zhì)。每一個(gè)基因,被認(rèn)為是一個(gè)離散的DNA片段;它的DNA堿基的順序——大家所熟悉的“字母”分子是構(gòu)建DNA片段的元素——認(rèn)為是用于編碼一種特定的蛋白質(zhì)。但是,破譯人類基因組的科學(xué)家們發(fā)現(xiàn),令他們驚訝的是,只有不到3%基因組的基因,能夠編碼蛋白質(zhì)。其中,其他的數(shù)十億堿基,幾乎是沒有用處的。
現(xiàn)在,一個(gè)美資項(xiàng)目,稱為DNA元素百科全書(ENCODE),不管怎么說,他們已經(jīng)發(fā)現(xiàn)了許多堿基,在人類生物學(xué)中起著作用:例如,它們有助于決定一個(gè)基因的啟動(dòng)和終止。例如,它可以調(diào)節(jié)一個(gè)腎細(xì)胞或另一個(gè)腦細(xì)胞。耶魯大學(xué)的生物信息學(xué)家馬克·格斯坦(MarkGerstein)說:“基因組遠(yuǎn)比基因更復(fù)雜。”
來自這個(gè)項(xiàng)目的真知灼見,有助于研究人員了解疾病和遺傳之間的關(guān)系。位于英國(guó)辛克斯頓的歐洲生物信息學(xué)研究所的生物信息學(xué)家伊萬(wàn)·伯尼(EwanBirney)說:“我們正被告知研究疾病的一種方法,除此之外,這將是非常困難的。”
作為ENCODE的組成部分,32個(gè)機(jī)構(gòu)做計(jì)算機(jī)分析、生化測(cè)試和142個(gè)細(xì)胞類型的測(cè)序研究——6個(gè)是相當(dāng)廣泛地——找出30億個(gè)堿基中的每一個(gè)堿基的功能。ENCODE的442個(gè)研究人員,今天(2012年9月5日)在《自然》雜志報(bào)告,約有80%的基因組是具有生化活性的。其他的堿基,轉(zhuǎn)變成RNA鏈,執(zhí)行它們自己的功能,例如基因調(diào)控。(RNA通常被認(rèn)作有助于制造蛋白質(zhì)的起中介作用的信使分子,但ENCODE指出,更多的RNA是一種終端產(chǎn)品,并不用于制造蛋白質(zhì)。)而許多堿基僅僅落在化學(xué)修飾的位置,用作我們?nèi)旧w的一些沉默片段。
科學(xué)家們關(guān)于基因的認(rèn)識(shí),在ENCODE的結(jié)果中,是如何不斷變化的。該項(xiàng)目發(fā)現(xiàn),約有基因組DNA的76%,被轉(zhuǎn)錄成一種或另一種樣子的RNA,比研究人員原初預(yù)計(jì)的更多。人類基因組DNA包括,略少于21000個(gè)蛋白質(zhì)編碼基因(一些研究人員曾經(jīng)估計(jì)我們有超過10萬(wàn)個(gè)這樣的基因);8800個(gè)小RNA分子和9600個(gè)長(zhǎng)非編碼RNA分子,這些“基因”中的每一個(gè)至少有200個(gè)堿基的長(zhǎng)度;以及11224個(gè)DNA片段被歸類為假基因,目前已知這種“不運(yùn)行”的基因,在某些類型細(xì)胞或單個(gè)細(xì)胞中,事實(shí)上是具有活性的。此外,定義這些基因的起始端和編碼區(qū)的努力,顯示了這些基因可以重疊,并有多個(gè)起始端和終末端。
該項(xiàng)目在我們的DNA中,發(fā)現(xiàn)了400萬(wàn)個(gè)位點(diǎn),作為控制基因活性的開關(guān)。這些開關(guān)離基因既可以遠(yuǎn)也可以近,它們?cè)诓煌愋图?xì)胞的不同組合中,調(diào)節(jié)和發(fā)揮作用,給每一類型細(xì)胞以*的基因組標(biāo)識(shí)。此外,至少由基因組產(chǎn)生的一些RNA鏈,也有助于控制由特定基因活動(dòng)產(chǎn)生的幾個(gè)蛋白質(zhì)。因此,基因的調(diào)控,不斷證明要比曾經(jīng)預(yù)期的復(fù)雜得多。
這些和其他的研究結(jié)果,今天有6篇論文發(fā)表在《自然》,以及有24篇論文發(fā)表在《基因組研究和基因組生物學(xué)》。另外的2篇論文在線發(fā)表于今天的《科學(xué)》。在一個(gè)數(shù)據(jù)庫(kù)中,ENCODE創(chuàng)建了一份圖譜,顯示出所有不同堿基所起的作用。位于馬里蘭州貝塞斯達(dá)的資助ENCODE的國(guó)家人類基因組研究所的一個(gè)項(xiàng)目主管,愛麗絲·法因戈?duì)柕拢‥liseFeingold)說:“對(duì)人類基因組來說,這份圖譜好像谷歌地圖一樣。”人們可以在谷歌地圖上,選擇不同的視圖,來觀察地球表面某一景觀的不同方面。同樣,在這份ENCODE圖譜中,例如,人們可以放大自染色體水平到單個(gè)堿基和開關(guān),來查看那些堿基是否產(chǎn)生RNA,或是在那些地方與DNA調(diào)控蛋白相結(jié)合。
位于西雅圖的華盛頓大學(xué)的一個(gè)ENCODE研究人員約翰·A.斯泰馬圖延那泡勒斯(JohnA.Stamatoyannopoulos)說,這份圖譜的目錄“將改變?nèi)藗冴P(guān)于對(duì)這個(gè)人類基因組的思維方式和其實(shí)際的應(yīng)用。”
他和其他的一些人,正在利用這種信息——這種信息中的許多已公開地可以利用——用以了解關(guān)于遺傳對(duì)疾病的影響。許多大型的研究,已發(fā)現(xiàn)一些特定的堿基,與自糖尿病到關(guān)節(jié)炎范圍內(nèi)疾病的較高或較低風(fēng)險(xiǎn)有關(guān)聯(lián)。現(xiàn)在,研究人員可注意觀察那些變異,是否涉及某些種類的調(diào)控,如果是這樣的話,是哪些基因受到了調(diào)控。與ENCODE沒有關(guān)聯(lián)的加拿大多倫多大學(xué)分子生物學(xué)家馬修·拉品茵(MathieuLupien)說,對(duì)他的癌癥和表觀遺傳學(xué)的研究而言,“ENCODE的數(shù)據(jù)是十分重要的。”