利用CRISPR研究基因組“暗物質”的論文

利用CRISPR研究基因組“暗物質”的論文

  超過98%的人類基因組由非編碼基因組成。這些非編碼基因被稱為基因組的“暗物質”,它們能調控編碼基因的表達,從而影響人類健康和疾病程序。自從人類基因組序列被公開發表以來,科學家們努力解析基因中的功能元件,包括非編碼調節區——參與轉錄調節的順式調節區和非編碼RNA(ncRNA)。轉錄因子在整個基因組中可能有數百至數千個結合位點,因此研究起來非常複雜。目前常用的兩種研究轉錄因子調控基因表達位點的方法是:1,耗時且複雜的增強子研究;2,在非天然狀態中克隆增強子或啟動子序列,開展並行研究。最近Sanjana等人和Fulco等人的研究都指出,可以利用CRISPR技術在天然狀態裡研究非編碼調控元件的功能。

  大規模的生化試驗使人們發現了由潛在的、被數百種蛋白靶向結合的調節序列。值得一提的是,識別脫氧核糖核酸酶I超敏感位點(deoxyribonuclease I hypersensitive site, DHS)和大規模染色質免疫沉澱測序(chromatin immunoprecipitation–sequencing, ChIP seq)方法的提出,讓科學家們能夠全面地解析蛋白與染色質結合的情況。然而,把這些分子和功能調控聯絡起來非常困難。

  由於使用不同的CRISPR載體可以無偏向性地敲除蛋白編碼基因,因此CRISPR篩選是研究非編碼基因功能的有力工具。與人類細胞中NGG(前間區序列鄰近基序)序列上游的基因序列同源的單引導RNA(single guide RNA, sgRNA)可以引導CRISPR系統到達特定基因組位點,從而特異性地引起突變。首個CRISPR“敲除”篩選研究在基因組規模上誘導了全基因敲除,並克服了RNA干擾篩選中的諸多限制,例如脫靶效應和敲除不完全(圖:CRISPR-Cas9篩選方法)。

  Sanjana等人使用CRISPR工具來研究黑色素瘤細胞中調控vemurafenib(B-Raf蛋白V600E突變中,600位點的纈氨酸被穀氨酸所替代,而Vemurafenib抑制攜帶了V600E突變的B-Raf蛋白中的絲氨酸 – 蘇氨酸蛋白激酶結構域)抗性的序列。研究人員使用CRISPR工具靶向主要的抗性調節區域——NF1(neurofibromatosis type 1,神經纖維瘤病1型基因)、NF2(neurofibromatosis type 2,神經纖維瘤病2型基因)和CUL3(cullin 3,泛素連線酶3)。該方法中,嚮導RNA和反式啟用crRNA(trans-activating crRNA)融合,引導來源於釀膿鏈球菌的Cas9(spCas9)在目標位點處誘導DNA雙鏈斷裂,從而產生突變。結果顯示,靶向CUL3的sgRNA在轉錄起始點最為富集。sgRNA富集的.區域,CUL3被敲除,這表明,CUL3似乎與染色體相互作用、組蛋白翻譯後修飾,以及轉錄因子結合位點阻斷的調控區域相關。

  Fulco等人利用CRISPR干擾系統,即利用失活的Cas9和KRAB蛋白融合,沉默靶向序列的表達。這種方法雖然實現了靶向性的基因沉默,但並未引起基因突變。研究者們設計的靶向序列圍繞在MYC和GATA1基因附近(這兩個基因能調控K562紅白血病細胞的增殖)。他們首先使用病毒感染細胞,將CRISPRi系統載帶進入細胞,然後使用多西環素誘導dCas9靶向目標序列。他們發現,sgRNA富集點恰好和包含多個轉錄因子結合位點的DHS重合。更有趣的是,dCas9靶向GATA1或組蛋白脫乙醯酶6(HDAC6)增強子時,都會減少HDAC6表達。這表明,對於共同的增強子(GATA1和HDAC6存在共同的增強子),基因之間存在競爭關係。鑑定出來的MYC增強子的位置與轉錄起始位點、CCCTC-結合因子(CTCF,介導染色質相互作用)結合位點都是吻合的。這可能是MYC調控細胞增殖的機制。

  雖然CRISPR-spCas9和CRISPRi篩選方法都成功識別了非編碼調節元件,但CRISPRi只能用於轉錄抑制,鑑於不同基因之間的轉錄抑制是不同的,CRISPR不一定能適用於其它基因的轉錄抑制。但總的來說,這兩項研究都證明了CRISPR在研究非編碼調控網路上的潛力。此外,研究已經證實,雖然非編碼基因的突變只能造成微小的基因表達變化,但可以造成大的表型變化,這意味著CRISPR篩選也可以推廣到其它疾病的表型測定上。儘管全基因組關聯研究已經鑑定出致病的生殖細胞突變,但是系統性研究致病的體細胞突變中的非編碼調控元件突變也具有重要意義。例如,研究表明,一些疾病的發病原因是特定轉錄因子結合位點增加的突變、基因重組造成的融合事件、ncRNA造成的突變,以及偽基因。對這些非編碼調控元件的研究能加深我們對疾病發生、發展的理解,從而促進臨床手段的研發。

最近訪問