【佳學(xué)基因檢測(cè)】基因檢測(cè)中如何進(jìn)行非編碼RNA和全轉(zhuǎn)錄組聯(lián)合分析
根據(jù)基因解碼體系,人體基因組即包括全外顯子測(cè)序中的主要組成部分編碼區(qū),也包括非蛋白質(zhì)編碼部分。人類(lèi)基因組不到2%屬于編碼區(qū),超過(guò)98%的區(qū)域?yàn)榉蔷幋a區(qū)?;蚪獯a表明,人類(lèi)基因組非編碼區(qū)至少80%是有生物活性的,并非基于數(shù)據(jù)庫(kù)比較的基因檢測(cè)所認(rèn)為的非編碼區(qū)是人體內(nèi)的"垃圾"DNA,沒(méi)有檢測(cè)的和分析的意義。從狹義上來(lái)說(shuō),轉(zhuǎn)錄組是指轉(zhuǎn)錄出來(lái)的所有mRNA的集合;從廣義上來(lái)說(shuō),轉(zhuǎn)錄組是指細(xì)胞內(nèi)所有轉(zhuǎn)錄產(chǎn)物的集合(包括mRNA和非編碼RNA)。
miRNA, circRNA以及l(fā)ncRNA作為一類(lèi)具有調(diào)控功能的非編碼RNA,是基因解碼體系中的重要內(nèi)容,并且調(diào)控對(duì)象均與mRNA有關(guān)。佳學(xué)基因解碼為了更好地普及除全外顯子基因檢測(cè)以外的基因信息知識(shí),特以此為概述非編碼RNA分子信息在人體疾病發(fā)生、發(fā)展及正常生理過(guò)程中的作用,同時(shí)介紹基因解碼知識(shí)體系中的ceRNA理論以及相關(guān)的全轉(zhuǎn)錄組聯(lián)合分析建庫(kù)和分析策略。
非編碼RNA概述
1.1 miRNA
miRNA是存在于人體內(nèi)一類(lèi)具有調(diào)控功能的內(nèi)源性非編碼RNA, 其大小約18~25個(gè)核苷酸?;蚪獯a信息資源miRBase數(shù)據(jù)庫(kù)(www.mirbase.org)收集了已經(jīng)進(jìn)行過(guò)同行評(píng)議研究的miRNA序列及生物學(xué)功能解釋 ,是采用數(shù)據(jù)庫(kù)比對(duì)技術(shù)可以借鑒的miRNA常用的數(shù)據(jù)庫(kù)。
成熟的 miRNAs 是由較長(zhǎng)的初級(jí)轉(zhuǎn)錄物經(jīng)過(guò)一系列核酸酶的剪切加工而產(chǎn)生的(首先miRNA基因通過(guò)RNA聚合酶II轉(zhuǎn)錄生成初級(jí)miRNA (pri-miRNA),pri-miRNA 在核酸酶 Drosha 的作用下,形成了 miRNA 的前體(pre-miRNA),pre-miRNA 在轉(zhuǎn)運(yùn)蛋白作用下轉(zhuǎn)運(yùn)至細(xì)胞質(zhì),Dicer酶將pre-miRNA的莖-環(huán)結(jié)構(gòu)剪切成為長(zhǎng)約22個(gè)核苷酸的雙鏈RNA片段,賊后其中一條鏈被降解,另一條鏈形成成熟的miRNA),隨后組裝進(jìn) RNA 誘導(dǎo)的沉默復(fù)合體(RISC),通過(guò)堿基互補(bǔ)配對(duì)的方式識(shí)別靶標(biāo)mRNA,并根據(jù)互補(bǔ)程度的不同指導(dǎo)沉默復(fù)合體降解靶標(biāo)mRNA 或者抑制靶標(biāo)mRNA 的翻譯,從而參與人體的正常生理過(guò)程。miRNA及其調(diào)節(jié)靶序列的基因突變,即使不影響蛋白質(zhì)的結(jié)構(gòu),也會(huì)通過(guò)影響蛋白質(zhì)的表達(dá)時(shí)空及組織特異性,而參與疾病的發(fā)生,對(duì)這一過(guò)程的理解和掌握是目前基因解碼技術(shù)所特有的。是基因信息分析超出普通過(guò)數(shù)據(jù)庫(kù)比對(duì)的地方。在人體,一般成熟miRNA的種子序列(5'端到3'端的2-8位核苷酸)與mRNA的3' UTR不有效互補(bǔ)配對(duì),從而抑制mRNA的翻譯。
miRNA作用機(jī)理
1.2 circRNA
circRNA是一類(lèi)具有閉合環(huán)狀結(jié)構(gòu)的非編碼RNA分子, 沒(méi)有5'帽子結(jié)構(gòu)和3' poly(A)尾巴結(jié)構(gòu),廣泛存在于人體的各種組織、生理及病理過(guò)程的多個(gè)階段。circRNA不容易被核酸外切酶(RNase R)降解,比線(xiàn)性RNA更穩(wěn)定,使得circRNA在開(kāi)發(fā)疾病新型診斷與治療方法上具有巨大潛力?;蚪獯a數(shù)據(jù)庫(kù)中circBase數(shù)據(jù)庫(kù)(http://www.circbase.org)收集了人、小鼠等多個(gè)物種的circRNA信息。
根據(jù)circRNA來(lái)源的基因組區(qū)域,可以將circRNA分為外顯子circRNA(ecircRNA), 內(nèi)含子circRNA(ciRNA), 外顯子-內(nèi)含子circRNA(EIciRNA)和基因間區(qū)circRNA,其中外顯子circRNA是人體內(nèi)賊普遍的一類(lèi)circRNA。外顯子circRNA來(lái)源于pre-mRNA 發(fā)生的反向剪切,在反向剪切的過(guò)程中,5’剪切位點(diǎn)下游與 3’剪切位點(diǎn)上游連接在一起形成 3’,5’磷酸二酯鍵。
基因解碼清晰地揭示出,circRNA可以充當(dāng)miRNA和蛋白質(zhì)的分子海綿、影響轉(zhuǎn)錄、干擾mRNA前體的正常剪接、調(diào)控mRNA分子翻譯、形成環(huán)形RNA蛋白質(zhì)復(fù)合體、與mRNA競(jìng)爭(zhēng)性結(jié)合蛋白質(zhì)等機(jī)制,參與免疫、代謝、神經(jīng)系統(tǒng)發(fā)育和細(xì)胞增殖等生物學(xué)過(guò)程中。
cirRNA的功能和生物醫(yī)學(xué)應(yīng)用
1.3 lncRNA
lncRNA是指一類(lèi)長(zhǎng)度大于200nt的長(zhǎng)鏈非編碼RNA。根據(jù)與編碼基因的相對(duì)位置,可將lncRNA分為基因間型(intergenic lncRNAs)、內(nèi)含子型(intronic lncRNAs)、反義型(antisense lncRNAs)、正義重疊型(Sense-overlapping lncRNAs)類(lèi)型。
大多數(shù)lncRNA由RNA聚合酶II (Pol II) 轉(zhuǎn)錄產(chǎn)生,具有5'帽子結(jié)構(gòu)和3' poly(A)尾巴結(jié)構(gòu),但是其加工剪接效率較低,并且呈現(xiàn)出明顯的細(xì)胞核定位現(xiàn)象。定位在細(xì)胞核的lncRNA,可以與DNA、RNA、蛋白質(zhì)等多種分子相互作用,調(diào)控染色體結(jié)構(gòu)和功能;通過(guò)順式(cis)或反式(trans)調(diào)控基因的轉(zhuǎn)錄,影響mRNA的剪接、穩(wěn)定和翻譯等。剪接加工有效的lncRNA轉(zhuǎn)運(yùn)至細(xì)胞質(zhì),在轉(zhuǎn)錄后水平反式調(diào)控基因表達(dá)(如調(diào)節(jié)mRNA翻譯和降解等)。
lncRNA轉(zhuǎn)錄水平調(diào)控
02 ceRNA假說(shuō)
哈佛醫(yī)學(xué)院Pier Paolo Pandolfi研究小組于2011年提出了競(jìng)爭(zhēng)性?xún)?nèi)源RNA(ceRNA)假說(shuō),假說(shuō)認(rèn)為內(nèi)源性RNA分子(如circRNA,lncRNA,假基因等)具有miRNA作用位點(diǎn),可以競(jìng)爭(zhēng)性地與miRNA結(jié)合,從而間接調(diào)控miRNA靶基因的表達(dá)。
當(dāng)ceRNA表達(dá)沉默時(shí),mRNA在miRNA介導(dǎo)的沉默復(fù)合體(RISC)作用下被降解或翻譯被抑制;而當(dāng)ceRNA表達(dá)激活后,可競(jìng)爭(zhēng)性結(jié)合miRNA的RISC復(fù)合物,降低miRNA降解mRNA或抑制翻譯的功能,從而上調(diào)基因的表達(dá)量。
ceRNA機(jī)制(a.假基因沉默,b.假基因激活)
03 全轉(zhuǎn)錄組聯(lián)合分析
在生物體內(nèi),任何一類(lèi)RNA分子都不是孤立的,它們行使不同的生物學(xué)功能,共同參與生物體復(fù)雜的調(diào)控機(jī)制。全轉(zhuǎn)錄組關(guān)聯(lián)分析的原理是基于非編碼RNA分子可以參與調(diào)控mRNA的表達(dá)以及ceRNA 假說(shuō)。全轉(zhuǎn)錄組聯(lián)合分析是指針對(duì)一份樣品同時(shí)分析mRNA, lncRNA, circRNA和miRNA之間的聯(lián)合調(diào)控關(guān)系,構(gòu)建全面精細(xì)的RNA調(diào)控網(wǎng)絡(luò),更好地闡明生物學(xué)相關(guān)的問(wèn)題。
3.1 建庫(kù)策略
建兩個(gè)庫(kù):分別建Total RNA(包含mRNA, circRNA, lncRNA)的文庫(kù)和建miRNA的文庫(kù),缺點(diǎn)是環(huán)狀RNA有效數(shù)據(jù)量低,不易檢測(cè)到低豐度的環(huán)狀RNA。
建三個(gè)庫(kù):分別建Total RNA(包含mRNA, circRNA, lncRNA)的文庫(kù),miRNA的文庫(kù)和富集circRNA的文庫(kù)。富集circRNA的文庫(kù)利用環(huán)狀RNA可以抵御核酸外切酶降解的特點(diǎn),往樣本中加入核酸外切酶,去除線(xiàn)性RNA而僅保留環(huán)狀RNA,從而排除了線(xiàn)性RNA的干擾,提高了環(huán)狀RNA的有效數(shù)據(jù)量。
3.2 聯(lián)合分析策略
全轉(zhuǎn)錄組聯(lián)合分析策略分為WTS和共表達(dá)分析。
WTS分析是基于差異比較組合之間差異表達(dá)的RNA分子序列信息,預(yù)測(cè)差異表達(dá)RNA分子兩兩間的靶向關(guān)系(考慮序列的互補(bǔ)配對(duì)和結(jié)合自由能等),構(gòu)建非編碼RNA分子和mRNA的調(diào)控網(wǎng)絡(luò)。
共表達(dá)分析是基于多個(gè)樣本(大于5個(gè))的不同分子的表達(dá)量進(jìn)行表達(dá)相關(guān)性分析,篩選顯著相關(guān)的靶向關(guān)系(其中miRNA與靶標(biāo)基因呈負(fù)相關(guān)) 構(gòu)建非編碼RNA分子與mRNA的共表達(dá)網(wǎng)絡(luò)??蛻?hù)可根據(jù)自身需要以及實(shí)驗(yàn)的樣本情況,選擇合適的分析方法或整合兩種方法。