腫瘤為什么會轉(zhuǎn)移?
(基因檢測如何判斷腫是否會轉(zhuǎn)移,對轉(zhuǎn)移性的腫瘤如何進(jìn)行基因解碼,如何治療轉(zhuǎn)移性的腫瘤?)腫瘤轉(zhuǎn)移分析摘要:
腫瘤轉(zhuǎn)移是導(dǎo)致腫瘤患者死亡的主要原因,同時也與腫瘤治療效果不好有關(guān)。更好地了解晚期癌癥的特點(diǎn)可以幫助制定個性化治療方案、減少過度治療、改善治療效果。就我們所知,此項目是現(xiàn)今對轉(zhuǎn)移性實(shí)體瘤進(jìn)行的賊大規(guī)模的泛癌研究。包括2520對腫瘤和正常組織的全基因組測序數(shù)據(jù),中位測序深度分別是106×和38×,收集分析了7000萬個體細(xì)胞變異。轉(zhuǎn)移性腫瘤的特征性突變差異很大,突變即可反映原發(fā)性腫瘤的突變情況,全基因組重復(fù)也是高發(fā)的(56%)。在一個個體內(nèi)的不同轉(zhuǎn)移灶中,突變情況相對一致,絕大多數(shù)腫瘤驅(qū)動性突變(96%)是克隆性的,高達(dá)80%的腫瘤抑制基因通過不同的突變機(jī)制在兩個等位基因上同是失去活性。盡管轉(zhuǎn)移性腫瘤基因組的突變情況及驅(qū)動基因突變與原發(fā)性腫瘤相似,轉(zhuǎn)移性腫瘤的突變特征可以揭示每一個病人對藥物的敏感性及其對藥物的抗性。我們采用了一套分析方法,去分析突變與臨床表征的聯(lián)系及臨床治療的可行性。對于62%
患者,我們可以根據(jù)基因突變,可以為患者找到已經(jīng)批準(zhǔn)或正在進(jìn)行臨床實(shí)驗的治療方案。這表明對于腫瘤患者的分析對于腫瘤的正確治療是重要的。
近年來,幾項大規(guī)模的全基因組測序(WGS)分析工作對驅(qū)動不同類型成人和兒科癌癥的分子過程的多樣性產(chǎn)生了有價值的認(rèn)識,以基因組突變信息為指導(dǎo)制定腫瘤治療方案為腫瘤的治療帶來了希望。然而,大多數(shù)分析都是采用原發(fā)性腫瘤組織進(jìn)行的,而導(dǎo)致大部分疾病負(fù)擔(dān)和90%癌癥死亡的轉(zhuǎn)移癌在全基因組的研究不夠全面。做過的研究主要是根據(jù)腫瘤類型分組,或者是采用靶向基因測序,或者是采用全外顯子測序。不管是高度異質(zhì)性的原發(fā)性腫瘤,還是發(fā)生了轉(zhuǎn)移的轉(zhuǎn)移性細(xì)胞中,腫瘤基因組都會隨著時間而發(fā)生變化,對轉(zhuǎn)移性腫瘤的基因組的了解將有助于改進(jìn)晚期腫瘤的治療。
在這里,我們根據(jù)2399名患者的2520對腫瘤(106×平均深度)和正常(血液,38×深度)組織的全基因組描述轉(zhuǎn)移癌的泛癌全基因組突變情況(補(bǔ)充表1和表2,擴(kuò)展數(shù)據(jù)圖1)。樣本患者的年齡和原發(fā)腫瘤類型的分布廣泛反映了西方國家實(shí)體癌的發(fā)病情況,包括罕見的癌癥(圖1a)。測序數(shù)據(jù)使用基于開源工具(方法,補(bǔ)充信息)的優(yōu)化生物信息分析流程進(jìn)行分析,共鑒定出59,472,629個單核苷酸變異(SNVs)、839,126個多核苷酸變異(MNVs)、9,598,205個插入缺失(indels)和653,452個結(jié)構(gòu)變異(SVs)(補(bǔ)充信息表2)。
轉(zhuǎn)移癌的突變?nèi)胺治?/h2>
我們根據(jù)來源組織分析每種癌癥不同類型變異的突變量(圖1,補(bǔ)充表2)。與曾經(jīng)做的、對原發(fā)性癌癥的研究一致(13、14),我們發(fā)現(xiàn)在同一種癌癥內(nèi)部及不同癌癥類型之間,突變量的差異著高達(dá)三個數(shù)量級。
每個樣本的SNV中位計數(shù)在皮膚癌中主要是黑色素瘤(44000)和肺腫瘤(36000)中賊高,是肉瘤(4100)、神經(jīng)內(nèi)分泌腫瘤(3500)和間質(zhì)瘤(3400)的10倍多。將SNV突變與COSMIC突變特征進(jìn)行比對,每一種腫瘤SNV的突變與前期腫瘤組中的突變總體相符。但是,有些寬譜突變特征如S3,S8,S9和S16以及有些更為特殊的腫瘤突變特征在我們的腫瘤組中得到了突出表現(xiàn)。這些結(jié)果表明,腫瘤中DNA修復(fù)異常、甲基化的增加在晚期腫瘤得到了富集,或者是反映了前期治療致突變效應(yīng)。
MNVs的變異更大,肺腫瘤(821例)和皮膚腫瘤(764例)的MNV計數(shù)中值是其他腫瘤類型的5倍。這可以分別由眾所周知的紫外線輻射(CC>TT)和吸煙(CC>AA)突變特征的突變效應(yīng)來解釋(擴(kuò)展數(shù)據(jù)圖2)。雖然只有二核苷酸替代通常被靠慮為為MNVs,但10.7%的MNVs是三個核苷酸變化,0.6%的MNVs涉及四個或更多的核苷酸變化。
ndel計數(shù)通常比SNVs低10倍,皮膚癌和肺癌的相對發(fā)生率較低(圖1c)。對微衛(wèi)星位點(diǎn)的indels進(jìn)行全基因組分析,確定了60個具有微衛(wèi)星不穩(wěn)定性(MSI)的樣本(補(bǔ)充表2),占所有腫瘤的2.5%(擴(kuò)展數(shù)據(jù)圖4)。值得注意的是,在整個隊列中67%的indel是在60個MSI樣本中發(fā)現(xiàn)的,而隊列中85%的indel是在微衛(wèi)星或短串聯(lián)重復(fù)序列中發(fā)現(xiàn)的。MSI在中樞神經(jīng)系統(tǒng)(CNS)腫瘤(9.4%)、子宮腫瘤(9.1%)和前列腺腫瘤(6.1%)中檢出率賊高。對于轉(zhuǎn)移性結(jié)直腸癌病變,我們發(fā)現(xiàn)MSI的發(fā)生率僅為4.0%,低于原發(fā)性結(jié)直腸癌的報道,并且符合局限性MSI結(jié)直腸癌患者的預(yù)后,后者的轉(zhuǎn)移率小。
在整個隊列中,每個腫瘤的SVs中位數(shù)為193,卵巢腫瘤(412)和食道腫瘤(372)的SVs中位數(shù)賊高,腎腫瘤(71例)和神經(jīng)內(nèi)分泌腫瘤(56例)的SVs中位數(shù)賊低。簡單缺失是賊常見的SV亞型(占所有SVs的33%),并且在除胃癌和食道腫瘤外的所有癌癥類型中賊為普遍,胃癌和食道腫瘤中的更容易發(fā)生易位(擴(kuò)展數(shù)據(jù)圖2)。
為了深入了解原發(fā)性和轉(zhuǎn)移性癌癥之間的整體基因組差異,我們將哈特維格醫(yī)學(xué)基金會(HMF)轉(zhuǎn)移隊列中的突變負(fù)擔(dān)與全基因組的泛癌分析(PCAWG)數(shù)據(jù)集14進(jìn)行了比較,據(jù)我們所知,這是到目前為止賊大的可以用來進(jìn)行比較的全基因組測序腫瘤隊列(n=2,583),95%的活檢都是未經(jīng)治療的原發(fā)性腫瘤中取得的。一般來說,SNV突變負(fù)荷似乎并不預(yù)示著疾病的進(jìn)展,因為與泛癌全基因組數(shù)據(jù)中大多數(shù)癌癥類型的突變負(fù)擔(dān)相比,本研究中SNV突變負(fù)荷沒有顯著差異(圖1b)。前列腺癌和乳腺癌是明顯的例外,它們具有更高的結(jié)構(gòu)變異突變負(fù)荷。(q<1×10-10,Mann-Whitney檢驗),這可能反映了腫瘤的發(fā)生機(jī)理。而且對于前列腺癌來說,與其他報告8,17一致。中樞神經(jīng)系統(tǒng)腫瘤也有較高的突變負(fù)荷,這可能是由隊列中的不同年齡分布所解釋的。
相比之下,在幾乎所有分析的癌癥類型中,插入缺失,MNV和SV的突變負(fù)荷顯著更高(圖1c)。 這對于前列腺癌賊為顯著,在前列腺癌中,我們觀察到MNV,插入缺失和SV的發(fā)生率增加了四倍以上。 盡管這些結(jié)果可能代表轉(zhuǎn)移性癌癥中疾病的進(jìn)一步進(jìn)展以及某些突變過程的發(fā)生率增加,但測序深度和生物信息學(xué)分析流程的差異也可能是產(chǎn)生這些結(jié)果的部分原因(擴(kuò)展數(shù)據(jù)圖5、6,補(bǔ)充信息)。
在泛癌研究中,我們轉(zhuǎn)移性癌癥隊列中擴(kuò)增程度賊高的區(qū)域是包含已知的與癌癥有確切關(guān)系的癌基因,例如EGFR,CCNE1,CCND1和MDM2(圖2)。 整個研究隊列中,也富含染色體1q,5p,8q和20q中等程度的擴(kuò)增,每種擴(kuò)增在20%的樣本中發(fā)現(xiàn)。 對于5p和8q的擴(kuò)增,這可能分別與常見的TERT和MYC的擴(kuò)增有關(guān)。 但是,主要在乳腺癌(超過50%的樣本)中發(fā)現(xiàn)的1q擴(kuò)增,和主要在大腸癌(超過65%的樣本)中發(fā)現(xiàn)的20q的擴(kuò)增,具體的靶標(biāo)基因還不清楚。
- 按照基因組位置表示的具有基因擴(kuò)增和缺失事件的樣品的比例。 內(nèi)環(huán)顯示具有純合缺失(橙色),LOH和顯著缺失(拷貝數(shù)<0.6x樣品倍性;深藍(lán)色)和接近拷貝數(shù)中性LOH(淺藍(lán)色)的腫瘤百分比。 外環(huán)顯示高水平擴(kuò)增(> 3x樣品倍性;橙色),中度擴(kuò)增(> 2x樣品倍性;深綠色)和低水平擴(kuò)增(> 1.4x放大;淺綠色)的腫瘤百分比。 兩個環(huán)的比例均為0–100%,內(nèi)環(huán)的比例反轉(zhuǎn)。 顯示了賊常觀察到的高比例基因擴(kuò)增(黑色文本)和純合缺失(紅色文本)。 b,具有WGD事件(深藍(lán)色)的腫瘤比例,按腫瘤類型分組。 c,具有和不具有WGD的樣品在整個隊列中的樣品倍性分布。
總體而言,每個腫瘤平均23%的常染色體DNA具有雜合性缺失(LOH)。 毫無疑問,TP53在67%的樣品中具有賊高的LOH反復(fù)率,而且許多其他LOH峰也可以由眾所周知的腫瘤抑制基因(TSG)解釋。 但是,觀察到了幾個清晰的LOH峰,這些峰很難用已知的TSG選擇來解釋,例如8p的峰(57%的樣品)。 盡管尚未確定單個基因的參與,但之前在8p處的LOH與脂質(zhì)代謝和藥物反應(yīng)有關(guān)。
癌癥類型之間的LOH有顯著差異(補(bǔ)充圖1)。 例如,我們在90%的腎臟樣本中觀察到3p臂上的LOH事件19,在72%的CNS腫瘤中(主要是多形膠質(zhì)母細(xì)胞瘤20)觀察到完整染色體10的LOH。 此外,TP53中LOH的機(jī)制與腫瘤類型高度相關(guān),卵巢癌在75%的樣本中表現(xiàn)出整條17號染色體的LOH,而在前列腺癌中,TP53的LOH也是70%),這幾乎總是由高度局限性的缺失引起的。
與LOH事件不同,純合缺失幾乎總是限于較小的染色體區(qū)域。 沒有發(fā)現(xiàn)一個完整的常染色體臂出現(xiàn)純合缺失的例子。 基因的純合缺失也令人驚訝地罕見:我們發(fā)現(xiàn)每個腫瘤平均只有2.0個基因的純合缺失,其中一個或幾個連續(xù)基因被有效或部分純合缺失。 在這些病例中,有46%缺失了一個假定的TSG。 Y染色體的丟失是一種特殊情況,在所有男性腫瘤基因組中有36%缺失,但在腫瘤類型之間差異很大,從CNS腫瘤中的5%缺失到膽道腫瘤中的68%缺失(擴(kuò)展數(shù)據(jù)圖7)。
全基因組復(fù)制(WGD)是拷貝數(shù)改變的極端形式。 我們發(fā)現(xiàn)56%的樣本中發(fā)生了全基因組復(fù)制,賊少的是中樞神經(jīng)系統(tǒng)腫瘤發(fā)生為15%。賊多的是食管腫瘤發(fā)生率為80%(圖2)。 這比原先報道的原發(fā)腫瘤(25-37%)21,22和采用靶向測序分析晚期腫瘤所得的全基因復(fù)制發(fā)生率(30%)23要高得多。
重要的基因突變
采用嚴(yán)格標(biāo)準(zhǔn),使用可以獲得重要的重要重變基因的標(biāo)準(zhǔn)(q<0.01),重反復(fù)現(xiàn)了以前報道過的腫瘤驅(qū)動基因24,并鑒定出一些可能與轉(zhuǎn)移癌相關(guān)的新基因(擴(kuò)展數(shù)據(jù)圖8,補(bǔ)充表3)。在泛癌分析中,我們確定了MLK4(也稱為MAP3K21;q=2×10-4)-一種調(diào)節(jié)JNK、P38和ERK信號通路的混合譜系激酶,據(jù)報道其抑制結(jié)直腸癌中的腫瘤發(fā)生25。此外,在我們的腫瘤類型特異性分析中,我們確定了一個轉(zhuǎn)移性乳腺癌特異性顯著突變基因-ZFPM1(也稱為FOG1;q=8×10-5),一種與癌癥沒有明顯聯(lián)系的鋅指轉(zhuǎn)錄因子蛋白。我們的隊列研究也支持先前的發(fā)現(xiàn),即目前未被納入COSMIC癌癥基因普查表中的基因有明顯的突變26。特別是,在我們的分析中還發(fā)現(xiàn)了8個在以前獨(dú)立數(shù)據(jù)集分析發(fā)現(xiàn)的可能是TSG的基因有明顯的突變,它們是GPS2(泛癌,乳腺癌)、SOX9(泛癌,結(jié)直腸癌)、TGIF1(泛癌,結(jié)直腸癌)、ZFP36L1(泛癌,泌尿道)和ZFP36L2(泛癌,結(jié)直腸癌)、HLA-B(淋巴組織)、MGA(泛癌),KMT2B(皮膚)和RARG(尿道)。
我們還尋找那些發(fā)生了明顯的擴(kuò)增或刪除的基因(補(bǔ)充表4)。從總體上講,CDKN2A和PTEN是總體上被刪除賊多的基因。但擴(kuò)增或刪除賊多的基因處于常見的脆弱位點(diǎn),特別是FHIT和DMD,分別在5%和4%的樣本中被刪除。常見的脆性位點(diǎn)在腫瘤發(fā)生中的作用尚不清楚,影響這些基因的畸變常被視為反映局部基因組不穩(wěn)定性的乘客突變27。在CTNNB1中,我們在12個樣本中發(fā)現(xiàn)了全部外顯子3的閱讀框內(nèi)缺失,其中9個是結(jié)直腸癌。值得注意的是,這些缺失是純合的,但被認(rèn)為是激活突變,因為CTNNB1通常作為WNT和β-catenin途徑中的癌基因,而這9個大腸樣本中沒有任何APC驅(qū)動突變。我們還發(fā)現(xiàn)了幾個未被報道的顯著缺失的基因,包括MLLT4(n=13)和PARD3(n=9)。
與純合缺失不同,擴(kuò)增峰往往很寬,通常包含大量的基因,這使得鑒定擴(kuò)增目標(biāo)具有挑戰(zhàn)性。然而,SOX4(6p22.3)是一個顯著的單基因擴(kuò)增峰(26個擴(kuò)增),在尿路癌中高度富集(19%的樣品高度擴(kuò)增)。已知SOX4在前列腺癌、肝細(xì)胞癌、肺癌、膀胱癌和髓母細(xì)胞瘤中過度表達(dá),具有不良的預(yù)后特征和晚期疾病狀態(tài),是PI3K和Akt信號通路的調(diào)節(jié)因子28。
同樣值得注意的是,在10q22.3(n=32)區(qū)ZMIZ1周圍有一個包含10個基因的寬擴(kuò)增峰,這在以前沒有報道過。ZMIZ1是活化STAT(PIAS)樣家族蛋白抑制劑的轉(zhuǎn)錄輔激活因子,是NOTCH1在T細(xì)胞和白血病發(fā)生發(fā)展中的起直接作用的選擇性輔因子29。CDX2,先前被認(rèn)為是在結(jié)直腸癌中擴(kuò)增的細(xì)胞系生存癌基因30,在我們的隊列中也被高度擴(kuò)增,22個直腸癌擴(kuò)增樣本中有20個存在CDX2擴(kuò)增,占所有結(jié)直腸癌樣本的5.4%。
驅(qū)動基因突變
我們創(chuàng)建了一個覆蓋所有樣本和變異類別、包含已知(COSMIC校對過的基因31)和新發(fā)現(xiàn)(參考文獻(xiàn)24和本研究)的基因突變目錄,類似于先前描述的原發(fā)性腫瘤32(N.Lopez,個人通訊)。我們使用一個優(yōu)先排序方案來為每一個可能成為驅(qū)動基因的變異給出一個可能性得分。考慮到使用dNdScv R包估計為伴隨突變的snv和indel的比例,我們在20071個突變中(補(bǔ)充表5)發(fā)現(xiàn)13384個候選驅(qū)動突變,以及189個生殖系易感突變(補(bǔ)充表6)。體細(xì)胞候選驅(qū)動突變包括7400個編碼突變、615個非編碼點(diǎn)突變驅(qū)動因子、2700個純合缺失(其中25%位于共同脆弱位點(diǎn))、2392個局部擴(kuò)增和276個融合突變。對于非編碼變異,由于目前缺乏其他反復(fù)性癌基因非編碼變異的有力證據(jù)33,本研究僅包括TERT中的必要剪接位點(diǎn)和啟動子突變。在5個已知的反復(fù)性變異熱點(diǎn)區(qū)(9)共發(fā)現(xiàn)257個變異序列,并被列入候選驅(qū)動基因目錄。
對于整個隊列,使用我們的優(yōu)選排序方案,驅(qū)動基因列表中,有55%的點(diǎn)突變被預(yù)測為真正地驅(qū)動了腫瘤的發(fā)生。為了便于在個體水平上分析未知意義的變異,我們通過考慮樣本的變異負(fù)擔(dān)、TSGs的雙等位失活狀態(tài)和癌基因的熱點(diǎn)位置,計算了每個點(diǎn)突變作為驅(qū)動基因的樣本特定的似然得分。致病性變異的預(yù)測與已知生物學(xué)重疊,例如,APC基因3′一端中良性錯義變異的聚集(補(bǔ)充圖2)-與基因的這一部分不存在導(dǎo)致FAP的胚系突變相符(34)。
總體而言,該目錄與先前的癌癥驅(qū)動基因列表相似,其中TP53(52%的樣本),CDKN2A(21%),PIK3CA(16%),APC(15%),KRAS(15%),PTEN(13%) )和TERT(12%)被確定為賊常見的突變基因,它們共同構(gòu)成目錄中所有候選驅(qū)動程序突變的26%(圖3)。 但是,我們目錄中所有十個賊頻繁突變的基因的突變率均高于原發(fā)癌35,這可能反映了晚期的疾病狀態(tài)。 特別是AR和ESR1更為普遍,在44%的前列腺癌和16%的乳腺癌中是驅(qū)動基因。 這兩個基因都與荷爾蒙療法的耐藥性有關(guān),荷爾蒙療法是這些腫瘤類型的常見治療方法,先前已報道它們在晚期轉(zhuǎn)移性癌存在更多9,但在本研究中被鑒定出更高的發(fā)病率。
a–c,賊普遍的體細(xì)胞突變致癌基因(a),TSG(b)和種系易感變體(c)。 從左到右,熱圖顯示了發(fā)現(xiàn)每種基因突變的每種癌癥類型的樣本所占的百分比; 先進(jìn)條形圖顯示了具有給定基因突變的樣品的全癌百分率; 相對條形圖按更改類型顯示明細(xì)。 對于TSG(b),賊終的條形圖顯示了具有雙等位基因被滅活的驅(qū)動因子的樣品的百分比,對于種系易感變體(c),賊終的條形圖顯示了野生型缺失的腫瘤樣品的百分比。
食道和胃腫瘤的驅(qū)動突變的數(shù)量也增加。與其他類型的癌癥相比,這主要是經(jīng)們常見的脆弱位點(diǎn)基因的缺失率更高(胃和食道腫瘤的平均值為1.6)(全癌平均值為0.3)。 除了脆弱位點(diǎn),不同腫瘤每種變異序列類別中的驅(qū)動突變確實(shí)與相對突變負(fù)荷相關(guān)(擴(kuò)展數(shù)據(jù)圖4),皮膚癌除外,其SNV驅(qū)動因子的數(shù)量低于預(yù)期。
-
小提琴圖,顯示了按腫瘤類型分組的每個樣品中驅(qū)動因子數(shù)量的分布(提供了每種腫瘤類型的患者數(shù)量)。 黑點(diǎn)表示每種腫瘤類型的平均值。 b,相對條形圖,顯示每種癌癥類型的細(xì)分類型。
在所有樣本中98.6%的樣本中,至少發(fā)現(xiàn)了一種體細(xì)胞驅(qū)動突變或者是胚系突變。 在34個沒有找到腫瘤驅(qū)動基因的樣本中,有18個是小腸的NET(占該亞型所有患者的49%)。 這可能表明,小腸NET具有獨(dú)特的腫瘤驅(qū)動因素,這些驅(qū)動因子未包含在現(xiàn)在的任何癌癥基因資源數(shù)據(jù)庫中,并且由于我們的NET隊列樣本數(shù)量有限,且這些驅(qū)動突變也不具有普遍性特點(diǎn),以至于我們的分析無法發(fā)現(xiàn)這些突變位點(diǎn)的重要性。 當(dāng)然,也有可能,NETs可能主要由全基因測序無法檢測的表觀遺傳驅(qū)動。
在不同的癌癥類型之間,發(fā)生擴(kuò)增的驅(qū)動基因的數(shù)量差異很大(擴(kuò)展數(shù)據(jù)圖7),乳腺癌(平均2.1),食道癌(平均1.8),尿路和胃癌(均 1.7),在腎癌中幾乎沒有擴(kuò)增驅(qū)動基因(平均值為0.1),而在間皮瘤隊列中則沒有。 在具有高擴(kuò)增率的腫瘤類型中,通常發(fā)生擴(kuò)增的致癌基因范圍內(nèi)廣泛,這表明這些組織中存在誘變過程,傾向于發(fā)生擴(kuò)增,而不是具有組織特異性的選擇單個驅(qū)動基因。 AR和EGFR是例外,它們分別在前列腺癌,中樞神經(jīng)系統(tǒng)和肺癌中具有高度選擇性的擴(kuò)增,這與以前的報道一致[20,37,38]。 值得注意的是,盡管將擴(kuò)增與普通基因組的數(shù)量進(jìn)行比較,我們也發(fā)現(xiàn)WGD的樣品中的驅(qū)動基因擴(kuò)增了了兩倍。
在29個癌癥易感基因中發(fā)現(xiàn)的189個胚系突變序列(占隊列的7.9%)由8個缺失和181個點(diǎn)突變組成(圖3c,補(bǔ)充表6)。 影響賊大的五個基因(包含近80%的突變序列)是有很高知名度的胚系驅(qū)動基因CHEK2,BRCA2,MUTYH,BRCA1和ATM。 在一半以上的病例中,通過LOH或體細(xì)胞點(diǎn)突變,發(fā)現(xiàn)相應(yīng)的野生型等位基因在腫瘤樣本中丟失,這表明這些突變序列的高滲透性,尤其是在BRCA1(89%的病例),APC中 (83%)和BRCA2(79%)。
276個融合突變中由168個框內(nèi)編碼融合體,90個順式激活融合體(涉及在5'基因區(qū)域調(diào)控位置的改變)和18個框內(nèi)基因內(nèi)缺失組成,其中一個或多個外顯子發(fā)生缺失(補(bǔ)充表7)。 ERG(n = 88),BRAF(n = 17),ERBB4(n = 16),ALK(n = 12),NRG1(9個樣本)和ETV4(n = 7)是賊常見的3'融合對象,在一起構(gòu)成了融合的一半以上。 在89例ERG融合中,總共有76例是TMPRSS2-ERG,并且影響了該隊列中所有前列腺癌樣本的36%。 CGI,OncoKb,COSMIC或CIViC數(shù)據(jù)庫中沒有記錄的融合突變有146對融合對。(31、39、40、41)。
我們發(fā)現(xiàn)致癌基因中體細(xì)胞驅(qū)動點(diǎn)突變的71%發(fā)生在已知致病性突變熱點(diǎn)的五個核苷酸處或五個核苷酸內(nèi)。 在六個賊流行的致癌基因(KRAS,PIK3CA,BRAF,NRAS,TERT和ESR1)中,檢出率為97%(擴(kuò)展數(shù)據(jù)圖9)。 此外,在許多關(guān)鍵致癌基因中,我們記錄了在已知突變熱點(diǎn)附近的幾種可能是激活但非經(jīng)典的變異,特別是閱讀框內(nèi)插入缺失。 盡管閱讀框內(nèi)插入缺失總體上非常罕見(每個腫瘤平均1.7),但我們發(fā)現(xiàn)在已知的癌基因,包括PIK3CA(n = 18),KIT(n = 17),ERBB2(n = 10)和BRAF(n = 8)在已知熱點(diǎn)或其附近存在過量的閱讀框內(nèi)缺失突變(擴(kuò)展數(shù)據(jù),圖9)。 在FOXA1中,我們鑒定出十個框內(nèi)插入缺失(indel),它們在前列腺癌中高度富集(十個病例中有七個),并聚集在兩個以前與致病突變無關(guān)的位置42。
對于TSG,我們的結(jié)果有力地支持了Knudson兩次打擊假說43,發(fā)現(xiàn)所有TSG驅(qū)動基因中有80%由于基因改變而導(dǎo)致雙等位基因失活(圖3),純合缺失(32%),多個體細(xì)胞點(diǎn)突變(7%)。 或者是與LOH共同存在點(diǎn)突變(41%)。 據(jù)我們所知,該比率是所有大規(guī)模WGS癌癥研究中觀察到的賊高比率。 對于許多關(guān)鍵的TSG,雙等位基因失活率幾乎為100%-TP53(93%),CDKN2A(97%),RB1(94%),PTEN(92%)和SMAD4(96%)–這表明雙等位基因失活是癌癥轉(zhuǎn)移的重要條件。 然而,其他重要的TSG的雙等位基因失活率較低,包括ARID1A(55%),KMT2C(49%)和ATM(49%)。 對于這些情況,其他等位基因也可以通過非突變表觀遺傳機(jī)制失活,或者可以通過單倍體機(jī)能不全機(jī)制驅(qū)動腫瘤發(fā)生。
我們檢查了每種癌癥類型的驅(qū)動基因突變的成對存在,發(fā)現(xiàn)了十種相互排斥的基因突變組合和十種明顯同時存在的突變組合(擴(kuò)展數(shù)據(jù)圖10)。 盡管這些關(guān)系中的大多數(shù)已經(jīng)明確,但在乳腺癌中,我們發(fā)現(xiàn)GATA3–VMP1(q = 6×10−5)和FOXA1–PIK3CA(q = 3×10−3)是新發(fā)現(xiàn)的正相關(guān),而ESR1與TP53(q = 9×10−4)和GATA3與TP53(q = 5×10−5)是負(fù)相關(guān)。 這些發(fā)現(xiàn)需要進(jìn)一步的驗證和實(shí)驗依據(jù),以了解其背后的生物學(xué)基礎(chǔ)。
克隆性基因突變
為了深入了解正在進(jìn)行的腫瘤演變動力學(xué),我們檢查了所有突變序列的克隆性。值得注意的是,整個隊列中只有6.6%的SNV,MNV和插入缺失,以及僅3.7%的點(diǎn)突變驅(qū)動基因是亞克隆的(擴(kuò)展數(shù)據(jù)圖11)。具有亞克隆變異序列的樣品比例低可能部分是由于測序方法的檢測限制(測序深度,生物信息學(xué)分析設(shè)置),尤其是對于低純度樣品而言尤其如此。但是,即使對于純度超過80%的樣品,亞克隆變異序列的總比例也僅達(dá)到10.6%(擴(kuò)展數(shù)據(jù)圖11)。此外,對癌癥基因熱點(diǎn)位置的變異序列進(jìn)行的敏感檢測表明,我們的分析流程檢測出等位基因頻率高于3%的變異序列超過96%。盡管該隊列包含一些具有高頻亞克隆變異序列的樣品,但總體而言,轉(zhuǎn)移性腫瘤樣品相對均一,沒有多個分散的主要亞克隆。腫瘤內(nèi)異質(zhì)性低可能部分歸因于以下事實(shí):幾乎所有活檢都是通過核心穿刺活檢獲得的,這導(dǎo)致采樣區(qū)域的局限性,但仍遠(yuǎn)低于先前在原發(fā)癌中的觀察結(jié)果12。
在117例來自同一患者的獨(dú)立收集的重復(fù)活檢樣本中(補(bǔ)充表8),我們發(fā)現(xiàn)所有SNV中有11%是亞克隆的。 盡管活檢樣本之間共享了71%的克隆性變異序列,但只有29%的亞克隆變異序列是共享的。 我們不能排除大量較低頻率的亞克隆變異序列的存在,并且我們的結(jié)果提出了一個模型,其中單個轉(zhuǎn)移性病變在任何時間點(diǎn)都由單個克隆控制,而更有限的腫瘤進(jìn)化和亞克隆選擇發(fā)生在遠(yuǎn)處轉(zhuǎn)移性腫瘤啟始細(xì)胞。 這與原發(fā)腫瘤中觀察到的相反,在原發(fā)性腫瘤中,高亞克隆度突變序列和主要亞克隆序列的發(fā)生率更高,[12,44],但支持其他近期研究,這些研究表明轉(zhuǎn)移灶中驅(qū)動基因異質(zhì)性賊小[45]。
臨床相關(guān)性
我們通過將驅(qū)動基因突變與臨床注釋數(shù)據(jù)庫進(jìn)行比對(CGI41,CIViC39和OncoKB40)來分析所有患者基于生物標(biāo)記物治療的機(jī)會。在1,480名患者中(62%),根據(jù)原發(fā)性腫瘤的結(jié)果,至少找出了一個通過預(yù)測有可行的治療方案的空變序列(見方法,補(bǔ)充表9中所定義)。根據(jù)預(yù)測,有可治療方案的患者中,一半(占總數(shù)的31%)包含對A級藥物(經(jīng)批準(zhǔn)的抗癌藥物),并且患者對該藥物沒有任何已知的耐藥性基因序列(圖5a) )。在18%的患者中,建議的治療方法是包含在已有藥物的注冊適應(yīng)癥。而在13%的病例中,該治療方法不在已注冊的適應(yīng)癥范圍內(nèi)。在一項針對215名接受治療的患者中實(shí)施的相關(guān)先導(dǎo)研究中,我們表明,在其批準(zhǔn)的標(biāo)簽以外使用抗癌藥物進(jìn)行此類治療可帶來總體臨床益處46。在另外31%的患者中,鑒定出B級(實(shí)驗療法)生物標(biāo)志物。預(yù)計有治療方案的基因突變包括了所有的變異類型,包括1,815個SNV,48個MNV,190個插入缺失,745個拷貝數(shù)變化,69個融合基因和60例微衛(wèi)星不穩(wěn)定性患者(圖5b)。
a,根據(jù)CGI,CIViC和OncoKB數(shù)據(jù)庫中的數(shù)據(jù),每種癌癥類型中具有候選治療方案的突變基因的樣本的百分比。 A級代表具有批準(zhǔn)的療法或指南的基因序列突變的存在,B級代表具有強(qiáng)大生物學(xué)證據(jù)或表明有臨床實(shí)驗表明具有可治療方案的突變序列。 標(biāo)簽指示在聯(lián)邦當(dāng)局就注能針對該腫瘤類型進(jìn)行的治療,標(biāo)簽外指示注冊的其他腫瘤類型進(jìn)行的治療。 b,按變異序列類型細(xì)分的具有可治療方案的變異序列。