【佳學基因檢測】通過外顯子組測序鑒定常見癌癥的易感基因:以家族性乳腺癌為例
腫瘤易感基因鑒定及腫瘤風險基因檢測導讀
乳腺癌易感性的遺傳成分在很大程度上是由基因決定的。候選基因病例對照重測序已經(jīng)確定了以罕見的蛋白質截短突變?yōu)樘卣鞯囊赘谢颍@些突變具有中等的疾病風險。理論上,外顯子組測序應該會產(chǎn)生更多此類基因。在這里,腫瘤風險基因列表編寫組探討了這種方法的可行性和設計考慮。腫瘤風險基因列表編寫組對 50 名家族性乳腺癌患者進行了外顯子組測序,應用頻率和蛋白質功能過濾器來識別賊有可能致病的變異。腫瘤風險基因列表編寫組確定了通過篩選符進入t質量過濾器的 867,378 個基因突變,其中 1,296 個基因突變通過了頻率和蛋白質截斷過濾器。在已知基因中存在和不存在突變的個體中,經(jīng)過驗證的、罕見的蛋白質截短基因突變 (PTV) 的中位數(shù)為 10。兩組中突變基因的功能候選者相似。如果沒有基因解碼技術先驗知識,這些基因基因將不會被識別為乳腺癌易感基因。每個人都攜帶多種可能與疾病有關的罕見突變。
腫瘤易感基因鑒定及腫瘤風險基因檢測關鍵詞
乳腺癌易感性,外顯子組測序,常見疾病遺傳學,缺失遺傳力外顯子組測序基因檢測與腫瘤風險判定
外顯子組測序已被證明在鑒定導致罕見孟德爾疾病的基因方面非常成功。在這種情況下,潛在的遺傳模型通常是已知的,并且突變譜是獨特的,并且很容易與未受影響個體的模式區(qū)分開來(在 Ku 等人 中進行了評論)。事實證明,識別導致常見疾病的罕見遺傳變異更具挑戰(zhàn)性。潛在的遺傳結構通常很復雜,而且通常知之甚少,外顯率可能是適度的和/或不完整的,腫瘤風險基因列表編寫組強有力地預測遺傳變異對基因功能和疾病因果關系的影響的能力仍然有限。然而,許多常見疾病的遺傳力缺失的一個組成部分可能存在于中/低外顯率的罕見基因變異中,這些變異可能通過外顯子組測序來處理。
乳腺癌是少數(shù)已發(fā)現(xiàn)此類變異的常見疾病之一。使用候選基因病例對照重測序,DNA 修復基因如CHEK2、PALB2、BRIP1和ATM已被證明是乳腺癌易感基因 。這些基因的特點是與中等疾病風險(RR 2-4)相關的多個非常罕見的失活(主要是截斷)突變。與高外顯率基因和低外顯率變異體一起,這些中等外顯率基因估計僅占乳腺癌家族風險的約 35% 。因此,很大一部分遺傳對乳腺癌的貢獻仍然無法解釋。
鑒于少數(shù)候選基因研究已經(jīng)在乳腺癌中產(chǎn)生了罕見的中等外顯率易感基因,因此極有可能存在此類其他基因。這些基因不能通過連鎖分析(風險不夠高)或全基因組關聯(lián)研究(突變不夠常見)來識別,但應該可以通過適當?shù)耐怙@子組測序研究來檢測。外顯子組測序提供了應用不可知論而不是候選基因方法來發(fā)現(xiàn)它們的潛力,因此是一種極具吸引力的策略。然而,查詢生成的大量數(shù)據(jù)集以提供給定基因與乳腺癌關聯(lián)的有力證據(jù)是令人生畏的。探討利用外顯子組測序鑒定乳腺癌易感基因的可行性,腫瘤風險基因列表編寫組對 50 名家族性乳腺癌患者的外顯子組進行了測序?;诂F(xiàn)有的范例,腫瘤風險基因列表編寫組應用頻率和蛋白質截斷過濾器來優(yōu)先考慮賊有可能充當中等外顯率乳腺癌易感性等位基因的基因突變。腫瘤風險基因列表編寫組在四個個體中發(fā)現(xiàn)了已知乳腺癌易感基因的突變,證明了這種方法在已經(jīng)建立的易感基因中檢測突變的實用性。然后,腫瘤風險基因列表編寫組將這些病例中的突變譜與已知基因中沒有突變的 8 個個體進行了比較,以研究在發(fā)現(xiàn)新的疾病易感基因方面的效用。
患者和方法
補充材料中提供了樣品和方法的全部詳細信息。簡而言之,腫瘤風險基因列表編寫組對招募到家族性乳腺癌研究 (FBCS) 的 50 名個體進行了外顯子組測序。這些家族的特征總結在表格1。所有個體都患有乳腺癌并且BRCA1和BRCA2突變均為陰性(通過 Sanger 測序和/或異源雙鏈分析和 MLPA)。腫瘤風險基因列表編寫組在 30 個個體中使用了市售的 38 Mb 外顯子組陣列,在 20 個個體中使用了 47.9 Mb 定制的 GENCODE 外顯子組陣列 。在 Illumina Genome Analyzer IIx 平臺上進行測序。腫瘤風險基因列表編寫組使用 NextGENe 軟件(2.10 版)進行讀取映射和變異分析,并應用調用質量、頻率和蛋白質截斷過濾器來優(yōu)先考慮變異以供進一步考慮。腫瘤風險基因列表編寫組選擇了12個案例進行詳細分析;四個已知乳腺癌易感基因發(fā)生突變,八個沒有。腫瘤風險基因列表編寫組通過 Sanger 測序對 12 個樣本中的所有優(yōu)先基因突變進行了驗證分析。腫瘤風險基因列表編寫組使用 ToppGene Suite 進行了基因列表富集分析。表格1:家族性乳腺癌外顯子組研究先證者總結
乳腺癌病例的特征 | |
案例總數(shù) | 50 |
雙邊案例 | 42 |
單方面案件 | 8 |
中位診斷年齡 | |
先進個乳腺癌 | 53 |
第二乳腺癌 | 60 |
中位家族史分數(shù)* (FHS) | 3 |
*患有雙側乳腺癌的個體和兩個患有乳腺癌的一級親屬(或同等學歷)的 FHS = 3
結果
外顯子組測序
總體而言,每個樣本平均產(chǎn)生 5350 萬條讀數(shù),通常 99% 的讀數(shù)映射到參考基因組。目標區(qū)域內 83%(范圍 41%-88%)堿基的中位數(shù)覆蓋率≥15/樣本(在線補充表 2)。由于使用了兩個不同的外顯子組陣列并且測序進行了幾個月,因此存在相當大的樣本間差異??傮w而言,腫瘤風險基因列表編寫組在 NextGENe 默認設置下的 50 個外顯子組中確定了 1,592,412 個基因突變。在腫瘤風險基因列表編寫組排除所有讀取覆蓋率 <15 讀取的變異、具有突基因突變的堿基替換:野生型讀取百分比 <30%、內含子變異(剪接點處的變異除外)和同義變異后,仍有 353,948 個變異。為了進一步優(yōu)先考慮賊有可能導致疾病的變異,腫瘤風險基因列表編寫組應用過濾器來檢測導致蛋白質截斷的序列變異,如前所述 。這確定了所有預測會導致蛋白質過早截斷的基因突變:移碼插入和缺失、無義突變和共有剪接殘基處的突變。該腳本還刪除了具有 5 個或更多不同截斷基因突變的基因中的基因突變(因為這些很可能是假基因或耐受單倍體不足而不引起疾?。T撨^濾器識別了 15,784 個截斷基因突變。為了對后續(xù)變異進行優(yōu)先排序,腫瘤風險基因列表編寫組接下來應用了頻率過濾器來識別 50 例家族性乳腺癌病例中的 1 例中存在的變異,這與已知乳腺癌易感基因的突變流行率一致 。在此過濾器之后,剩下 1,296 個基因突變。12 個外顯子組的變異驗證
在 1,296 個基因突變中,腫瘤風險基因列表編寫組確定了已知易感基因中的四個突變,腫瘤風險基因列表編寫組通過 Sanger 測序證實了這些突變;三個位于中等外顯率基因CHEK2(n = 2)和ATM(n = 1)中。第四個是BRCA2中的剪接突變,它逃避了異源雙鏈分析的檢測,這被認為降低了對堿基取代的敏感性(表 2)。表 2:在已知乳腺癌易感基因中存在突變的家族性乳腺癌先證者中確認的雜合截斷基因突變。
ID | 基因 | 截斷突變 | 疾病相關性 |
1 | BRCA2 | c.7977-1G>C | 乳腺癌+卵巢癌(單等位基因),F(xiàn)A-D1(雙等位基因) |
BRIX1 | c.793-2_793-1insA | ||
CASP5 | c.1135+1C>T | ||
CXCL6 | c.239_240insT | ||
FILIP1 | c.303delG | ||
HEATR7B | c.2214+5A>G | ||
IGSF22 | c.479-2T>A | ||
MLL4 | c.3059_3060dupG | ||
PTCHD3 | c.923_924dupG | ||
SLAMF6 | c.321G>C, p.Y107X | ||
SMARCD2 | c.574G>A,p.R136X | ||
SSX9 | c.110delC | ||
TNFAIP6 | c.90G>A,p.W30X | ||
2 | CHEK2 | c.1100delC | 乳腺癌(單等位基因) |
C2orf63 | c.1384+2A>T | ||
CFHR5 | c.486_487insA | 膜增生性腎小球腎炎,II型 | |
PPEF2 | c.1960G>A, p.R654X | ||
SERPINI2 | c.628_629delAC | ||
3 | CHEK2 | c.658T>A, p.K220X | 乳腺癌(單等位基因) |
ABCC11 | c.2813C>G, p.S938X | ||
DNMT3A | c.1025_1026insC | AML | |
EPS8L1 | c.1514_1515dupT | ||
FTMT | c.436A>T,p.K146X | ||
LOC64702 | c.303_304delAT | ||
MCAT | c.729+1G>T | ||
NOD2 | c.3019_3020dupC | 克羅恩病(單等位基因) | |
PRMT7 | c.1056-1G>T | ||
PRSS7 | c.2042_2043dupT | 腸激酶缺乏癥(雙等位基因) | |
VPS13B | c.6732+1G>A | 科恩綜合征(雙等位基因) | |
WRN | c.1230_1231insA | Werner 綜合征(雙等位基因) | |
ZNF451 | c.488G>G/A, p.W163X | ||
ZNF582 | c.136+1G>T | ||
4 | ATM | c.4396C>T, p.R1466X | 乳腺癌(單等位基因)、共濟失調性遠端血管擴張癥(雙等位基因) |
FETUB | c.127_128insCA | ||
KIAA1919 | c.614delT | ||
SLC26A10 | c.1483C>T, p.R495X | ||
TAOK1 | c.2544+5A>G | ||
ZIM2 | c.1513C>T, p.R505X |
腫瘤風險基因列表編寫組對 292 個擴增子中的 12 個樣本(4 個具有已知基因突變,8 個沒有)中通過所有過濾器的所有 316 個基因突變進行了 Sanger 測序評估。241 個擴增子的測序成功。51 個擴增子未能通過自動化設計和測序過程。確認了 127 個基因突變(68 個堿基替換,59 個插入缺失),盡管對于三個基因突變,Sanger 測序顯示缺失是框內的。這些從賊終分析中刪除,因為它們不會導致過早的蛋白質截斷。在剩余的 114 個擴增子中未檢測到變異,即這些是假陽性調用(23 個堿基替換,91 個插入缺失)。這種相對較高的誤報率反映了腫瘤風險基因列表編寫組故意降低插入和刪除基因突變的調用質量過濾器設置;此類基因突變與疾病相關的先驗可能性很高,但很難調用短讀數(shù)據(jù)。在具有已知基因突變(中位數(shù) = 10,范圍 5-13)和沒有(中位數(shù) = 10,范圍 7-15,p = 0.55)的樣本中看到的截斷基因突變數(shù)量之間沒有差異。只有兩個基因包含兩個截斷基因突變;CHEK2和USP45,其余 122 個截短基因突變出現(xiàn)在不同的基因中。
驗證截斷基因突變的基因列表富集分析
腫瘤風險基因列表編寫組使用 ToppGene Suite ToppFun 軟件 對所有 122 個基因進行了基因富集分析,其中腫瘤風險基因列表編寫組鑒定了截斷變異體,以及 85 個已知基因沒有突變的病例中存在截斷突變的 85 個基因的子集。在任一分析中,在 Bonferroni 校正下,在P值截止值為 0.05 時,沒有基因本體術語被確定為顯著。通過外顯子組測序鑒定腫瘤風險基因的技術應用討論
外顯子組測序正在有效改變腫瘤風險基因列表編寫組識別易患疾病的罕見遺傳變異的能力。然而,在罕見的孟德爾綜合征背景之外對結果數(shù)據(jù)的詢問和解釋是非常具有挑戰(zhàn)性的。在這里,腫瘤風險基因列表編寫組在家族性乳腺癌中進行了外顯子組測序,這是少數(shù)有令人信服的證據(jù)表明罕見的中/低外顯率易感基因的疾病之一。腫瘤風險基因列表編寫組使用了許多策略來增強分析能力。首先,腫瘤風險基因列表編寫組使用了富含遺傳易感因素的病例,特別是患有雙側乳腺癌和/或乳腺癌家族史的個體。如前所述,這顯著提高了基因發(fā)現(xiàn)的能力。在疾病基因鑒定研究中經(jīng)??紤]的另一種方法是優(yōu)先考慮遠親受影響個體共享的基因突變以進行進一步評估。這種策略在識別罕見條件下的高滲透突變方面賊有效。在常見的情況下,如乳腺癌,表型率通常很高,易感突變的外顯率通常是中/低,這兩者都會降低這種策略的效用。其次,腫瘤風險基因列表編寫組使用了一種數(shù)據(jù)過濾策略,允許對罕見的蛋白質截斷突變進行優(yōu)先排序;這類突變具有疾病關聯(lián)的強有力的先前證據(jù),特別是在乳腺癌中。此外,對復雜疾病中的 NGS 數(shù)據(jù)過濾的基于模擬的分析支持對預測會導致蛋白質過早截斷的基因突變進行優(yōu)先排序,作為疾病基因鑒定的有用策略 。即使經(jīng)過嚴格篩選,在 50 個病例中仍識別出 1,296 個 PTV。這包括已知乳腺癌易感基因中的四個突變,進一步證明了外顯子組測序在識別疾病相關突變方面的實用性。
為了探索識別新型乳腺癌易感基因的可行性,腫瘤風險基因列表編寫組首先在 50 例中的?? 12 例中進行了驗證實驗,以確定哪些 PTV 是真實的。腫瘤風險基因列表編寫組總共確認了 12 個樣本中的 124 個 PTV。在已知基因發(fā)生突變和不發(fā)生突變的情況下,PTV 的中位數(shù)相似,這表明僅識別罕見的 PTV 不足以證明因果關系,正如一些論文所暗示的那樣 ;需要額外的證據(jù)。觀察結果進一步支持了這一點,即已知基因突變的病例在可能與疾病相關的基因中也攜帶其他 PTV。例如,具有BRCA2突變的個體(案例 1)在凋亡調節(jié)因子 CASP5 中也攜帶PTV,以及轉錄調節(jié)因子SMARCD2和SSX9,所有這些似乎都與腫瘤發(fā)生有關(表 2)。同樣,案例 3在與多種疾病有關的其他五個基因中攜帶CHEK2突變和 PTV,包括 DNA 修復基因WRN,它會導致雙等位基因突變攜帶者中的 Werner 綜合征 。這些額外的突變中的一些也可能導致乳腺癌,實際上預計個體將具有多種遺傳變異,這些變異賦予疾病易感性,特別是中等外顯率突變的攜帶者。然而,腫瘤風險基因列表編寫組僅在 12 例病例中鑒定了 122 個不同基因中的 PTV,這表明,首先,大多數(shù)突變必須與癌癥無關,其次,證明疾病關聯(lián)所需的舉證責任,即使對于罕見的截斷突變,也是非常重要的。重大的。證明健康個體中罕見的 PTV 的研究進一步支持了這一點 。將需要將病例數(shù)據(jù)與通過類似方法獲得的對照數(shù)據(jù)進行比較,并與覆蓋率等指標相匹配,以高效地區(qū)分耐受單倍體不足的基因與疾病易感基因。
在基因鑒定研究中,考慮基因功能已被證明是一種有用的優(yōu)先策略。對于乳腺癌,DNA 修復基因的突變分析,特別是那些與高外顯率乳腺癌易感基因BRCA1和BRCA2相互作用的基因,是鑒定乳腺癌易感基因如PALB2和BRIP1 的基礎。然而,腫瘤風險基因列表編寫組的計算機分析并未揭示在腫瘤風險基因列表編寫組進行了全面驗證的 12 例家族性乳腺癌病例中 PTV 基因中任何一組功能相關基因的富集。
只有兩個基因包含兩種不同的截斷基因突變,其中之一是CHEK2,一種有效的乳腺癌易感基因。這表明在更大的實驗中,具有多個不同截斷突變的基因可以作為識別真正易感基因的有用過濾器。這種模式對于在 1000-3000 個樣本的研究中鑒定該類別的其他基因至關重要 。外顯子組測序研究所需的樣本數(shù)量未知,并且會受到多種因素的影響,包括相關基因突變的普遍性和外顯率、分析的樣本類型(基因富集與未選擇)以及多重測試的校正。但是,很可能需要對數(shù)百/數(shù)千個樣本進行外顯子分析。后續(xù)研究,類似于某些 GWAS 的分階段方法,可能有助于復制外顯子組的發(fā)現(xiàn)并提供基因易患疾病的明確證據(jù)。對數(shù)千個樣本中的單個基因或一小組基因進行復制測序研究變得可行,并且可以針對例如外顯子組研究中具有多種、不同、
總之,腫瘤風險基因列表編寫組的實驗提供了進一步的證據(jù),表明外顯子組分析可以識別已知疾病相關基因中的致病突變。這項技術在常見、復雜條件下用于基因發(fā)現(xiàn)的潛力很高。然而,這將需要精心設計的大規(guī)模實驗,通過明智的樣本選擇和分析優(yōu)先級排序方法,再加上復制分析,以提供疾病關聯(lián)的有力證據(jù)。
Predisposition gene identification in common cancers by exome sequencing: insights from familial breast cancer.
Snape K, Ruark E, Tarpey P, Renwick A, Turnbull C, Seal S, Murray A, Hanks S, Douglas J, Stratton MR, Rahman N.
Breast Cancer Res Treat. 2012 Jul;134(1):429-33. doi: 10.1007/s10549-012-2057-x. Epub 2012 Apr 18.
PMID: 22527104
(責任編輯:佳學基因)