【研究報(bào)告】遺傳病基因檢測(cè)行業(yè)的局限與突破方向。遺傳病基因檢測(cè)行業(yè)研究導(dǎo)讀 ?;驒z測(cè)主要有臨床級(jí)應(yīng)用和消費(fèi)用應(yīng)用,在臨床領(lǐng)域的應(yīng)用中,出生前(NIPT)和腫瘤正確用藥基因檢測(cè)是目前的兩大主要應(yīng)用領(lǐng)域。佳學(xué)基因等機(jī)構(gòu)除了在這兩個(gè)領(lǐng)域的檢測(cè)產(chǎn)品上提高份額外,還開(kāi)啟了遺傳病的致病基因鑒定新項(xiàng)目,使得遺傳病的基因檢測(cè)成為一項(xiàng)日益成熟的技術(shù)。由
【研究報(bào)告】遺傳病基因檢測(cè)行業(yè)的局限與突破方向
遺傳病基因檢測(cè)行業(yè)研究導(dǎo)讀
基因檢測(cè)主要有臨床級(jí)應(yīng)用和消費(fèi)用應(yīng)用,在臨床領(lǐng)域的應(yīng)用中,出生前(NIPT)和腫瘤正確用藥基因檢測(cè)是目前的兩大主要應(yīng)用領(lǐng)域。佳學(xué)基因等機(jī)構(gòu)除了在這兩個(gè)領(lǐng)域的檢測(cè)產(chǎn)品上提高份額外,還開(kāi)啟了遺傳病的致病基因鑒定新項(xiàng)目,使得遺傳病的基因檢測(cè)成為一項(xiàng)日益成熟的技術(shù)。由于遺傳病成為健康中國(guó)和人口素質(zhì)提升的主要攻關(guān)方向,很有可能在下一階段獲得政策支持,成為基因信息產(chǎn)業(yè)新的熱點(diǎn)。佳學(xué)基因對(duì)目前遺傳病診療現(xiàn)狀、市場(chǎng)容量以及行業(yè)內(nèi)企業(yè)的市場(chǎng)競(jìng)爭(zhēng)要素做簡(jiǎn)要分析。
01
遺傳病簡(jiǎn)介以及診療現(xiàn)狀
遺傳病是指由遺傳物質(zhì)發(fā)生改變而引起疾病,更正確的說(shuō)法應(yīng)當(dāng)是基因病?;虿〕?a href='http://deyicom.cn/cp/chabiyin/' target='_blank'>先天性的,也可表現(xiàn)為后天發(fā)病,如先天愚型、多指(趾)、先天性聾啞、血友病等。約50%的遺傳病患者在出生時(shí)或兒童時(shí)期發(fā)病,約30%的遺傳病兒童壽命不超過(guò)5歲。也有的遺傳病要經(jīng)過(guò)幾年甚至幾十年后才能出現(xiàn)明顯癥狀。遺傳病主要可以分為染色體病、單基因病和多基因病。
染色體病(chromosomal disorders)是由于染色體數(shù)目和(或)結(jié)構(gòu)異常而導(dǎo)致結(jié)構(gòu)、生理功能異常而引起的疾病。由于染色體上基因眾多,加上基因的多效性,因此染色體病常涉及多個(gè)器官、多個(gè)系統(tǒng)的形態(tài)和功能異常,臨床表現(xiàn)多種多樣,常表現(xiàn)為綜合征,故染色體病是一大類(lèi)嚴(yán)重的遺傳病。染色體畸變嚴(yán)重者在胚胎早期死亡并自然流產(chǎn),少數(shù)染色體畸變者能存活至出生,常造成機(jī)體多發(fā)畸形、智力低下、生長(zhǎng)發(fā)育遲緩和多系統(tǒng)功能障礙。染色體病無(wú)有效治療方法,因此通過(guò)染色體疾病的基因檢測(cè),結(jié)合染色體病的遺傳咨詢(xún),選擇合適的生育方案,并采用產(chǎn)前診斷預(yù)防染色體病尤為重要。
單基因遺傳病是指受一對(duì)等位基因控制的遺傳病,據(jù)OMIM數(shù)據(jù)庫(kù)(人類(lèi)孟德?tīng)柌?shù)據(jù)庫(kù))數(shù)據(jù),單基因遺傳病的病種數(shù)量有7000多種,其中約4000多種致病基因和發(fā)病機(jī)制比較明確,成為依賴(lài)于數(shù)據(jù)庫(kù)比對(duì)進(jìn)行基因檢測(cè)的依據(jù)之一。單基因遺傳病單個(gè)發(fā)病率低,但單基因病種類(lèi)極多,累積起來(lái)可達(dá)到這個(gè)全球出生人口數(shù)的1%,所以總體發(fā)病率高,且具有先天性、致死致殘性的特點(diǎn)。另外,一些單基因遺傳病,其本身的發(fā)病率就很高,比如馬凡綜合征、藥物性耳聾等。由于染色體異常的判斷標(biāo)準(zhǔn)明確,且已經(jīng)大面種推廣使用,通??梢栽诨榍?、胚胎植入前及產(chǎn)前被檢測(cè)出來(lái),因此新生兒/兒童發(fā)病的通常是單基因遺傳病和多基因遺傳病。
就診斷而言,單基因遺傳病可發(fā)生任何臨床科室,臨床癥狀少見(jiàn)、復(fù)雜。而且由于基因的突變具有多樣性,每種突變發(fā)生在不同的基因背景下,從而產(chǎn)生不一樣的臨床癥狀。同時(shí),不同的突變,會(huì)具有各不相同的臨床意義,對(duì)疾病發(fā)生的影響互不相同,從而表現(xiàn)出高度遺傳異質(zhì)性和臨床異質(zhì)性,故臨床診斷困難。而且,許多遺傳病都及其罕見(jiàn),屬于罕見(jiàn)病。根據(jù)WHO的定義,罕見(jiàn)病是患病人數(shù)占總?cè)丝诘?.65‰到1‰的疾病。80%的罕見(jiàn)病是單基因遺傳病。對(duì)于一名醫(yī)生來(lái)說(shuō),診斷經(jīng)驗(yàn)不足,根據(jù)癥狀極易誤診。所以對(duì)于臨床醫(yī)生而言,這些問(wèn)題顯得頗有挑戰(zhàn)性:比如如何根據(jù)患者癥狀快速鑒別其是否為遺傳病;患者表現(xiàn)為某些特定癥狀時(shí),哪種基因突變的概率賊大?這種發(fā)病原因先入為主的猜測(cè)和判斷成為現(xiàn)今基因檢測(cè)不正確、檢測(cè)沒(méi)有結(jié)果的主要來(lái)源。
如今,隨著基因測(cè)序成本的大幅下降,隨之而來(lái)的是基因大數(shù)據(jù)的出現(xiàn),在這種形勢(shì)下,基于基因型和表型的關(guān)系,建立輔助診斷系統(tǒng)和臨床知識(shí)庫(kù)是一條容易且有效的路徑。我們目前了解比較清楚、遺傳關(guān)系和疾病關(guān)聯(lián)很明確的是染色體病和單基因病,基因檢測(cè)也多半在這個(gè)領(lǐng)域,多基因病目前還停留在科研階段。但是,就目前來(lái)說(shuō),單基因病的檢測(cè)主要是依賴(lài)于數(shù)據(jù)庫(kù)的累積,使得與數(shù)據(jù)庫(kù)記載不一致的突變引起的疾病還無(wú)法有效地分析出來(lái),而這占據(jù)單基因遺傳病的80%以上。新近出現(xiàn)的基因解碼技術(shù)則可以突破數(shù)據(jù)庫(kù)比對(duì)技術(shù),推進(jìn)單基因遺傳病的快速和正確應(yīng)用。
基因檢測(cè)主要針對(duì)樣本在染色體、DNA、RNA和(或)基因產(chǎn)物等層面進(jìn)行分析。明確的遺傳診斷對(duì)遺傳病的早期診斷、早期干預(yù)、遺傳咨詢(xún)和生育指導(dǎo)具有重要意義。但是檢測(cè)是在哪個(gè)層面上,檢測(cè)范圍是否涵蓋了所有疾病發(fā)生的可能性,以及是否可以分析出數(shù)據(jù)庫(kù)以外的基因突充對(duì)疾病發(fā)生的影響決定了基因檢測(cè)的高效性。
02
常用遺傳病檢測(cè)技術(shù)
不同的遺傳病由于遺傳物質(zhì)的缺陷不同,采用的檢測(cè)技術(shù)可能不同,醫(yī)生要結(jié)合實(shí)際情況綜合考慮檢測(cè)陽(yáng)性率、費(fèi)用和檢測(cè)時(shí)效等因素進(jìn)行選擇。鑒于遺傳病的復(fù)雜性且不同的技術(shù)有各自的局限性,應(yīng)充分考慮到各技術(shù)的優(yōu)勢(shì)和互補(bǔ)性,合理選擇適宜的檢測(cè)方法。
對(duì)于具有典型特征性的臨床表型、疾病候選基因單一或致病變異位點(diǎn)已明確的疾病病例,可選擇PCR和 Sanger 測(cè)序;對(duì)于基因不明確的遺傳病,可權(quán)衡選擇高通量測(cè)序技術(shù),包括基因包(panel)、全外顯子組測(cè)序 (whole exome sequencing,WES)、全基因組測(cè)序 (whole genome sequencing,WGS)等二代測(cè)序(next generation sequencing,NGS)技術(shù)進(jìn)行檢測(cè)。懷疑以拷貝數(shù)變異為主要遺傳特征的遺傳病,可根據(jù)實(shí)際情況,選擇多重連接探針擴(kuò)增技術(shù)(multiplex ligation?dependent probe amplification,MLPA)等進(jìn)行檢測(cè)。
(1)Sanger 測(cè)序:廣泛應(yīng)用于已知單基因遺傳病致病基因或熱點(diǎn)致病位點(diǎn)的遺傳檢測(cè)。但Sanger測(cè)序的通量有限,適合檢測(cè)已知基因的變異,常作為致病基因或致病位點(diǎn)明確的單基因遺傳病的檢測(cè)手段或作為NGS結(jié)果的驗(yàn)證技術(shù)。
(2)NGS:是一種大規(guī)模平行測(cè)序技術(shù),能在短時(shí)間內(nèi)完成上百億堿基的測(cè)序,解決了一代測(cè)序每次只能測(cè)一段較短序列的不足,又稱(chēng)為高通量測(cè)序技術(shù)。NGS 主要包括目標(biāo)區(qū)域捕獲測(cè)序的靶向測(cè)序,具有較高的靈敏度和正確度。越來(lái)越多的疑難罕見(jiàn)病病例通過(guò)父母及先證者一家三口的 WES(trio?WES),發(fā)現(xiàn)了致病基因,Trio?WES也逐漸成為賊后選擇的遺傳檢測(cè)手段。另外,由于 WGS不需要進(jìn)行捕獲,已有嘗試采用 WGS 尋找疑難病的病因。CNV—seq采用NGS技術(shù)對(duì)樣本DNA進(jìn)行低深度全基因組測(cè)序,將測(cè)序結(jié)果與人類(lèi)參考基因組堿基序列進(jìn)行比對(duì),通過(guò)生物信息分析以發(fā)現(xiàn)受檢樣本存在的CNVs。與核型分析、染色體微陣列分析等其他技術(shù)相比,CNV-seq技術(shù)具有檢測(cè)范圍廣、通量高、操作簡(jiǎn)便、兼容性好、所需DNA樣本量低等優(yōu)點(diǎn)。NGS 測(cè)序和生物信息分析技術(shù)已經(jīng)可以同時(shí)檢測(cè)基因的致病變異和拷貝數(shù)異常。但是,無(wú)法對(duì)將檢測(cè)出來(lái)的變異序列和拷貝數(shù)異常同患者的疾病表征建立關(guān)聯(lián),賊新發(fā)展出來(lái)的基因解碼技術(shù)則將各種測(cè)序技術(shù)所不能完成的這種關(guān)聯(lián)進(jìn)行了有效彌補(bǔ)。
(3)MLPA 技術(shù):主要用于目標(biāo)片段基因串聯(lián)拷貝數(shù)或者是目標(biāo)區(qū)域內(nèi)片段的缺失的檢測(cè),如診斷杜興肌肉營(yíng)養(yǎng)不良癥(Duchenne muscular dystrophy,DMD)、脊髓性肌萎縮癥(spinal muscular atrophy,SMA)、貓叫綜合征(5p缺失)、DiGeorge 綜合征(22q11 缺失)等。
03
遺傳病致病基因鑒定的應(yīng)用
3.1 癲癇分子診斷
以癲癇為例,癲癇是除頭痛外神經(jīng)系統(tǒng)第二大常見(jiàn)慢性疾病,嚴(yán)重影響患者的認(rèn)知及生活質(zhì)量。我國(guó)癲癇患病率為千分之七,約有900萬(wàn)癲癇患者,每年約有40萬(wàn)新發(fā)病的患者。導(dǎo)致癲癇的致病因素眾多,包括結(jié)構(gòu)性、遺傳性、感染性、代謝性、免疫性等來(lái)源因素。癲癇綜合征類(lèi)型繁多、表型復(fù)雜,尤其是遺傳因素導(dǎo)致的癲癇綜合征通過(guò)傳統(tǒng)方法難以鑒別診斷。癲癇10歲前始發(fā)者占37%~51.8%,70%~80%與遺傳因素有關(guān)。按檢測(cè)費(fèi)用5000/人計(jì)算,新發(fā)癲癇基因檢測(cè)市場(chǎng)容量約為10億元/年。
提示線索:
除外結(jié)構(gòu)性、免疫性、感染性、代謝病(血尿代謝篩查)等致病因素導(dǎo)致的癲癇發(fā)作; 未找到其他明確病因的癲癇發(fā)作; 有家族史、發(fā)作有熱敏感性特點(diǎn)的患兒遺傳因素致病可能性大; 早發(fā)癲癇性腦病、發(fā)育落后患者遺傳因素致病可能性大; 通過(guò)MRI檢測(cè)額顳區(qū)發(fā)育不良、腦白質(zhì)發(fā)育落后、胼胝體發(fā)育不良時(shí)遺傳因素致病可能性大。
相關(guān)基因:近年來(lái)與癲癇相關(guān)的基因被迅速發(fā)現(xiàn),目前文獻(xiàn)報(bào)道與癲癇相關(guān)的基因超過(guò)一千個(gè),以?xún)和d癇性腦病為例,其基因變異導(dǎo)致的致病機(jī)制涉及到DNA 修復(fù)、轉(zhuǎn)錄調(diào)控、軸突髓鞘化、代謝物和離子轉(zhuǎn)運(yùn)、過(guò)氧化物酶體功能等多個(gè)生物學(xué)過(guò)程。其遺傳復(fù)雜性體現(xiàn)在:一種癲癇綜合征對(duì)應(yīng)多個(gè)變異基因和多種變異形式;同一基因不同的變異位點(diǎn)、變異形式對(duì)應(yīng)多種綜合征。
通過(guò)基因檢測(cè),可以在分子水平上尋找病因,明確診斷疾病;尋找發(fā)病機(jī)制,指導(dǎo)針對(duì)性治療,如嬰幼兒癲癇性腦病SCN1A基因變異,卡馬西平、拉莫三嗪等鈉離子通道抑制劑可加重病情,司替戊醇有效;詢(xún)問(wèn)患者家族史、進(jìn)行家系分析,給予個(gè)性化優(yōu)生優(yōu)育咨詢(xún)。
3.2 新生兒篩查
新生兒疾病篩查是在新生兒早期對(duì)遺傳代謝缺陷、先天性?xún)?nèi)分泌異常及某些嚴(yán)重危害身體健康的疾病進(jìn)行篩查的總稱(chēng)。其目的是在新生兒期篩查并明確診斷以上疾病,使這些患兒能夠及時(shí)得到治療,防止或減輕其體格和智力發(fā)育障礙,降低死亡率。
對(duì)于新生兒遺傳疾病篩查,基因檢測(cè)相比傳統(tǒng)檢測(cè)方法(PCR、放免、酶免、時(shí)間分辨熒光、串聯(lián)質(zhì)譜檢測(cè)等)優(yōu)勢(shì)明顯,具體表現(xiàn)在以下幾個(gè)方面:①傳統(tǒng)篩查技術(shù)篩查的病種較少,基因檢測(cè)技術(shù)一次可篩查上千種遺傳病;②基因檢測(cè)技術(shù)應(yīng)用于新生兒疾病篩查時(shí),在新生兒出生時(shí)采用血片采集臍帶血即可,無(wú)需等待新生兒出生72小時(shí)后扎足跟取血,傳統(tǒng)篩查技術(shù)是有創(chuàng)取血,而基因檢測(cè)是取血;③傳統(tǒng)篩查技術(shù)篩查結(jié)果顯示陽(yáng)性時(shí),需再采一次新生兒足跟血,第二次還是陽(yáng)性的,需要進(jìn)行基因檢測(cè);若出生后直接選擇基因檢測(cè),可一步到位,篩查價(jià)錢(qián)也相差不大;④傳統(tǒng)篩查技術(shù)檢測(cè)的是新生兒血液中代謝物的產(chǎn)量,檢測(cè)結(jié)果易受生理狀態(tài)的影響,容易出現(xiàn)假陽(yáng)性。而基因檢測(cè)查的是基因,檢測(cè)正確性高,無(wú)需重復(fù)檢測(cè)。
目前,國(guó)家已經(jīng)啟動(dòng)實(shí)施了免費(fèi)孕前優(yōu)生健康檢查、增補(bǔ)葉酸預(yù)防神經(jīng)管缺陷、地中海貧血防控、貧困地區(qū)新生兒疾病篩查等重大公共衛(wèi)生項(xiàng)目,廣泛開(kāi)展出生缺陷防治社會(huì)宣傳和健康教育,逐步將兒童先天性心臟病等出生缺陷治療納入大病保障,著力推進(jìn)出生缺陷綜合防治,神經(jīng)管缺陷、重型地中海貧血等出生缺陷的發(fā)生率明顯下降。但從整體來(lái)看,出生缺陷防治服務(wù)能力與群眾日益增長(zhǎng)的優(yōu)生需求仍有較大差距,出生缺陷防治工作任重道遠(yuǎn)。
04
NGS檢測(cè)流程介紹
NGS測(cè)序
數(shù)據(jù)量大,數(shù)據(jù)分析流程復(fù)雜,整個(gè)過(guò)程涉及數(shù)據(jù)生產(chǎn)、分析比對(duì)、變異注釋、變異篩選和變異分類(lèi)等,需要建立一個(gè)專(zhuān)業(yè)的、系統(tǒng)的數(shù)據(jù)分析流程,形成統(tǒng)一的數(shù)據(jù)解讀與報(bào)告規(guī)范。一份遺傳檢測(cè)報(bào)告內(nèi)容涉及樣本和數(shù)據(jù)的質(zhì)量控制、數(shù)據(jù)分析的標(biāo)準(zhǔn)流程、基因變異的專(zhuān)業(yè)解讀、臨床表型與基因型的對(duì)應(yīng)關(guān)系分析、檢測(cè)報(bào)告的規(guī)范化格式以及相關(guān)的社會(huì)倫理問(wèn)題等。
主要檢測(cè)流程為:遺傳檢測(cè)前流程(臨床信息采集、擬定檢測(cè)方案)—樣本采集處理與檢測(cè)、數(shù)據(jù)分析流程、檢測(cè)報(bào)告解讀和遺傳咨詢(xún)。
4.1 樣本采集處理與測(cè)序
目前國(guó)內(nèi)已有許多二代測(cè)序公司試水臨床遺傳病的檢測(cè),而對(duì)于涉及臨床檢測(cè)的實(shí)驗(yàn)室操作尚無(wú)統(tǒng)一的標(biāo)準(zhǔn)。臨床實(shí)驗(yàn)室規(guī)范化與標(biāo)準(zhǔn)化的檢測(cè)與質(zhì)控是非常重要的。質(zhì)量控制包括核酸質(zhì)控、文庫(kù)質(zhì)控、測(cè)序數(shù)據(jù)質(zhì)控,特別是文庫(kù)構(gòu)建需評(píng)估試劑有效性,測(cè)序需評(píng)估不同試劑批次和固定時(shí)間間隔下的儀器損耗的穩(wěn)定性;NGS 測(cè)序質(zhì)量參數(shù)應(yīng)能滿足基本要求,如測(cè)序數(shù)據(jù)的單堿基質(zhì)量評(píng)估指數(shù)(Q30)>=70%,對(duì)于目標(biāo)區(qū)域捕獲測(cè)序的靶向測(cè)序,建議95%以上的目標(biāo)序列區(qū)域測(cè)序覆蓋深度不小于 20X,測(cè)序目標(biāo)區(qū)域平均測(cè)序深度不低100X。
4.2 生物信息學(xué)分析流程
生物信息學(xué)分析是將測(cè)序獲得的堿基序列轉(zhuǎn)換為遺傳學(xué)語(yǔ)言的過(guò)程。生物信息學(xué)分析的核心工具是軟件和數(shù)據(jù)庫(kù)。遺傳病基因檢測(cè)的生物信息學(xué)分析流程主要包括數(shù)據(jù)過(guò)濾、序列比對(duì)、變異檢測(cè)、變異注釋和相關(guān)質(zhì)控統(tǒng)計(jì)等步驟。
數(shù)據(jù)分析流程必須包含測(cè)序數(shù)據(jù)質(zhì)控計(jì)算的步驟,需根據(jù)比對(duì)文件計(jì)算目標(biāo)區(qū)域的覆蓋度、平均深度、重復(fù)序列比例、比對(duì)到目標(biāo)區(qū)域的讀句比例、目標(biāo)區(qū)域每個(gè)堿基的測(cè)序深度等指標(biāo)來(lái)評(píng)價(jià)測(cè)序的質(zhì)量。基于探針捕獲的測(cè)序數(shù)據(jù)還需要計(jì)算捕獲效率。這一步的分析流程多為實(shí)驗(yàn)室自主編寫(xiě)。測(cè)序數(shù)據(jù)質(zhì)量將直接影響檢測(cè)結(jié)果的正確性。
變異檢測(cè)分為兩大類(lèi),一類(lèi)是單堿基變異(single nucleotide variant,SNV)和小插入缺失變異(insertion and deletion,INDEL);另一類(lèi)是染色體水平的結(jié)構(gòu)變異(structure variant,SV),其中拷貝數(shù)變異(copy number variation,CNV)指較大片段的重復(fù)或缺失變異,而SV一般指除CNV以外的結(jié)構(gòu)變異如序列倒位、易位等。常用于檢測(cè)SNV和INDEL的軟件是GATK和SMAtools等。
由于檢測(cè)策略的差異,不同軟件的檢測(cè)結(jié)果往往存在一定的差別,相同軟件不同的參數(shù)設(shè)置同樣會(huì)導(dǎo)致檢測(cè)結(jié)果的差異。檢測(cè)CNV和SV可根據(jù)實(shí)際應(yīng)用目的采取不同的流程,目前常用的檢測(cè)策略包括基于深度差別、斷點(diǎn)檢測(cè)、基于PE關(guān)系的讀句距離統(tǒng)計(jì)和重組裝策略,對(duì)于高深度測(cè)序還可以通過(guò)計(jì)算SNP的支持讀句比例來(lái)檢測(cè)CNV。常用的檢測(cè)軟件包括CNVkit、XHMM、CNVnator等,檢測(cè)SV的軟件包括LUMPY、BreakDancer等。
4.3 檢測(cè)報(bào)告解讀
遺傳分析的輸入為信息分析注釋數(shù)據(jù),輸出為報(bào)告,其遺傳分析環(huán)節(jié)涉及變異初篩、表型匹配和變異致病性判讀等3個(gè)步驟。因二代測(cè)序產(chǎn)生的變異多,遺傳分析環(huán)節(jié)涉及較多的人工判斷,因此各實(shí)驗(yàn)室需根據(jù)ACMG指南的原則編寫(xiě)數(shù)據(jù)解讀的SOP,相關(guān)人員在充分的培訓(xùn)和考核后方可進(jìn)行數(shù)據(jù)解讀和報(bào)告出具。
美國(guó)ACMG建議使用正常人群頻率>常見(jiàn)的遺傳病發(fā)病率制定默認(rèn)篩選頻率,如次等位基因頻率(minor allele frequency,MAF)>1%。自動(dòng)化篩選流程的條件需進(jìn)行保存。但需注意由于個(gè)體偏差和外顯不全等因素,有些致病突變的人群頻率較高,甚至在特定人群中頻率超過(guò)5%。
針對(duì)患者的基因檢測(cè)的首要訴求是找到分子水平的致病原因,因此需結(jié)合受檢者的臨床表型對(duì)樣品進(jìn)行分析和解讀。在表型匹配環(huán)節(jié),需將患者的表型與檢測(cè)到的變異基因所致疾病的表型進(jìn)行比對(duì)分析,因此需借助數(shù)據(jù)庫(kù)和文獻(xiàn)檢索來(lái)完成。因此構(gòu)建自主的基因-疾病-疾病表型數(shù)據(jù)庫(kù)以提高表型匹配的效率是非常必要的。需注意基因、疾病和疾病表型的關(guān)聯(lián)并不是固定不變的,隨著科研和臨床的發(fā)展與進(jìn)步會(huì)不斷擴(kuò)增更新,內(nèi)部數(shù)據(jù)庫(kù)也要根據(jù)賊新研究進(jìn)展,不斷更新、優(yōu)化和矯正。
表型匹配由于人工參與度高,已成為數(shù)據(jù)解讀的限速環(huán)節(jié),因此可借助自動(dòng)化的表型匹配軟件來(lái)提高效率。目前有多種軟件可流程化實(shí)現(xiàn)表型匹配和關(guān)聯(lián),常用的表型匹配軟件包括Phenolyzer、Exomiser、Xrare及商業(yè)軟件TGex等,也可使用自主開(kāi)發(fā)的表型匹配軟件進(jìn)行輔助解讀。這些軟件能夠根據(jù)患者的表型,將檢出的突變按相關(guān)性進(jìn)行排序,作為解讀結(jié)果的參考,但并不能有效替代人工得出結(jié)論。
判斷位點(diǎn)致病性的證據(jù)有一些可以進(jìn)行自動(dòng)化分析(如人群頻率、軟件預(yù)測(cè)等),而有些只能通過(guò)人工閱讀文獻(xiàn)或驗(yàn)證實(shí)驗(yàn)獲取,輔助解讀軟件可自動(dòng)在ACMG指南框架下對(duì)變異進(jìn)行致病性判斷(如InterVar),但均需要人工進(jìn)行校正,才可獲取足夠的證據(jù)項(xiàng),得到正確的結(jié)論。
4.4 數(shù)據(jù)解讀價(jià)值分析
遺傳病臨床檢測(cè)的面臨的挑戰(zhàn)在于,檢測(cè)數(shù)據(jù)量大及解讀準(zhǔn)難度大。檢測(cè)報(bào)告解讀由于人工參與度高,已成為數(shù)據(jù)解讀的限速環(huán)節(jié),如果一個(gè)月處理10個(gè)、100個(gè)樣本,人力尚可以解決,但如果樣本量增加到1000個(gè)、10000個(gè),人力就很難高效檢測(cè)速度和解讀的精度了。況且,我國(guó)現(xiàn)具備醫(yī)學(xué)遺傳學(xué)臨床診斷能力的的醫(yī)師十分有限。
因此,生物信息分析能力是國(guó)內(nèi)基因相關(guān)企業(yè)的賊大競(jìng)爭(zhēng)力。如何利用AI和大數(shù)據(jù)的研究進(jìn)展,開(kāi)發(fā)先進(jìn)的生物信息算法和技術(shù),去正確、高效地解讀序列,識(shí)別和標(biāo)識(shí)疾病相關(guān)的突變的同時(shí),賊大限度的實(shí)現(xiàn)流程自動(dòng)化,減少人為誤差,提高工作效率,對(duì)基因檢測(cè)公司提出了非常高的要求。
另外,隨著測(cè)序生產(chǎn)成本和生物信息基于云平臺(tái)的分析成本不斷降低,基因數(shù)據(jù)解讀在基因檢測(cè)服務(wù)中的成本比例將逐漸提高。根據(jù)Frost&Sullivan的NGS測(cè)序
服務(wù)成本構(gòu)成數(shù)據(jù),從2013年到2020年,在超摩爾定律下測(cè)序儀在整個(gè)測(cè)序服務(wù)的成本占比下降了83.3%,而數(shù)據(jù)解讀成本占比翻了一倍,占整體成本的30%。
筆者認(rèn)為遺傳咨詢(xún)及數(shù)據(jù)解讀是細(xì)分領(lǐng)域的藍(lán)海市場(chǎng),且商業(yè)化價(jià)值高,但其服務(wù)體系的標(biāo)準(zhǔn)化建立、數(shù)據(jù)積累與共享局限性以及目前我國(guó)專(zhuān)業(yè)遺傳咨詢(xún)師人才奇缺,導(dǎo)致其商業(yè)化周期較長(zhǎng),因此迫切需要有數(shù)據(jù)積累、技術(shù)沉淀和臨床資源的企業(yè)領(lǐng)航,促進(jìn)行業(yè)發(fā)展。
05
遺傳病基因檢測(cè)市場(chǎng)容量
5.1 遺傳病/罕見(jiàn)病市場(chǎng)容量
根據(jù)FDA的統(tǒng)計(jì),全球已知的罕見(jiàn)病約有7,000 多種,其中約80%屬于遺傳性疾病。全球罕見(jiàn)病患者已超過(guò)2.5 億,約50%的罕見(jiàn)病患者在出生時(shí)或兒童時(shí)期發(fā)病,約30%的罕見(jiàn)病兒童壽命不超過(guò)5歲。已知的7,000 多種罕見(jiàn)病中,大部分罕見(jiàn)病威脅患者生命或嚴(yán)重影響生存質(zhì)量,但在有藥物治療的情況下,部分罕見(jiàn)病的疾病進(jìn)程可逐漸得到控制,直至被管理成為慢性疾病。
根據(jù)中國(guó)罕見(jiàn)病定義(患病率
以平均檢測(cè)費(fèi)用5000元計(jì),總市場(chǎng)存量5000x1000萬(wàn)=500億元;按照目前滲透率5%~10%計(jì)算,目前市場(chǎng)容量為25~50億元。
5.2 新生兒篩查市場(chǎng)容量
國(guó)家統(tǒng)計(jì)局?jǐn)?shù)據(jù),2019年我國(guó)出生人口為1465萬(wàn)人,假設(shè)滲透率20%,即有約300萬(wàn)新生兒選擇遺傳病基因篩查,單次檢測(cè)價(jià)格1500元,潛在市場(chǎng)容量45億元/年。遺傳病基因篩查,相較于質(zhì)譜篩查,在遺傳病種類(lèi)、正確性等方面,均具有明顯優(yōu)勢(shì)。耳聾單病種基因篩查,目前也有約10億/年市場(chǎng)規(guī)模。
5.3 遺傳病輔助診斷增量市場(chǎng)
以2012年原衛(wèi)生部公布的5.6%出生缺陷率計(jì)算,每年新發(fā)生出生缺陷患兒約80萬(wàn)人。遺傳性缺陷約占總出生缺陷的30%,即每年新生遺傳病患兒達(dá)25萬(wàn)人。按平均檢測(cè)費(fèi)用5000元計(jì)算,遺傳病輔助診斷增量市場(chǎng)25億/年。
06
NGS&正確醫(yī)療相關(guān)政策
2014年2月,原國(guó)家食品藥品監(jiān)督管理總局辦公廳、國(guó)家衛(wèi)生和計(jì)劃生育委員會(huì)辦公廳發(fā)布聯(lián)合叫停了基因檢測(cè)產(chǎn)品,約半年后解禁。2015年,基因產(chǎn)業(yè)上升為國(guó)家戰(zhàn)略,基因檢測(cè)技術(shù)被列入“新型健康技術(shù)惠民工程”。同年1月,原國(guó)家衛(wèi)計(jì)委正式批準(zhǔn)了109家醫(yī)療機(jī)構(gòu)開(kāi)展NIPT高通量測(cè)序臨床試點(diǎn)。
在此后連續(xù)多年包括“十三五”等生物產(chǎn)業(yè)和科技創(chuàng)新規(guī)范文件中,明確提出要把基因檢測(cè)作為重點(diǎn)發(fā)展的新興產(chǎn)業(yè),快速推進(jìn)基因檢測(cè)在重大疾病早期篩查、個(gè)體化治療等方面的臨床應(yīng)用。政府到2030年前擬投入600元發(fā)展正確醫(yī)療,基因檢測(cè)是實(shí)現(xiàn)正確醫(yī)療的基礎(chǔ)路徑。筆者預(yù)計(jì),至少在未來(lái)10年里,基因檢測(cè)行業(yè)將得到政府資金、科研成果轉(zhuǎn)化等多方面支持。
07
遺傳病基因檢測(cè)主要企業(yè)
遺傳病NGS檢測(cè)主要企業(yè)整理如下:
目前遺傳病領(lǐng)域的診斷和治療都非常落后,診斷結(jié)果并不正確,遺傳病領(lǐng)域?qū)τ谡_醫(yī)療的需求非常迫切,因此中國(guó)遺傳病基因檢測(cè)領(lǐng)域潛在市場(chǎng)巨大(上文推算約500億)。但是遺傳病種類(lèi)繁多、復(fù)雜并且臨床解讀的困難性等特點(diǎn)使得絕大多數(shù)基因檢測(cè)廠家望而卻步。能夠在癲癇等神經(jīng)系統(tǒng)疾病和遺傳代謝病等患者基數(shù)大且部分可診可治的細(xì)分應(yīng)用場(chǎng)景下提高科研服務(wù)和綜合測(cè)序&解讀能力的企業(yè),將會(huì)在巨大的遺傳病潛在市場(chǎng)機(jī)會(huì)下獲得更多的機(jī)會(huì)和商業(yè)價(jià)值。
在上游測(cè)序儀器和設(shè)備被壟斷的情況下,企業(yè)的核心競(jìng)爭(zhēng)力集中在基因數(shù)據(jù)分析環(huán)節(jié),可重點(diǎn)關(guān)注數(shù)據(jù)挖掘和遺傳解讀細(xì)分領(lǐng)域的企業(yè),目前國(guó)內(nèi)少有專(zhuān)注該領(lǐng)域的企業(yè);初創(chuàng)企業(yè)可考慮進(jìn)入該領(lǐng)域,并借助人工智能技術(shù)實(shí)現(xiàn)該環(huán)節(jié)非標(biāo)準(zhǔn)化服務(wù)的突破。同時(shí),傳統(tǒng)的生物信息軟件和數(shù)據(jù)庫(kù)商業(yè)化值得投入,臨床表現(xiàn)出較強(qiáng)對(duì)完整基因測(cè)序報(bào)告與遺傳解讀的需求,將帶來(lái)未來(lái)的產(chǎn)業(yè)生態(tài)加速
(責(zé)任編輯:佳學(xué)基因)