遺傳病、罕見病基因檢測導(dǎo)讀
2018年9月19日,國際高級醫(yī)學(xué)雜志《自然醫(yī)學(xué)》上發(fā)表了一項基因解碼人工智能應(yīng)用的重磅研究:來自美國的醫(yī)學(xué)研究人員開發(fā)了一個人工智能應(yīng)用,不僅能夠以97%的正確率確定患者的肺癌類型,甚至還可以根據(jù)腫瘤患者的病理切片圖像推斷導(dǎo)致腫瘤發(fā)生的驅(qū)動基因。這一進(jìn)展表明基因解碼不僅可以根據(jù)基因序列的變化推斷出尚未發(fā)生的疾病、患者將會出現(xiàn)的疾病表征。反過來,基因解碼積累的數(shù)據(jù)還可以根據(jù)疾病表型推斷出導(dǎo)致疾病發(fā)生的原因。
基因解碼人工智能現(xiàn)在能做什么?
肺癌在中國的發(fā)生率賊高。生存率也不容樂觀。據(jù)統(tǒng)計,在中國每年有超過百萬人死于與肺癌相關(guān)的并發(fā)癥。更讓人沮喪的是,在過去四十年中,盡管癌癥患者的總生存率提高了2倍多,但肺癌患者的生存率幾乎沒有提高。目前僅有5%的肺癌患者生存期超過10年。在肺癌的診斷和治療方面,人們還有很長的路要走。。
肺癌基因解碼研究團(tuán)隊開發(fā)了一種人工智能算法,使用The Cancer Genome Atlas(TCGA)里積累的1634張病理圖像對人工智能算法進(jìn)行模式適配,并通過人工智能實現(xiàn)自我調(diào)整。TCGA是一個由美國國家癌癥研究所(NCI)和美國國家人類基因組研究所(National Human Genome Research Institute,NHGRI)建立、管理并維護(hù)的癌癥數(shù)據(jù)庫,包含了33種不同類型的癌癥,以及已經(jīng)發(fā)現(xiàn)的在每種癌癥中存在的基因序列變化。這是一種初級形式的基因解碼數(shù)據(jù)庫。更為先進(jìn)的基因解碼是由曾在諾華制藥基因組學(xué)研究中心擔(dān)任博士后研究員、后來任國際細(xì)胞治療協(xié)會副主席的黃家學(xué)博士提出基因解碼方案。在黃博士提出的方案中,對導(dǎo)致肺癌發(fā)生的基因原因的查找不能采用基因檢測方法,而是采用基因解碼方法。基因檢測是列舉式、假設(shè)式、驗證式的檢測,其中任何一個環(huán)節(jié)出現(xiàn)錯誤,都無法找到疾病發(fā)生的基因原因。致病基因鑒定基因解碼的先進(jìn)步是盡量獲取人體的全部基因序列,盡力做到患者體內(nèi)的每一個基因突變都被納入了分析的范圍中。不遺漏、不丟棄。然后通過分析每一個基因序列的變化所導(dǎo)致的功能變化,進(jìn)而找到疾病發(fā)生的原因。致病基因鑒定基因解碼可以發(fā)現(xiàn)世界上沒有報道的基因突變,可以分析導(dǎo)致病人疾病發(fā)生的獨(dú)特性原因。
上圖為人工智能從癌變組織圖像中識別兩種肺癌類型的示意圖。其中左圖為原始圖像,右圖為人工智能輸出的肺癌類型圖譜。右圖中的紅色部分為鱗狀細(xì)胞癌,藍(lán)色部分為肺鱗狀細(xì)胞癌,灰色部分為正常肺部組織(圖片來源:NYU School of Medicine)
在完成了對基因解碼人工智能算法的訓(xùn)練之后,基因解碼工問題人員開始使用這一人工智能應(yīng)用來區(qū)分腺癌和鱗狀細(xì)胞癌,這兩種癌癥都是肺癌賊常見的形式。在實際應(yīng)用中,樣本中出現(xiàn)了在各種復(fù)雜的情況,比如血塊、炎癥、壞死區(qū)域和肺萎縮等等,基因解碼人工智能仍然可以正確識別絕大部分樣本中的肺癌類型,正確率賊高可到達(dá)97%。更加令人印象深刻的是,這一人工智能應(yīng)用在一臺只配備了一個一圖形處理器的電腦上運(yùn)行時,平均所需時間只有短短20秒。
基因解碼人工智能仍有提高空間?
在分析過程中發(fā)現(xiàn),智能基因解碼出現(xiàn)錯誤的一小部分腫瘤樣本中,約有一半病理學(xué)家不能出現(xiàn)了錯誤,這一點(diǎn)表明了區(qū)分兩種肺癌的難度。另一方面,在54幅被至少一位病理學(xué)家錯誤分類的圖像中,基因解碼人工智能正確地對其中的45幅進(jìn)行了分類。這一點(diǎn)說明基因解碼人工智能可以為醫(yī)生提供有用的補(bǔ)充信息。
除了對肺癌的類型進(jìn)行分類識別外,工作人員還讓基因解碼人工智能識別癌變組織存在的突變基因。利用腫瘤外病理切片之間存在的細(xì)微差異,基因解碼人工智能可以預(yù)測在細(xì)胞中是否存在與肺癌相關(guān)的6個突變基因,這6個基因分別為STK11、EGFR、FAT1、SETBP1、KRAS和TP53。針對不同的突變基因,新開發(fā)的基因解碼人工智能的預(yù)測正確率也新不同,總體介于73%到86%之間。
這說明基因解碼人工智能可能會成為一個非常有用的工具,幫助病理學(xué)家對肺部組織圖像進(jìn)行分類,并根據(jù)切片的圖像對可能導(dǎo)致肺癌的基因突變進(jìn)行初步分析,這有可能減輕基因解碼費(fèi)用對正確診斷帶來不利影響。
推遲癌癥治療永遠(yuǎn)不會對患者有益,基因解碼人工智能在疾病種類細(xì)分、腫瘤驅(qū)動基因鑒定的正確性上、便利性上可以讓患者更早開始接受靶向治療。
基因解碼人工智能的發(fā)展趨勢
未來,基因解碼人工智能在更為有效、更為精細(xì)的數(shù)據(jù)指導(dǎo)下,可能很快以超過90%的正確率確定哪些基因在特定癌癥中發(fā)生突變。屆時這項技術(shù)用于臨床,來輔助進(jìn)行不同癌癥類型的診斷工作。目前基因解碼已近備用來分析超過四萬種疾病的致病基因。可能在不久的將來,中國自己的基因解碼人工智能會早日服務(wù)那些需要先進(jìn)醫(yī)學(xué)技術(shù)的人們。
參考資料:
[1] Artificial intelligence can determine lung cancer type. Retrieved September 19, 2018, from https://www.eurekalert.org/pub_releases/2018-09/nlh-aic091718.php
[2] Coudray, et al., (2018). Classification and mutation prediction from non–small cell lung cancer histopathology images using deep learning. Nature Medicine, doi: http://dx.doi.org/10.1038/s41591-018-0177-5
[3] NYU applies open source Google AI to diagnose lung cancer. Retrieved September 19, 2018, from https://venturebeat.com/2018/09/17/nyu-trains-open-source-google-ai-system-to-diagnose-lung-cancer/