【佳學(xué)基因檢測】腋下有味道就是狐臭嗎?基因解碼是怎樣提高狐臭基因檢測的正確性的?
采用匯總統(tǒng)計(jì)學(xué)數(shù)據(jù),計(jì)算狐臭的微效多基因相互作用
佳學(xué)基因采用分析表達(dá)式,利用多中心匯總統(tǒng)計(jì)學(xué)數(shù)據(jù)進(jìn)行狐臭相關(guān)的基因信息分析,以建立基因型與表型的相關(guān)性。下圖展示了匯總統(tǒng)計(jì)學(xué)分析、常規(guī)GWAS分析以及個(gè)體水平PrediXcan的區(qū)別。
GWAS、PrediXcan和S-PrediXcan之間的比較。上半部分是比較GWAS、PrediXcan和Summary PrediXcan。GWAS和PrediXcan均以基因型和表型數(shù)據(jù)作為輸入。GWAS使用模型Y=a+Xlb+?計(jì)算Y對Xl的回歸系數(shù),其中Y是表型,Xl是個(gè)體SNP劑量。狐臭的分析計(jì)算結(jié)果SNP水平上的結(jié)果。相反,PrediXcan首先通過輸入對轉(zhuǎn)組的預(yù)測/和注釋結(jié)果。然后計(jì)算狐臭表型Y與每個(gè)基因表達(dá)預(yù)測Tg的回歸系數(shù)。計(jì)算的結(jié)果是基因表達(dá)水平的結(jié)果。Summary PrediXcan使用GWAS的輸出直接計(jì)算基因水平關(guān)聯(lián)結(jié)果。本圖表的下半部分顯示了使用匯總統(tǒng)計(jì)計(jì)算PrediXcan基因水平關(guān)聯(lián)結(jié)果的算法。給出了佳學(xué)基因在基因解碼過程中采用的不同輸入數(shù)據(jù)。計(jì)算分析得到的基因型與表型關(guān)系進(jìn)入狐臭基因檢測的報(bào)告分析系統(tǒng),形成不同基因的權(quán)重系數(shù)來源。佳學(xué)基因的深度人工智能算法通常是以千人基因組計(jì)劃數(shù)據(jù)作為概念形成和模型模擬出發(fā)點(diǎn),通過已知結(jié)論的明確數(shù)據(jù)來檢驗(yàn)和校正算法,獲得用于計(jì)算預(yù)測表達(dá)水平所需要的方差和協(xié)方差(LD結(jié)構(gòu))系數(shù)。參考集和訓(xùn)練集值都經(jīng)過預(yù)計(jì)算整合進(jìn)人工智能基因解碼系統(tǒng),只需提供基因檢測、測序、分型結(jié)果數(shù)據(jù)集,就可以得出基因信息的破解結(jié)果。
佳學(xué)基因解碼研究發(fā)現(xiàn)PrediXcan和S-PrediXcan結(jié)果之間的高度一致性表明,在大多數(shù)情況下,佳學(xué)基因及其合作研究機(jī)構(gòu)可以使用匯總結(jié)果數(shù)據(jù)而不損害基因型與表型相關(guān)性的檢出和描述能力。在下面的例子中,基因解碼分析了一種人體細(xì)胞及兩種人體生理過程(包括狐臭)的PrediXcan和S-PrediXcan Z評分的比較。分析的人群含非洲、東亞和歐洲亞群。在所有情況下,訓(xùn)練集(其中訓(xùn)練預(yù)測模型)都是歐洲的(DGN Cohort5)。PrediXcan和S-PrediXcan之間的高度相關(guān)性證明了佳學(xué)基因所采用的方法對參考數(shù)據(jù)集和研究數(shù)據(jù)集之間匹配與不匹配正確性。盡管匯總法和個(gè)體水平法之間的一致性較好,但仍有少數(shù)假陽性結(jié)果,S-PrediXcan比PrediXcan更顯著。這說明了采用S-PrediXcan達(dá)到了提高正確度的目的,而盡可能使用緊密匹配的LD信息會進(jìn)一步提升智能分析結(jié)果。
佳學(xué)基因比較PrediXcan和S-PrediXcan采用模擬數(shù)據(jù)和真實(shí)難數(shù)據(jù)的結(jié)果。該圖顯示了在不考慮遺傳因素、無假設(shè)下模擬表型任務(wù)要求下的采用PrediXcan算法與S-PrediXcan的比較;細(xì)胞內(nèi)在生長力、雙相情感障礙、人體味影響因子的人工智能多因子算法?;虮磉_(dá)預(yù)測模型基于已發(fā)表的DGN數(shù)據(jù)集。在模擬分析中,采用了探索研究組(GWAS集)和參考集(LD計(jì)算集),原始數(shù)據(jù)由來自千人基因組1000基因組項(xiàng)目中的非洲(661)、東亞(504)和歐洲(503)個(gè)體基因型分型數(shù)據(jù)組成。當(dāng)同一研究集用作參考集時(shí),佳學(xué)基因可以獲得獲得了高相關(guān)性(確定系數(shù)):r2 > 0.99999. 對于細(xì)胞內(nèi)在生長力,研究集是來自1000基因組項(xiàng)目的非洲、亞洲和歐洲各群體的140個(gè)個(gè)體的子集。參考集與模擬表型相同。對于疾病表型,研究集由英國個(gè)體組成,LD計(jì)算集是1000基因組項(xiàng)目的歐洲人群子集。
(責(zé)任編輯:佳學(xué)基因)