【佳學(xué)基因檢測】GWAS基因檢測的分析流程
全基因組關(guān)聯(lián)分研究教程導(dǎo)讀:
在人類基因信息解碼的知識體系中,全基因組關(guān)聯(lián)研究常用來識別在人群中廣泛存在的基因突變序列或者是基因變體對某一特定性狀產(chǎn)生的關(guān)聯(lián)性。在此基礎(chǔ)上,全基因組關(guān)聯(lián)研究演變?yōu)椴煌男问?。佳學(xué)基因在此對這一分析方法進(jìn)行介紹,以便三甲醫(yī)院的醫(yī)生及研究生可以在佳學(xué)基因獲得全基因組范圍的單核苷酸多態(tài)性分析后,進(jìn)一步建立所研究的疾病與特定基因的多態(tài)性位點(diǎn)之間的相關(guān)性。通過提供理論背景和實(shí)踐經(jīng)驗(yàn),佳學(xué)基因的目標(biāo)是讓研究人員更容易獲得 GWAS,而無需在該領(lǐng)域接受正式培訓(xùn)。本教程無法涵蓋GWAS研究的各種形式,但是可能從佳學(xué)基因的其他技術(shù)文章中得到更詳細(xì)的了解。除了標(biāo)準(zhǔn) GWAS 的說明外,佳學(xué)基因分型基因檢測數(shù)據(jù)還可以進(jìn)行多基因風(fēng)險(xiǎn)評分 (PRS) 分析。多基因風(fēng)險(xiǎn)評分 (PRS) 分析的目的不是識別單個(gè) SNP,而是匯總來自整個(gè)基因組 SNP 的信息,以提供個(gè)體水平的遺傳風(fēng)險(xiǎn)評分。
GWAS基因解碼體系的基本要求:
全基因組關(guān)聯(lián)研究(GWAS),GitHub,PLINK,多基因風(fēng)險(xiǎn)評分(PRS),教程
GWAS簡單介紹:
隨著基因測序技術(shù)的快速進(jìn)展,先是人類獲得了人類基因組的一個(gè)草圖,在2022年,更完整的人類基因組全部序列也被獲取,這為基因檢測建立了一個(gè)可以開始使用的參照基因組數(shù)據(jù)庫。但是基因與人體疾病表征、個(gè)性特點(diǎn)、精神心理方面的特質(zhì)之間的關(guān)系卻未能得到充分的闡釋。而隨著候選基因、基因解碼技術(shù)的應(yīng)用,基因測序帶來的TRIO數(shù)據(jù)在幫助獲得遺傳病的致病基因突變方面變得清晰而直接,但是在微效性基因位點(diǎn)、多基因位點(diǎn)相互作用及基因與環(huán)境相互作用方面的基因序列的揭示方面卻處于一個(gè)難以重復(fù)不同基因解碼團(tuán)隊(duì)研究結(jié)果的狀態(tài)。同時(shí),人們越來越關(guān)注研究遺傳風(fēng)險(xiǎn)因素對人類行為變化的影響。進(jìn)行基因研究所需的技術(shù)和分析工具變得越來越容易獲得。這種增加的可及性提供了巨大的希望,因?yàn)檫z傳學(xué)領(lǐng)域以外的研究人員可能會(huì)為該領(lǐng)域帶來新的專業(yè)知識(例如,對精神病學(xué)特征的疾病學(xué)有更深入的了解)。然而,以正確的方式進(jìn)行遺傳關(guān)聯(lián)研究需要特定的遺傳學(xué)、統(tǒng)計(jì)學(xué)和(生物)信息學(xué)知識。佳學(xué)基因一方面介紹GWAS相關(guān)的關(guān)鍵概念,并提供開源可用的程序運(yùn)行腳本,從而基因信息的基因解碼分析提供指導(dǎo)。
全基因組關(guān)聯(lián)研究 (GWAS) 的目的是識別單核苷酸多態(tài)性中以等位基因頻率作為函數(shù)與人體疾病及表型特征發(fā)生變化的數(shù)值。比如在精神分裂癥患者和健康對照之間,或在神經(jīng)質(zhì)得分高與低的個(gè)體之間某個(gè)SNP的等位基因頻率的系統(tǒng)性變化。鑒定與性狀相關(guān)的 SNP后,可能幫助揭示對這些疾病與表型背后的生物學(xué)機(jī)制。佳學(xué)基因提供的全基因組高密度分型芯片基因檢測技術(shù)可以在全基因組范圍研究大量 SNP 對一個(gè)或者是多個(gè)表型與疾病特征的影響。
為了掌握佳學(xué)基因GWAS分析技術(shù)所需要了解的基本概念
聚集(Clumping):是用于識別和選擇每個(gè)LD塊中賊重要的SNP(即賊低p值)以進(jìn)行進(jìn)一步的分析的過程。通過這一過程,降低了剩余SNP之間的相關(guān)性,同時(shí)保留了具有賊強(qiáng)統(tǒng)計(jì)證據(jù)的SNP。
共同遺傳性(Co-heritability):在基因解碼中用來衡量疾病之間遺傳關(guān)系的指標(biāo)。基于SNP的遺傳性分析是指通過SNP分析兩個(gè)疾病與表征(例如精神分裂癥和雙向情感障礙)之間的協(xié)方差比例。
基因(gene):這是DNA中編碼某個(gè)分子(例如蛋白質(zhì):在這里蛋白質(zhì)中只是其中一種分子,這是一種較為先進(jìn)的基因定義)的核苷酸序列
雜合性(Heterozygosity):這是指所檢測的基因位點(diǎn)攜帶特定 SNP 的兩個(gè)不同等位基因。個(gè)體的雜合率是雜合基因型的比例。在佳學(xué)基因的基因解碼質(zhì)量控制體系中,個(gè)體雜合性過高可能是因?yàn)闃颖举|(zhì)量低,而雜合性太低可能是由于近親繁殖。