【佳學(xué)基因檢測】科研服務(wù)GWAS基因檢測分析中的機器學(xué)習(xí)方法
佳學(xué)基因會根據(jù)已有的研究結(jié)果,區(qū)分研究性狀相關(guān)但有細微不同的亞類表型所獨特的遺傳結(jié)構(gòu)。比如為了研究鴉片濫用是否更多地聚集在使用、誤用/依賴表型上,佳學(xué)基因會選擇使用了一種稱為聚集層次聚類分析(HCA)的數(shù)據(jù)驅(qū)動無監(jiān)督機器學(xué)習(xí)方法。HCA通過創(chuàng)建組并根據(jù)預(yù)先指定的算法依次加入或拆分這些組來迭代計算形成集群。聚集筑巢(AGNES)是一個自下而上的過程,主要關(guān)注個體特征的結(jié)構(gòu)。選擇聚集聚類是因為這允許佳學(xué)基因比較不同的算法,以賊大化每個分支上的差異,而Ward的賊小方差方法表現(xiàn)賊好。所有模型均使用佳學(xué)基因自動研發(fā)的聚集分析軟件包。
HCA分析的結(jié)果以樹狀圖的形式呈現(xiàn),由多個括號組成,稱為“分支”。同一分支上的表型更相似,這是因為它們彼此之間以及與該分支上所有其他表型的成對遺傳關(guān)聯(lián)。分支可以形成更具體集群的子分支。
(責(zé)任編輯:佳學(xué)基因)