【佳學基因檢測】人的遺傳病基因檢測數(shù)據(jù)庫核心數(shù)據(jù)揭密
人類基因病、遺傳病基因檢測的科學性分析小組從兩個數(shù)據(jù)庫資源中獲得了一組可能致?。ㄒ?a href='http://deyicom.cn/cp/fenxian/' target='_blank'>疾病)的遺傳變異:ClinVar 和 UniProt。 ClinVar 從提交的研究報告中匯總報告的變異疾病關聯(lián)。 ClinVar對變異的臨床解釋遵循ACMG(美國醫(yī)學遺傳學和基因組學學會)指南,分為五類:“致病性”、“可能致病性”、“不確定意義”、“良性”和“可能良性”。遺傳病基因檢測將“致病”或“可能致病”類別視為致病變異,將“良性”和“可能良性”類別視為非致病變異,同時忽略“不確定意義”類別。應該注意的是,ClinVar 解釋中可能存在錯誤或與其他數(shù)據(jù)庫的不一致,尤其是“可能致病”和“可能良性”類別,其中 ACMG 推薦的置信水平大于 90% 的致病和確定性良性的。在約 4,200 個蛋白質(zhì)編碼基因中發(fā)現(xiàn)了注釋為“致病性”或“可能致病性”的 ClinVar 變異,約占人類蛋白質(zhì)組的五分之一。在這些基因檢測變體中,單氨基酸變異(SAV) 存在于這些基因的大多數(shù) (3,410) 中。在其中大多數(shù)(約 3,300 個基因)中也發(fā)現(xiàn)了非單氨基酸變異(SAV) 變體。非單氨基酸變異(SAV) 變異包括插入缺失變異、非編碼區(qū)(主要在剪接位點)的單核苷酸變異、無義單核苷酸變異(終止密碼子)和少量同義變異。 31,171 個單氨基酸變異(SAV) 約占所有帶有“致病性”或“可能致病性”注釋的 ClinVar 變異的 30%。 UniProt 是另一種針對致病性 單氨基酸變異(SAV) 的精選資源。注釋為與疾病相關的 UniProt 單氨基酸變異(SAV) 的蛋白質(zhì)數(shù)量為 2,755。這些基因中的大多數(shù) (2,590) 與 ClinVar 疾病相關基因集重疊,而 UniProt 僅貢獻了 ClinVar 集中未發(fā)現(xiàn)的 165 個疾病相關基因。另一方面,超過一半的 UniProt 致病變異(29,300 個中的 15,697 個)未在 ClinVar 致病變異集中發(fā)現(xiàn)。統(tǒng)一的 ClinVar 和 UniProt 集中可能的致病變異總數(shù)約為 47,000。我們還通過將注釋為“良性”或“可能良性”的 ClinVar 變體與“多態(tài)性”類別中的 UniProt 變體相結(jié)合,獲得了一組良性變體(~45,000)。
疾病相關基因和變異的分布
A) 具有不同類型變異的 ClinVar 疾病相關基因的數(shù)量。非 SAV 類別結(jié)合了無意義突變、同義突變、非編碼和插入缺失的類別。 B) ClinVar 疾病相關基因中不同類型變異的數(shù)量。 C) 來自 UniProt 和 ClinVar 的具有致病性 SAV 的基因Venn圖。 D).來自 UniProt 和 ClinVar 的致病變異的維恩圖。
可能致病的單氨基酸變異(SAV) 的數(shù)量在疾病相關基因中分布不均。 單氨基酸變異(SAV) 數(shù)量賊多的三個基因編碼長蛋白:FBN1(Fibrillin-1,2,871 個氨基酸)、LDLR(低密度脂蛋白受體,860 個氨基酸)和 SCN1A(鈉通道蛋白 1 型亞基 α,2,009 個氨基酸酸),每一種都有超過 500 個致病性 SAV。部分原因可能是這些蛋白質(zhì)的長度。 75 個基因擁有超過 100 個致病性單氨基酸變異(SAV) 。超過一半的具有單氨基酸變異(SAV) 的疾病相關基因(3,575 個中的 2,003 個)具有少于 5 個致病性單氨基酸變異(SAV) ,其中 916 個只有一個致病性單氨基酸變異(SAV) 。 單氨基酸變異(SAV) 分布不均的原因之一可能是對常見疾病和某些基因(例如,與高膽固醇血癥有關的 LDLR 基因)的研究存在偏差。
(責任編輯:佳學基因)