【佳學(xué)基因基因檢測】人類遺傳病基因檢測所需要的序列、結(jié)構(gòu)與功能對致病基因的判斷與評估
遺傳病致病基因鑒定基因解碼基因檢測編制了一個由計算機(jī)程序預(yù)測或從 UniProt 特征字段中檢索的蛋白質(zhì)序列、結(jié)構(gòu)和功能特性數(shù)據(jù)集。對于任何一個功能特性改變來說,與所有人類蛋白質(zhì)中該特性的背景頻率相比,采用富集對數(shù)比分來確定具有致病性單氨基酸變異SAV的氨基酸位置是否有任何特性被富集或被剔除。遺傳病的致病基因鑒定基因解碼基因檢測觀察到致病性致病性單氨基酸變異SAV 中保守位置富集了 1.7 倍,可變位置減少了 3 倍以上。類似地,三個紊亂預(yù)測程序(DISOPRED3、SPOT-Disorder 和 IUPred2A)的結(jié)果一致表明,致病性單氨基酸變異SAV在有序區(qū)域富集,無序區(qū)域剔除。預(yù)測的 β 鏈和 α 螺旋在致病性致病性單氨基酸變異SAV中略微偏愛,而二級結(jié)構(gòu)預(yù)測的卷曲區(qū)域略微傾向于剔除。預(yù)測的二級結(jié)構(gòu)類型的富集/耗盡并不大(小于 1.33 倍)。先前基于已知結(jié)構(gòu)對二級結(jié)構(gòu)偏差的研究也表明,致病變異和良性變異的二級結(jié)構(gòu)分布之間幾乎沒有差異,盡管作者發(fā)現(xiàn)了螺旋/轉(zhuǎn)彎/橋的微弱富集和 β- 的微弱耗盡致病變異鏈。不同的發(fā)現(xiàn)可能是由于數(shù)據(jù)集(本研究中的全長蛋白質(zhì)與具有已知結(jié)構(gòu)的區(qū)域)和二級結(jié)構(gòu)估計方法(預(yù)測與實(shí)際)的差異。遺傳病的基因序列突變與結(jié)構(gòu)功能變化的關(guān)系研究還觀察到致病性單氨基酸變異SAV中低復(fù)雜性區(qū)域和卷曲螺旋區(qū)域的輕微耗盡。
A) 與所有氨基酸位置相比致病性 SAV 特性的富集/耗盡(y 軸顯示基于 log2 的對數(shù)比值分?jǐn)?shù))。符號:Consv1——保守分?jǐn)?shù)低的位置(0 到 0.3 之間),Consv2——保守分?jǐn)?shù)中等的位置(0.3 到 0.6 之間),Consv3——保守分?jǐn)?shù)高的位置(大于 0.6)。 H_psipred、E_psipred、C_psipred 是 PSIPRED 對 α-螺旋、β-鏈和螺旋的二級結(jié)構(gòu)預(yù)測。二級結(jié)構(gòu)預(yù)測程序 SPIDER(H_spd3、E_spd3、C_spd3)和 PREDSS(H_predss、E_predss、C_predss)使用相同的符號。 O_disopred 和 D_disopred 分別對應(yīng) DISOPRED 預(yù)測的有序和無序區(qū)域,無序預(yù)測程序 SPOT-DISORDER(O_spotd 和 D_spotd)和 IUPRED2A(O_iupred2a 和 D_iupred2a)使用相同的符號。符號 ncoil 和 seg 分別是預(yù)測的盤繞線圈區(qū)域和低復(fù)雜度區(qū)域。 P_MODRES、A_MODRES 和 M_MODRES 分別是在 UniProt 中被注釋為被磷酸化、乙酰化和甲基化修飾的位置。 SIGNAL、TRANSIT 和 TRANSMEM 是 UniProt 中注釋為信號肽、轉(zhuǎn)運(yùn)肽和跨膜片段的位置。 DISULFID、SITE、ACT_SITE、MOTIF、METAL、BINDING、CARBOHYD 和 LIPID 是 UniProt 特征字段中這些關(guān)鍵詞中注釋的位置。 B) 與所有氨基酸位置相比,具有不同 MAF 范圍(從淺藍(lán)色到深藍(lán)色:MAF < 0.0001、0.0001 ≤ MAF < 0.001、0.001 ≤ MAF < 0.01、0.01 ≤ MAF)的 gnomAD SAV 中氨基酸特性的富集/消耗.
對于具有亞細(xì)胞定位跡象的區(qū)域,信號肽和線粒體轉(zhuǎn)運(yùn)肽在致病性 SAV 中被耗盡,但跨膜片段豐富了 2 倍以上。源自 UniProt 特征的幾個特性在致病性 SAV 中表現(xiàn)出賊強(qiáng)的富集。它們與蛋白質(zhì)穩(wěn)定性(UniProt 特征 DISULFID:參與二硫鍵的半胱氨酸殘基)或功能(UniProt 特征:SITE、ACT_SITE、METAL、MOTIF 和 BINDING)有關(guān)。除 MOTIF 特征外,它們在致病性 SAVs 中表現(xiàn)出超過 4 倍的富集(基于 log2 的優(yōu)勢得分超過 2)。
遺傳病與罕見病基因解碼基因檢測還分析了 gnomAD(基因組聚合數(shù)據(jù)庫)數(shù)據(jù)庫中超過 12,000 個外顯子組(>24,000 個等位基因)中發(fā)現(xiàn)的 SAV,該數(shù)據(jù)庫提供了來自一般人群的自然變異的綜合分類。常見的單氨基酸變異SAV(MAF ≥ 0.01)應(yīng)該大部分是良性的,它們只占 gnomAD單氨基酸變異SAV的一小部分(4,885,239 中的 27,813,約 0.57%)。 gnomAD 數(shù)據(jù)庫擁有更多罕見的單氨基酸變異SAV,MAF 小于 0.01,其中很大一部分是單體(在所有外顯子組中只發(fā)現(xiàn)一次)。單氨基酸變異SAV根據(jù)它們的 MAF 將 gnomAD單氨基酸變異SAV分為四類(MAF < 0.0001、0.0001 ≤ MAF < 0.001、0.001 ≤ MAF < 0.01 和 MAF ≥ 0.01)。大多數(shù)單氨基酸變異SAV(4,885,239 中的 4,588,805,約 94%)屬于 MAF < 0.0001 的稀有單氨基酸變異SAV類別,而約 4.4%(27,813)和 1.1%(53,489)屬于 0.0001 ≤ MAF <0.001 和 0.001 類別分別≤ MAF < 0.01。人口瓶頸事件可能是常見單氨基酸變異SAV耗盡的部分原因,而賊近歷史上人口的爆炸性增長可能導(dǎo)致稀有單氨基酸變異SAV數(shù)量過多。
以與致病性單氨基酸變異SAV相同的方式分析每個 gnomAD單氨基酸變異SAV類別中蛋白質(zhì)序列、結(jié)構(gòu)和功能特性的富集。與致病性單氨基酸變異SAV相比,常見的 gnomAD單氨基酸變異SAV(MAF ≥ 0.01)通常表現(xiàn)出相反的富集/消耗趨勢。 DISULFID、SITE、ACT_SITE、METAL、MOTIF 和 BINDING 等屬性在常見的 gnomAD單氨基酸變異SAV中表現(xiàn)出賊顯著的消耗,在致病性單氨基酸變異SAV中表現(xiàn)出賊強(qiáng)的富集。相比之下,常見單氨基酸變異SAV中豐富的特性包括可變位置 (Consv1)、二級結(jié)構(gòu)預(yù)測的線圈區(qū)域、預(yù)測的無序區(qū)域、低復(fù)雜性區(qū)域、信號肽和線粒體轉(zhuǎn)運(yùn)肽。當(dāng)從常見的 gnomAD單氨基酸變異SAV類別移動到不太頻繁的 gnomAD單氨基酸變異SAV類別時,屬性的豐富或減少逐漸減少。這種行為表明,許多低頻單氨基酸變異SAV,尤其是一般人群中 MAF 小于 0.0001 的那些可能是有害的,因?yàn)楣δ苌现匾臍埢ㄓ?UniProt Features SITE、ACT_SITE、BINDING、METAL 和 MOTIF 指定的屬性)在這些罕見的單氨基酸變異SAV比普通的單氨基酸變異SAV更重要。
(責(zé)任編輯:佳學(xué)基因)