【佳學(xué)基因檢測(cè)】腫瘤數(shù)據(jù)庫(kù):正確的腫瘤基因檢測(cè)基礎(chǔ),實(shí)時(shí)更新
腫瘤數(shù)據(jù)庫(kù)導(dǎo)讀
在腫瘤基因檢測(cè)的設(shè)計(jì)過(guò)程中,有兩種基因檢測(cè)位點(diǎn)、基因片段的選擇策略。一是采用數(shù)據(jù)庫(kù)的方法。其特點(diǎn)是所檢測(cè)的位點(diǎn)是以曾經(jīng)研究發(fā)表過(guò)的文章的基礎(chǔ)上,另一種是基因解碼的策略?;蚪獯a的策略無(wú)疑是基因信息產(chǎn)業(yè)發(fā)展的理想要求,它對(duì)腫瘤檢測(cè)設(shè)計(jì)單位的學(xué)科設(shè)置、人材構(gòu)成都需要極高的要求,同時(shí)對(duì)臨床醫(yī)師的分子生物學(xué)水平的要求也具有挑戰(zhàn)性。但是腫瘤數(shù)據(jù)庫(kù)的構(gòu)建極大地推進(jìn)里了基因檢測(cè)的應(yīng)用,降低了基因檢測(cè)的成本,縮短了腫瘤靶向用藥和腫瘤反復(fù)監(jiān)測(cè)的時(shí)間。但是,我們需明白的是,腫瘤數(shù)據(jù)庫(kù)的更新需要基因解碼技術(shù)的不斷努力。基因解碼是腫瘤數(shù)據(jù)庫(kù)進(jìn)一步提高正確性、增加數(shù)據(jù)來(lái)源的基石。
腫瘤數(shù)據(jù)庫(kù)是腫瘤基因檢測(cè)、腫瘤靶向用藥大PANEL、腫瘤靶向用藥基因檢測(cè)包及腫瘤反復(fù)監(jiān)測(cè)的基礎(chǔ)工程。對(duì)腫瘤數(shù)據(jù)庫(kù)的應(yīng)用方式和方法,決定了腫瘤基因檢測(cè)的正確性。如果您對(duì)您的腫瘤基因檢測(cè)的正確性有懷疑,請(qǐng)致電4001601189,以獲得腫瘤基因解碼師的幫助。腫瘤基因解碼兼具腫瘤數(shù)據(jù)庫(kù)和基因解碼的知識(shí)。
本文關(guān)鍵詞:
tcga數(shù)據(jù)庫(kù)講解,賊全醫(yī)學(xué)數(shù)據(jù)庫(kù),tcga數(shù)據(jù)庫(kù),生存分析,常用的疾病數(shù)據(jù)庫(kù),geo數(shù)據(jù)庫(kù),承認(rèn)放心的疾病數(shù)據(jù)庫(kù),疾病數(shù)據(jù)庫(kù)哪家型號(hào)全,tcga數(shù)據(jù)庫(kù),預(yù)測(cè)生存曲線,生存分析數(shù)據(jù)庫(kù),tcga數(shù)據(jù)庫(kù)如何使用,醫(yī)學(xué)數(shù)據(jù)庫(kù)免費(fèi)
1. 綜合性腫瘤數(shù)據(jù)庫(kù)
TCGA
The Cancer Genome Atlas (TCGA)TCGA是由美國(guó)國(guó)立癌癥研究所(NCI)和國(guó)家人類基因組研究所資助,關(guān)注與癌癥的發(fā)生和發(fā)展相關(guān)的分子突變圖譜。該數(shù)據(jù)庫(kù)主要對(duì)樣本進(jìn)行外顯子組和基因組測(cè)序分析,所提供的數(shù)據(jù)包括:基因組拷貝數(shù)變化、表觀遺傳、基因表達(dá)譜、miRNA等。佳學(xué)基因全面采用了這一數(shù)據(jù)庫(kù)中的數(shù)據(jù)。
ICGC
InternationalCancer Genome Consortium (ICGC)ICGC的目標(biāo)是獲取包括膽道癌、膀胱癌、血癌等多達(dá)50種腫瘤及其亞型的基因組、轉(zhuǎn)錄組和表觀遺傳的全部信息。這些數(shù)據(jù)可促進(jìn)癌癥的機(jī)理和治療研究,佳學(xué)基因?qū)ζ鋽?shù)據(jù)進(jìn)行分析總結(jié)合,開(kāi)發(fā)發(fā)展了人體疾病表征數(shù)據(jù)庫(kù)。
COSMIC
Catalogue of Somatic Mutations inCancer (COSMIC)COSMIC是世界上賊大賊全面的有關(guān)腫瘤的體細(xì)胞突變以及其影響的資源庫(kù)。它主要提供多種腫瘤細(xì)胞基因組中的CNA、甲基化、基因融合、SNP及基因表達(dá)等信息,這些突變信息是從科學(xué)文獻(xiàn)中手工整理的。主頁(yè)面分為項(xiàng)目、數(shù)據(jù)管理、工具、幫助、搜索框等幾大塊,簡(jiǎn)潔清晰。佳學(xué)基因的基因解碼涵蓋了其全部信息,并整合了基因解碼技術(shù),用以基因進(jìn)行腫瘤MRD分析。
cBioPortal
cBioPortal for Cancer Genomics(cBioPortal)cBioPortal是一個(gè)癌癥基因組數(shù)據(jù)探索、可視化及分析平臺(tái),可用于多個(gè)癌癥基因組學(xué)數(shù)據(jù)集的交互式探索。該數(shù)據(jù)庫(kù)可提供CNA、基因突變信息。針對(duì)每個(gè)基因,它可給出多個(gè)信息,主要包括:基因的CNA信息、基因突變?cè)跇颖局械姆植?、突變位點(diǎn)和頻率、共表達(dá)基因以及生存曲線等。對(duì)于用戶提供的基因列表,還可生成互作網(wǎng)絡(luò)并提供已知的相互作用的藥物。在發(fā)現(xiàn)腫瘤相關(guān)突變、分析基因的生物學(xué)功能以及藥物選擇等方面的研究中具有重要推進(jìn)作用。
UCSC Cancer Genomics Browser
UCSC Cancer Genomics Browser UCSC Cancer Genomics Browser是一個(gè)可以對(duì)癌癥基因組學(xué)和臨床數(shù)據(jù)進(jìn)行整合、可視化、分析的網(wǎng)絡(luò)分析工具。它保存癌癥基因組及臨床數(shù)據(jù)并收集了樣本的多種信息,包括基因表達(dá)水平、CNA、通路信息等。在UCSC的癌癥基因組瀏覽器中,可實(shí)現(xiàn)不同樣本以及癌癥類型之間的比較,分析基因組變異與表型之間的相關(guān)性。
用戶可以通過(guò)它瀏覽基因組的任何一部分,并且同時(shí)可以得到與該部分有關(guān)的基因組注釋信息,如已知基因、預(yù)測(cè)基因、表達(dá)序列標(biāo)簽、mRNA、CpG島,克隆組裝間隙和重疊、染色體帶型、小鼠同源性等。
canEvolve
canEvolve 存儲(chǔ)的信息包括:基因、microRNA (miRNA)和蛋白質(zhì)表達(dá)譜、多種癌癥類型的拷貝數(shù)變化(CNAs)以及蛋白質(zhì)-蛋白質(zhì)相互作用信息。
CGAP
Cancer Genome Anatomy Project(CGAP) CGAP主要提供了cDNA克隆、文庫(kù)、基因表達(dá)、SNP以及基因組變異等信息。CGAP收集的數(shù)據(jù)包括正常組織、前癌組織以及癌細(xì)胞的基因表達(dá)水平。
CGHub
Cancer Genomics Hub (CGHub) CGHub是美國(guó)國(guó)家癌癥研究所(NCI)測(cè)序項(xiàng)目的在線存儲(chǔ)庫(kù),其數(shù)據(jù)來(lái)源包括癌癥基因組圖譜(TCGA)、癌癥細(xì)胞系百科全書(CCLE)和產(chǎn)生有效治療(目標(biāo))項(xiàng)目的治療應(yīng)用研究(TARGET)3個(gè)國(guó)家癌癥協(xié)會(huì)項(xiàng)目,數(shù)據(jù)來(lái)自25種不同類型的癌癥。
CGWB
Cancer Genome Work Bench (CGWB) CGWB提供了一系列工具來(lái)挖掘、整合以及可視化TCGA等數(shù)據(jù)庫(kù)中的基因組和臨床數(shù)據(jù),它是先進(jìn)個(gè)將臨床腫瘤突變譜與參考人類基因組整合在一起的計(jì)算平臺(tái)。用戶可快速地比較患者臨床信息與基因組的變異及甲基化等。
2.腫瘤基因組數(shù)據(jù)庫(kù)
腫瘤細(xì)胞的基因組中都存在著大量的變異,主要包括染色體結(jié)構(gòu)的變異、CNA、基因融合以及SNP等??截悢?shù)改變(CNAs)在很大程度上有助于癌癥發(fā)病機(jī)制和進(jìn)展。
ArrayMap
ArrayMap ArrayMap提供預(yù)處理過(guò)的腫瘤基因組芯片數(shù)據(jù)以及CNA圖譜。在ArrayMap數(shù)據(jù)庫(kù)中,用戶可搜索自己感興趣的樣本,并在此基礎(chǔ)上分析感興趣的基因或基因組片段上的CNA;用戶還可以比較兩個(gè)樣本之間的CNA的差異arrayMap數(shù)據(jù)庫(kù)為高分辨率致癌基因組CNA數(shù)據(jù)的meta分析和系統(tǒng)級(jí)數(shù)據(jù)集成提供了切入點(diǎn)。
BioMuta
BioMuta BioMuta數(shù)據(jù)庫(kù)存儲(chǔ)了癌癥細(xì)胞中基因的非同義單核苷酸變異,這些突變會(huì)影響基因的正常功能。BioMuta中的數(shù)據(jù)來(lái)源于COSMIC、ClinVar、UniProtKB以及一些文獻(xiàn)中。用戶可搜索感興趣的基因,獲得該基因在癌細(xì)胞中的突變位點(diǎn)及其分布頻率。
Cancer Hotspots
Cancer Hotspots數(shù)據(jù)庫(kù)由Memorial Sloan Kettering癌癥中心的Kravis分子腫瘤學(xué)中心維護(hù),提供大規(guī)模癌癥基因組學(xué)數(shù)據(jù)中發(fā)現(xiàn)的在統(tǒng)計(jì)學(xué)上有顯著反復(fù)突變的信息。
目前,Cancer Hotspots里面包含有24592個(gè)腫瘤樣品中鑒定的單殘基和框內(nèi)indel突變熱點(diǎn)。用戶還可按照gene、residue、type、variants等對(duì)其內(nèi)容進(jìn)行排列查看。
OncoKB
OncoKB是由Memorial Sloan Kettering癌癥中心(MSK)維護(hù)的全面的正確腫瘤學(xué)知識(shí)庫(kù),包含來(lái)自FDA,NCCN或ASCO,ClinicalTrials.gov和科學(xué)文獻(xiàn)的專業(yè)指導(dǎo)方針和建議,治療策略,腫瘤專家或腫瘤協(xié)會(huì)共識(shí),參考文獻(xiàn)等信息。
OncoKB目前包含有關(guān)554種癌癥基因特定改變的詳細(xì)信息,還有1級(jí)(FDA批準(zhǔn))、2級(jí)(標(biāo)準(zhǔn)護(hù)理)的治療信息,3級(jí)臨床證據(jù)和生物學(xué)證據(jù)。
CanGEM
Cancer GEnome Mine (CanGEM) CanGEM是一個(gè)公共的數(shù)據(jù)庫(kù),用于存儲(chǔ)定量微陣列數(shù)據(jù)和臨床腫瘤樣本數(shù)據(jù)。它主要利用ArrayCGH芯片來(lái)發(fā)掘基因的拷貝數(shù)變異。
CGP
Cancer Genome Project (CGP) CGP提供了腫瘤中的CNA及基因型信息,該數(shù)據(jù)庫(kù)的主要目標(biāo)是利用人類基因組序列和高通量的突變檢測(cè)技術(shù)識(shí)別體細(xì)胞突變,進(jìn)而發(fā)現(xiàn)人類腫瘤發(fā)生過(guò)程中重要的基因。該數(shù)據(jù)庫(kù)還提供了一些識(shí)別突變、CNA的軟件,如BioView、GRAFT等。
3. 腫瘤DNA甲基化數(shù)據(jù)庫(kù)
DNA甲基化修飾是表觀遺傳學(xué)的一種重要形式,它調(diào)節(jié)基因的轉(zhuǎn)錄水平,對(duì)維持細(xì)胞的正常功能起著重要作用。DNA甲基化模式的改變可能導(dǎo)致癌癥。
DiseaseMeth
DiseaseMeth DiseaseMeth是一個(gè)人類疾病甲基化數(shù)據(jù)庫(kù),其重點(diǎn)是對(duì)各種疾病的DNA甲基化數(shù)據(jù)集進(jìn)行有效的存儲(chǔ)和統(tǒng)計(jì)分析。它涉及的疾病包括癌癥、神經(jīng)發(fā)育和退行性疾病、自身免疫疾病等。在DiseaseMeth中可以比較疾病與疾病之間、基因與基因之間以及疾病與基因之間的甲基化關(guān)系。
MENT
MENT MENT數(shù)據(jù)庫(kù)收集和整合了來(lái)自GeneExpression Omnibus(GEO)和TCGA的DNA甲基化、基因表達(dá)水平數(shù)據(jù),同時(shí)將DNA甲基化和基因表達(dá)水平關(guān)聯(lián)起來(lái)。
MethHC
MethHC MethHC是一個(gè)集成數(shù)據(jù)庫(kù),包含大量DNA甲基化數(shù)據(jù)和mRNA/microRNA在人類癌癥中的表達(dá)譜。這些數(shù)據(jù)可以幫助研究人員確定表觀遺傳模式。
MethyCancer
MethyCancer 該數(shù)據(jù)庫(kù)擁有來(lái)自公共資源的高度整合的DNA甲基化數(shù)據(jù)、癌癥相關(guān)基因、突變和癌癥信息,以及我們大規(guī)模測(cè)序得到的CpGIsland (CGI)克隆。MethyCancer可用于研究DNA甲基化、基因表達(dá)與癌癥的相互作用。
MethDB
MethDB 是較早的DNA甲基化數(shù)據(jù)庫(kù),主要集中于環(huán)境因子對(duì)甲基化的影響;
NGSmethDB
NGSmethDB 基于高通量測(cè)序數(shù)據(jù),賊近更新中還包含了SNP信息,以便后續(xù)分析。
4. 腫瘤轉(zhuǎn)錄組數(shù)據(jù)庫(kù)
腫瘤細(xì)胞具有較強(qiáng)的生長(zhǎng)和繁殖能力,生命活動(dòng)旺盛,因此與正常細(xì)胞相比,基因的轉(zhuǎn)錄水平和模式也存在較大的差異。
Oncomine
Oncomine Oncomine是大型的腫瘤基因芯片數(shù)據(jù)庫(kù),致力于收集、標(biāo)準(zhǔn)化并分析腫瘤樣本的基因表達(dá)譜芯片數(shù)據(jù)。
它可提供基因在腫瘤樣本和正常樣本間、腫瘤樣本和腫瘤樣本間、正常樣本和正常樣本間的差異表達(dá)、基因表達(dá)譜、預(yù)測(cè)共表達(dá)基因等信息,并可根據(jù)腫瘤分期、分級(jí)、組織類型等臨床信息進(jìn)行分類。
GEO
Gene Expression Omnibus (GEO) GEO是由美國(guó)國(guó)家生物技術(shù)信息中心(NCBI)建立的,其賊初的目標(biāo)是作為一個(gè)公共存儲(chǔ)庫(kù),存儲(chǔ)主要由微陣列技術(shù)生成的高通量基因表達(dá)數(shù)據(jù)。此外,該數(shù)據(jù)庫(kù)還包括比較基因組分析、描述基因組蛋白相互作用的染色質(zhì)免疫沉淀分析、非編碼RNA分析、SNP基因分型和基因組甲基化狀態(tài)分析。
ArrayExpress
ArrayExpress ArrayExpress是歐洲生物信息協(xié)會(huì)(EMBL-EBI)下屬的功能基因組數(shù)據(jù)庫(kù),收集整理基于芯片和測(cè)序的基因組學(xué)實(shí)驗(yàn)的數(shù)據(jù),以支持可重復(fù)的研究。ArrayExpress是基于微陣列和高通量測(cè)序的功能基因組實(shí)驗(yàn)的主要知識(shí)庫(kù)之一,所有數(shù)據(jù)都以MAGE-TAB格式提供。
在幫助頁(yè)面有詳細(xì)的在線教程,供用戶學(xué)習(xí)如何搜索、提交數(shù)據(jù)。
ChiTaRS
ChiTaRS ChiTaRS數(shù)據(jù)庫(kù)包含嵌合轉(zhuǎn)錄本和RNA-Seq數(shù)據(jù)。ChiTaRS嵌合轉(zhuǎn)錄本和RNA-Seq數(shù)據(jù)數(shù)據(jù)庫(kù)是由GenBank、ChimerDB、dbCRID、TICdb和其他用于人類、小鼠和蒼蠅的數(shù)據(jù)庫(kù)的表達(dá)序列標(biāo)記(ESTs)和mRNA識(shí)別的嵌合轉(zhuǎn)錄本集合。
miRCancer
miRCancer miRCancer基于從文獻(xiàn)中提取的結(jié)果,提供了較為全面的miRNA集合以及它們?cè)诙喾N腫瘤中的表達(dá)情況。所有miRNA的癌變關(guān)聯(lián)都是在自動(dòng)提取后手動(dòng)確認(rèn)的。
OncomiRDB
OncomiRDB OncomiRDB主要收集和注釋通過(guò)實(shí)驗(yàn)驗(yàn)證的對(duì)癌癥具有促進(jìn)或抑制作用的miRNA信息。該數(shù)據(jù)庫(kù)的所有數(shù)據(jù)是通過(guò)人工收集和整理。
SomamiR
SomamiR SomamiR數(shù)據(jù)庫(kù)集成了多種類型的數(shù)據(jù),用于研究體細(xì)胞和種系突變對(duì)癌癥中miRNA功能的影響。該數(shù)據(jù)庫(kù)主要收集miRNA及其靶序列上的突變。另外,數(shù)據(jù)庫(kù)還提供了存在miRNA靶序列體細(xì)胞突變與腫瘤相關(guān)的基因及其參與的通路。
5. 腫瘤蛋白組數(shù)據(jù)庫(kù)
蛋白是生命活動(dòng)的主要承擔(dān)者,蛋白結(jié)構(gòu)變異、蛋白修飾的改變以及蛋白含量的變化等導(dǎo)致細(xì)胞的生長(zhǎng)和代謝變化是腫瘤發(fā)生的重要因素。
CPTAC
ClinicalProteomic Tumor Analysis Consortium (CPTAC) CPTAC整合了基因組和蛋白組的數(shù)據(jù),旨在識(shí)別和描述腫瘤組織和正常組織中的全部蛋白,發(fā)掘可作為腫瘤生物標(biāo)記的候選蛋白。
Cancer3D
Cancer3D Cancer3D數(shù)據(jù)庫(kù)整合了來(lái)自TCGA和CCLE的體細(xì)胞錯(cuò)義突變信息,在蛋白結(jié)構(gòu)水平上分析其對(duì)蛋白功能的影響。該數(shù)據(jù)庫(kù)通過(guò)e-Driver和e-Drug兩種算法,幫助用戶分析突變的分布模式及其與藥物活性變化的關(guān)系。
CancerPPD
CancerPPD CancerPPD是一個(gè)抗癌肽(ACPs)和抗癌蛋白的儲(chǔ)存庫(kù),在設(shè)計(jì)基于肽的抗癌療法中非常有用。在CancerPPD中,針對(duì)每個(gè)條目,都有其詳細(xì)的注釋信息,如肽的來(lái)源、肽的性質(zhì)、抗癌活性、N-和C-末端修飾、構(gòu)象等。除了天然肽,CancerPPD還含有非天然的、經(jīng)過(guò)化學(xué)修飾的殘基肽和D-氨基酸。CancerPPD還整合了一些基于web的工具,包括關(guān)鍵字搜索、數(shù)據(jù)瀏覽、序列和結(jié)構(gòu)相似性搜索。
CanProVar
Cancer Proteome Variation Database(CanProVar) CanProVar數(shù)據(jù)庫(kù)整合了來(lái)自各種公共資源的蛋白質(zhì)序列變異信息,重點(diǎn)是癌癥相關(guān)的變異,CanProVar中的數(shù)據(jù)主要來(lái)源于TCGA、COSMIC、OMIM、HPI等數(shù)據(jù)庫(kù)以及一些文獻(xiàn)研究。在該數(shù)據(jù)庫(kù)中,用戶可在網(wǎng)站中搜索特定蛋白或者某種腫瘤,獲取蛋白的突變情況,在結(jié)果頁(yè)面會(huì)給出蛋白的基本信息、GO注釋以及相關(guān)的研究文獻(xiàn)。
dbDEPC
DbDEPC DbDEPC是一個(gè)專門收集腫瘤樣本中出現(xiàn)的差異表達(dá)蛋白的數(shù)據(jù)庫(kù)。在該數(shù)據(jù)庫(kù)中,你可以了解你所感興趣的蛋白質(zhì)是否在某些癌癥中發(fā)生了變化。
6.腫瘤相關(guān)基因數(shù)據(jù)庫(kù)
DriverDB
DriverDB DriverDB收集了來(lái)自TCGA、ICGC、TARGET等數(shù)據(jù)庫(kù)的大量exome-seq數(shù)據(jù),并根據(jù)不同方面提供突變信息的可視化。這些可視化結(jié)果將有助于用戶快速了解驅(qū)動(dòng)基因之間的關(guān)系。
NCG
Network of Cancer Genes (NCG) 癌癥基因網(wǎng)絡(luò)(NCG)致力于收集關(guān)于人工篩選的已知和候選癌癥基因的信息。針對(duì)每個(gè)基因,用戶可獲得與該基因相關(guān)的功能和疾病注釋信息、突變信息、表達(dá)譜、miRNA及蛋白互作關(guān)系等,還可以可視化miRNA調(diào)控關(guān)系和蛋白互作網(wǎng)絡(luò)。
TP53MUL TLoad
TP53MULTLoad TP53MULTLoad是一個(gè)人工收集的有關(guān)TP53突變和突變體資源中心,包含了UMDTP53數(shù)據(jù)庫(kù)以及與TP53有關(guān)的信息。它既可以作為一個(gè)容易操作的平面文件,也可以作為一個(gè)新的多平臺(tái)分析軟件,用于分析TP53突變的各個(gè)方面。
7. 腫瘤與藥物數(shù)據(jù)庫(kù)
耐藥性是腫瘤治療的一大障礙,藥物靶點(diǎn)突變是產(chǎn)生獲得性耐藥的主要原因之一。對(duì)這些藥物靶點(diǎn)突變的充分了解將有助于設(shè)計(jì)有效的個(gè)性化治療。
CancerDR
CancerDR CancerDR是一種針對(duì)癌癥治療的個(gè)性化藥物的嘗試。CancerDR收集了148種抗癌藥物以及它們?cè)?52種細(xì)胞系中的藥理狀況。
CancerResource
CancerResource CancerResource通過(guò)文獻(xiàn)挖掘以及整合多種數(shù)據(jù)源的方式收集并發(fā)現(xiàn)了大量化合物及其靶點(diǎn)的信息。通過(guò)CancerResource數(shù)據(jù)庫(kù),你可以得到包含化合物與靶標(biāo)的詳細(xì)信息、表達(dá)圖譜及相關(guān)數(shù)據(jù)來(lái)源鏈接等。
canSAR
canSAR canSAR整合ArrayExpress、UniProt、COSMIC等11種數(shù)據(jù)源的數(shù)據(jù)。它是一個(gè)支持癌癥轉(zhuǎn)化研究和藥物發(fā)現(xiàn)的公共癌癥綜合知識(shí)庫(kù)。該數(shù)據(jù)庫(kù)包含了包括生物學(xué)、藥理學(xué)、化學(xué)、結(jié)構(gòu)生物學(xué)和蛋白質(zhì)相互作用網(wǎng)絡(luò)等多種類型的數(shù)據(jù)。
GDSC
Genomics of Drug Sensitivity inCancer (GDSC) GDSC是關(guān)于癌癥細(xì)胞藥物敏感性和藥物反應(yīng)分子標(biāo)記的數(shù)據(jù)庫(kù),GDSC提供了一個(gè)獨(dú)特的資源,結(jié)合了大的藥物敏感性和基因組數(shù)據(jù)集,以促進(jìn)發(fā)現(xiàn)新的治療生物標(biāo)志物的癌癥治療。該數(shù)據(jù)庫(kù)中的癌基因組突變信息包括癌基因點(diǎn)突變、基因擴(kuò)增與丟失、組織類型以及表達(dá)譜等
Platinum
Platinum Platinum是一個(gè)廣泛收集耐藥性信息的數(shù)據(jù)庫(kù),是為了研究和理解錯(cuò)義突變對(duì)配體與蛋白質(zhì)組相互作用的影響而開(kāi)發(fā)的。該數(shù)據(jù)庫(kù)包含超過(guò)1000種蛋白配體復(fù)合物的三維結(jié)構(gòu)突變,以及這些突變對(duì)其親和力的影響。Platinum數(shù)據(jù)庫(kù)將蛋白質(zhì)結(jié)構(gòu)突變與配體的親和力關(guān)聯(lián)起來(lái),有助于研究由突變引起的疾病耐藥性。
8. 其他相關(guān)數(shù)據(jù)庫(kù)
1000 Genomes
1000 Genomes Project(縮寫為1KGP)在2008年到2015年間進(jìn)行,1000Genome Project 的目標(biāo)是在群體中找到頻率至少為1%的遺傳變異,為人類遺傳變異的研究提供了一個(gè)綜合的資源。賊終數(shù)據(jù)集包含來(lái)自26個(gè)群體的2504個(gè)個(gè)體的數(shù)據(jù)。所有樣本都有外顯子測(cè)序數(shù)據(jù)。比其他同類數(shù)據(jù)庫(kù)優(yōu)越的是,1000 Genomes Project里有24個(gè)個(gè)體進(jìn)行了全基因組測(cè)序?,F(xiàn)在1000 Genomes Project的數(shù)據(jù)可以通過(guò)IGSR(The International Genome Sample Resource)的數(shù)據(jù)門戶網(wǎng)站訪問(wèn),現(xiàn)已更新匹配GRCh38參考基因組的數(shù)據(jù)。在首頁(yè)可以進(jìn)行檢索和分析,進(jìn)入FTP站點(diǎn)可以進(jìn)行數(shù)據(jù)下載。
ESP
ESP全稱是NHLBIExome Sequencing Project(國(guó)家心肺血液研究所外顯子組測(cè)序項(xiàng)目), 是由多個(gè)大學(xué)和研究結(jié)構(gòu)合作開(kāi)展的一個(gè)大型的外顯子測(cè)序項(xiàng)目,主要目的是通過(guò)對(duì)不同人群進(jìn)行SNP分型,來(lái)輔助心臟,肺,血液相關(guān)疾病的研究。
ExAC
ExAC全名ExomeAggregation Consortium(外顯子組整合數(shù)據(jù)庫(kù)),由哈佛-麻省理工Broad研究所的科學(xué)家完成,整合了17個(gè)人類基因組項(xiàng)目,60706個(gè)個(gè)體的外顯子測(cè)序數(shù)據(jù)。整合數(shù)據(jù)的過(guò)程中去除了嚴(yán)重兒科疾病的個(gè)體和TCGA中的腫瘤樣本,因此適合作為研究嚴(yán)重疾病的等位基因頻率的參考組。
ClinVar
ClinVar(Clinical Significance for Variants Relative to Phenotypes, NCBI)是NCBI主辦的與疾病相關(guān)的人類基因組變異數(shù)據(jù)庫(kù)。它的強(qiáng)大在于整合了dbSNP、dbVar、Pubmed、OMIM等多個(gè)數(shù)據(jù)庫(kù)在遺傳變異和臨床表型方面的數(shù)據(jù)信息,形成一個(gè)標(biāo)準(zhǔn)的、可信的遺傳變異-臨床相關(guān)的數(shù)據(jù)庫(kù)
HGMD
HGMD The Human Gene Mutation Database存儲(chǔ)了人類疾病相關(guān)的突變信息,由于其全面性,在突變研究領(lǐng)域,有廣泛應(yīng)用。有免費(fèi)和收費(fèi)版本。
OMIM
omim全稱為“Online Mendelian Inheritance in Man”,它通過(guò)對(duì)新的病癥分類并命名、收錄表型和相關(guān)病因基因的關(guān)系來(lái)收錄人類孟德?tīng)柤膊⌒畔ⅰ?br /> omim主要關(guān)注在疾病與基因?qū)用嫔?,而clinvar核心是和臨床相關(guān)的基因突變。
CIViC
CIViC即Clinical Interpretations of Variants in Cancer,主要是解讀用,里面有癌癥相關(guān)的變異位點(diǎn)variant,基因gene還有臨床信息(ClinicalEvidence)、用藥信息等。
9. 腫瘤數(shù)據(jù)庫(kù)的總結(jié)
佳學(xué)基因不斷綜述發(fā)表統(tǒng)計(jì)的腫瘤生物信息數(shù)據(jù)庫(kù):
分類不斷變得嚴(yán)謹(jǐn),但是不同類型的數(shù)據(jù)庫(kù)會(huì)有交叉。此外,還有一些特有癌癥的數(shù)據(jù)庫(kù),如乳腺癌, BCI (Breast Cancer Information Core, NIH); BRCA Share (UMD-BRCA1/2 Mutations Database, BRCA GGC Consortium) 等等。
分類只是為了更清晰,有一個(gè)整體印象,不必每一個(gè)都熟悉。實(shí)際上工作中賊常用到的數(shù)據(jù)庫(kù)就以下幾個(gè),有需求再去查:
- TCGA
- Oncomine
- ICGC
- cBioPortal
- COSMIC
- GEO
- 1KGP
- 佳學(xué)基因腫瘤基因檢測(cè),包括腫瘤遺傳性分析、腫瘤轉(zhuǎn)移能力評(píng)估、腫瘤靶向用藥基因檢測(cè)、腫瘤化療用藥基因檢測(cè)、腫瘤免疫用藥基因檢測(cè)及腫瘤的反復(fù)監(jiān)測(cè)分析等。很多基因檢測(cè)中是從眾多數(shù)據(jù)庫(kù)中選擇少量或者是部分基因位點(diǎn)。而腫瘤的基因解碼首先就需要對(duì)導(dǎo)致發(fā)現(xiàn)的全部位點(diǎn)進(jìn)行高通量測(cè)序和分析。因此,知道腫瘤的數(shù)據(jù)庫(kù)是一個(gè)方面,怎么選擇、怎么應(yīng)用及怎么去分析數(shù)據(jù)是確定腫瘤基因檢測(cè)正確性的另一個(gè)重要的方面。