【佳學基因檢測】基因解碼基礎:如何從VCF格式文件中獲取基因測序數(shù)據(jù)?
遺傳病、罕見病基因檢測導讀:
VCF格式是一種基因測序領域常用的基因序列存儲格式。了解VCF格式是基因信息注釋工作與基因測序工作進行對接的第一步。本文介結(jié)從采用VCF格式存儲的基因數(shù)據(jù)中獲取受檢者基因信息的一個工具,以及使用這一個工具的方法。
為什么要開發(fā)vcfR工具包?vcfR有什么用途?
VCF文件格式成為記錄一個人基因信息的通用格式文件,正如JPG是照片和圖形的通用格式文件一樣。由于測序成本的大幅度降低,數(shù)據(jù)庫比對成為現(xiàn)行基因檢測的通行技術,而基因解碼進一步對數(shù)據(jù)庫比對方法進行升級換對,讀取和理解基因信息成為基因信息閱讀、傳遞和交流的一個重要需要。因此,我們需要掌握對VCF格式文件進行處理的軟件。vcfR軟件不僅可提取基因型,還可以提取與基因型測定的質(zhì)量的數(shù)據(jù)。vcfR是一個在R語言下開發(fā)的工具,因為R提供了一個交互體驗和一個通常用于基因信息分析的環(huán)境。通過vcfR可以讀取VCF文件,存儲到R語言支持的各種文件格式。并采用R語言進行匯總、繪圖、統(tǒng)計。VcfR還提供了通過修改各種參數(shù),用可視化的方式再現(xiàn)這些參數(shù)對分析結(jié)果的影響的功能。另外vcfR還可以使用基因序列文件(FASTA)和基因注釋文件(GFF),使得基因組的特定區(qū)域如染色體可以以圖形的方式展現(xiàn)。vcfR還可以通過轉(zhuǎn)換函數(shù)將vcfR的數(shù)據(jù)結(jié)構(gòu)轉(zhuǎn)換成為R環(huán)境下其他基因信息分析工具可以使用的文件格式。更為復雜的運算可以通過C++語言來實現(xiàn)。
VCF文件的存儲格式:
vcf文件分為三個部分
- ‘#’號開頭行——meta
- 非#號開頭行分為fix和gt兩個部分
fix部分存儲vcf文件中非#號開頭行的前7列,分別是
- 染色體編號
- 堿基位置
- ID
- 參考堿基
- 變異堿基
- 質(zhì)量值
- 是否過濾
gt 部分存儲兩部分內(nèi)容
- format
- 樣本基因型
vcfR的主要功能
2、解析功能可有效提取基因型矩陣或其相關信息。
3、繪圖功能提供了一種直觀地評估變體特征的快速方法。
4、提供了對R環(huán)境提供的大量統(tǒng)計和圖形工具的便捷訪問。
5、通過有效的解析和可視化,可以快速開發(fā)針對質(zhì)量指標的硬過濾器,可以輕松地針對單個項目和實驗設計進行量身定制。
6、vcfR的關鍵組件以C ++實現(xiàn),并從R中調(diào)用以賊大程度地減少計算時間。
vcf主要功能介紹:
通過參數(shù)設置,通過讀取表格數(shù)據(jù)的函數(shù)utils :: read.table()和data.table :: fread()以跳過非表格元區(qū)域,從而為這些函數(shù)提供了一點優(yōu)勢。
通過data.table :: fread('zcat filename.gz')調(diào)用data.table :: fread()函數(shù),是因為它當前不能讀取壓縮的數(shù)據(jù)。
2、讀取基因型函數(shù):
extract.gt()
chromoqc()可用于可視化chromR對象。
- 【佳學基因檢測】什么是MLPA基因檢測?有什么優(yōu)點?...
- 【佳學基因檢測】如何將全基因組測序(WGS)基因檢測數(shù)據(jù)定位到人的標準基因組上?...
- 【佳學基因檢測】FISH基因檢測中的探針類型選擇...
- 【佳學基因檢測】腫瘤基因檢測生物信息分析注意事項...
- 【佳學基因檢測】癌癥基因組檢測要點:一定要知道!...
- 【佳學基因檢測】什么是基因組檢測?...
- 【佳學基因檢測】TP53突變基因檢測...
- 【佳學基因檢測】基因解碼對Y染色體的進一步解密...
- 【佳學基因檢測】腫瘤基因檢測需要包括重復或反復區(qū)域的分析嗎?...
- 【佳學基因檢測】如何采用液體活檢檢進行細胞學檢測與NGS測序...
- 【佳學基因檢測】臨床科研服務:GWAS課題中的統(tǒng)計分析...
- 【佳學基因檢測】腫瘤靶向藥物Regorafenib (Stivarga) 及其在結(jié)直腸癌治療中的作用...
- 【佳學基因檢測】ALDOA的群體遺傳學結(jié)果對基因檢測正確性的影響...
- 【佳學基因檢測】SLC25A4的雙生子遺傳學分析結(jié)果簡介...
- 【佳學基因檢測】ASIC1的分子遺傳學分析成果...
- 【佳學基因檢測】ANXA6分子病理學成果概要...
- 【佳學基因檢測】檢驗科醫(yī)師晉升考試關于ADRA2C的知識...
- 【佳學基因檢測】醫(yī)學院碩士研究考試關于ACVR2A基因檢測的知識要點...
- 【佳學基因檢測】醫(yī)學博士ANK1基因檢測的知識結(jié)構(gòu)準備...
- 【佳學基因檢測】醫(yī)學院專升本關于ADCYAP1R1基因檢測的基本技能...
- 【佳學基因檢測】病例分析會中需要知道的關于ACLY基因的知識...
- 【佳學基因檢測】病案討論中需要知道的關于AIF1的知識...
- 【佳學基因檢測】質(zhì)譜基因檢測AGTR2基因存在基因突變該怎么理解?...
- 【佳學基因檢測】飛行質(zhì)譜基因檢測發(fā)現(xiàn)ADRA2A有突變,嚴重嗎?...
- 【佳學基因檢測】核型分析發(fā)現(xiàn)NAT1突變了,是什么意思?...
- 【佳學基因檢測】遺傳學檢測結(jié)果指出ALOX15突變,該找誰咨詢?...
- 【佳學基因檢測】高精度基因檢測為什么包含ADD1基因?...
- 【佳學基因檢測】基因檢測包中為什么一定要有ACTA2基因?...
- 【佳學基因檢測】基因檢測時查看是否包含ADH1C重要嗎?...
- 【佳學基因檢測】NR0B1基因間序列存在突變是否需要阻斷遺傳?...
- 來了,就說兩句!
-
- 賊新評論 進入詳細評論頁>>