简介
gvcftools是用于创建和分析gVCF文件的小型实用程序包。每个实用程序的说明如下:
gatk_to_gvcf使用GATK Unified Genotyper修改版的“所有站点”输出创建gVCF。
trio枚举父子三重奏的继承冲突和其他统计信息。
twins枚举两个样本之间的基因型冲突和其他统计信息,通常是技术重复样本或单卵双胞胎。
break_blocks将不变gVCF块分解为指定基bed文件所有区域中的单独位置。
extract_variants从gVCF文件中删除所有非变量块,以生成较小的仅变量版本的VCF文件。
merge_variants将多个gVCF文件合并到一个合并的变体VCF输出中。请注意,这是合并功能的简单试用实现,并具有相当大的限制,例如,如果对任何单个样本的变体位置进行了过滤,则对合并的vcf记录进行过滤。
remove_region删除bed文件中提供的一组区域的所有vcf记录覆盖率。
set_haploid_region在指定bed文件的所有区域中将倍性更改为单倍体-为更改区域中的任何杂合变体添加过滤器。
get_drawn_regions从gVCF创建一个称为被调用区域的bed文件。
配置流程
1.配置编译环境
安装相关依赖。
yum install zlib-devel bzip2 bzip2-devel-y
2.获取源码
获取“gvcftools-0.17.0”源码包。
cd/usr/local/src
wget https://github.com/sequencing/gvcftools/archive/v0.17.0.tar.gz-O gvcftools-0.17.0.tar.gz
3.编译和安装
1)解压并进入源码目录。
tar-zxvf gvcftools-0.17.0.tar.gz
cd gvcftools-0.17.0
2)编译。
make-j4
3)安装。
mkdir-p/usr/local/gvcftools
cp-r bin/usr/local/gvcftools
4)配置环境。
a.修改环境变量。
vim/etc/profile
在“/etc/profile”文件末尾增加下面代码:
export PATH=/usr/local/gvcftools/bin:$PATH
b.按“Esc”,输入“wq!”保存后退出。
c.运行下面命令,使修改的环境变量生效。
source/etc/profile
4.运行和验证
查看gvcftools的使用程序。
cd/usr/local/gvcftools/bin
ls
当系统回显类似如下信息时,表示gvcftools安装成功。
[root ecs bin]#cd/usr/local/gvcftools/bin
[root ecs bin]#ls
break_blocks check_reference extract_variants gatk_to_gvcf getBamAvgChromDepth.pl get_called_regions merge_variants
remove_region set_haploid_region trio twins