医疗智能体 EIHEALTH-NGS流程简介:流程执行信息
流程执行信息
NGS流程由fastp、bwa-mem、picard-insertsize、qualimap-bamqc、gatk-markduplicates、gatk-bqsr、gatk-applybqsr、gatk-haplotypecaller、gatk-mergevcfs和discvrseq-variantqc应用构成。NGS流程执行步骤如表1所示。
步骤 |
描述 |
---|---|
Read Quality |
对测序得到的fastq数据进行质控。 |
Mapping and Sort and index |
将质控之后得到的Clean Reads比对到参考基因组上。 |
Insert Size Estimation |
针对构建Index后的bam文件,统计测序数据的Insert size的分布。 |
Bam QC |
评估比对得到的bam文件的质量。 |
GATK MarkDuplicates |
标记比对bam文件中的重复Reads。 |
gatk BaseRecalibrator |
基于比对bam文件评估矫正参数。 |
gatk ApplyBQSR |
基于比对bam文件进行矫正。 |
gatk HaplotypeCaller |
基于比对和矫正之后的bam文件进行Variant Calling的工作。 |
gatk MergeVcfs |
合并分bin变异检测的VCF文件。 |
Variant QC |
针对输出的VCF文件进行质控。 |