医疗智能体 EIHEALTH-NGS流程简介:流程执行信息

时间:2024-11-05 15:55:18

流程执行信息

NGS流程由fastp、bwa-mem、picard-insertsize、qualimap-bamqc、gatk-markduplicates、gatk-bqsr、gatk-applybqsr、gatk-haplotypecaller、gatk-mergevcfs和discvrseq-variantqc应用构成。NGS流程执行步骤如表1所示。

表1 NGS执行步骤

步骤

描述

Read Quality

对测序得到的fastq数据进行质控。

Mapping and Sort and index

将质控之后得到的Clean Reads比对到参考基因组上。

Insert Size Estimation

针对构建Index后的bam文件,统计测序数据的Insert size的分布。

Bam QC

评估比对得到的bam文件的质量。

GATK MarkDuplicates

标记比对bam文件中的重复Reads。

gatk BaseRecalibrator

基于比对bam文件评估矫正参数。

gatk ApplyBQSR

基于比对bam文件进行矫正。

gatk HaplotypeCaller

基于比对和矫正之后的bam文件进行Variant Calling的工作。

gatk MergeVcfs

合并分bin变异检测的VCF文件。

Variant QC

针对输出的VCF文件进行质控。

图1 NGS执行步骤
support.huaweicloud.com/bestpractice-eihealth/eihealth_32_0002.html