基因分析业务挑战

  • 生信分析周期长

    传统的线下基因测序非常耗时,基因测序行业的快速发展和数据的爆炸式增长,使得生信分析面临周期更大的挑战,制约了行业的发展。

  • 业务有淡旺季

    测序业务一般为项目型,有明显淡季和旺季之分,旺季业务量可能是淡季的10倍以上,企业按均值配置的IT设施难以满足客户诉求。

  • 固定资产成本高

    基因测序对服务器的计算性能要求非常高,导致IT基础设施成本居高不下,同时 整体IT集群的建设、部署、 扩容复杂。

  • 数据量大

    基因测序的原始数据、中间数据和结果数据的传输、共享, 可靠存储,I/O读取性能, 都成为业务发展瓶颈, 急需解决。

产品优势

  • FPGA异构加速

    业界领先的FPGA加速云服务平台,并针对基因场景推出基因高性能实例,定制硬件电路加速的基因算法,降低处理实验,基因测序效率提升3~5倍。

  • 高精度

    FPGA异构加速不改变生信分析软件算法,只是从硬件层面进行任务并行化异构调度优化,结果精确度和常规HPC保持一致,实现结果的高准确度。

  • GATK标准流程

    支持从原始数据fastq到生成vcf/gvcf结果的BWA+GATK标准生信分析流程的FPGA加速,解决全过程的所有高密度计算的同时,提供标准的解决方案,方便客户的使用。

  • 丰富可靠的云存储

    提供丰富的大数据存储,EVS/SFS满足不同计算诉求的读写存储服务,OBS提供超高网络带宽的数据传输、交付服务,以及冷数据的下沉存储,降低冷数据的存储成本。

功能描述

  • 测序数据与参考基因组比对

    支持BWA比对软件的FPGA异构加速,显著提升BWA计算效率,大大缩短数据比对时间。经测试30x人重测序数据(90GB)比对耗时从常规的20小时下降到2.5小时以内,且比对准确度完全一致。

    支持BWA比对软件的FPGA异构加速,显著提升BWA计算效率,大大缩短数据比对时间。经测试30x人重测序数据(90GB)比对耗时从常规的20小时下降到2.5小时以内,且比对准确度完全一致。

  • 单个样本Germline遗传变异检测

    支持GATK v3.8和GATK v4.0.6版本的 HaplotypeCaller 模式FPGA异构加速,提高germline突变检测运行效率,一致率高达99.5%;经测试30x人重测序数据(90GB)采用BWA+GATK(HaplotypeCaller)的FPGA加速计算germline突变检测,耗时可达6小时以内。

    支持GATK v3.8和GATK v4.0.6版本的 HaplotypeCaller 模式FPGA异构加速,提高germline突变检测运行效率,一致率高达99.5%;经测试30x人重测序数据(90GB)采用BWA+GATK(HaplotypeCaller)的FPGA加速计算germline突变检测,耗时可达6小时以内。

  • 肿瘤样本Case-control样本变异检测

    支持GATK v3.8和GATK v4.0.6版本的 Mutect2 模式FPGA异构加速,提高Somatic突变检测运行效率,一致率高达99.5%。

    支持GATK v3.8和GATK v4.0.6版本的 Mutect2 模式FPGA异构加速,提高Somatic突变检测运行效率,一致率高达99.5%。

  • 群体基因型GVCF检测

    支持GATK v3.8和GATK v4.0.6版本的 HaplotypeCaller --emitRefConfidence GVCF + GenotypeGVCFs 模式FPGA异构加速,提高群体样本基因型GVCF检测效率,一致率高达99.5%。

    支持GATK v3.8和GATK v4.0.6版本的 HaplotypeCaller --emitRefConfidence GVCF + GenotypeGVCFs 模式FPGA异构加速,提高群体样本基因型GVCF检测效率,一致率高达99.5%。

应用场景

二代基因组测序加速

使用基于FPGA平台对GATK Best Practices进行加速,WGS(30X)分析从40+H降至6H,WES分析低于1H,同时精准性与GATK标准流程完全吻合。

  • 应用场景

    基于WGS/WES/Panel靶向测序的germline变异检测


    基于WGS/WES/Panel靶向测序的Somatic变异检测


    基于WGS/WES/Panel靶向测序的群体基因型(Genotype)检测

  • 应用领域:

    动植物群体GWAS/种群进化基因测序研究


    癌症基因组学研究


    遗传疾病基因测序研究


    复杂疾病基因测序研究


    动植物基因组学研究


    人群队列基因测序研究

客户案例

  • 客户痛点

    从事癌症疾病样本的WES和panel数据的基因变异检测。在本地使用GATK/Mutect2流程对样本数据进行体细胞变异检测需要3+天时间。流程耗时长,严重制约了业务拓展。

  • 解决方案

    采用华为云FPGA基因加速方案,加速流程在完全遵循原始GATK标准流程基础上,帮助客户实现从FASTQ到VCF germline or somatic)全步骤加速。

  • 加速效果

    客户本地一对39G的WES tumor/ normal样本用GATK最佳实践流程进行体细胞变异检测耗时为79.5小时,使用华为云FPGA加速流程仅需13小时,一致性在99%以上。

  • 客户价值

    样本变异检测平均提速6倍以上,大大缩短项目周期,提升了单位时间项目流量。提升产品竞争力的同时大大降低了成本,满足了业务拓展的需求。