基因分析业务挑战
-
生信分析周期长
传统的线下基因测序非常耗时,基因测序行业的快速发展和数据的爆炸式增长,使得生信分析面临周期更大的挑战,制约了行业的发展。
-
业务有淡旺季
测序业务一般为项目型,有明显淡季和旺季之分,旺季业务量可能是淡季的10倍以上,企业按均值配置的IT设施难以满足客户诉求。
-
固定资产成本高
基因测序对服务器的计算性能要求非常高,导致IT基础设施成本居高不下,同时 整体IT集群的建设、部署、 扩容复杂。
-
数据量大
基因测序的原始数据、中间数据和结果数据的传输、共享, 可靠存储,I/O读取性能, 都成为业务发展瓶颈, 急需解决。
产品优势
-
FPGA异构加速
业界领先的FPGA加速云服务平台,并针对基因场景推出基因高性能实例,定制硬件电路加速的基因算法,降低处理实验,基因测序效率提升3~5倍。
-
高精度
FPGA异构加速不改变生信分析软件算法,只是从硬件层面进行任务并行化异构调度优化,结果精确度和常规HPC保持一致,实现结果的高准确度。
-
GATK标准流程
支持从原始数据fastq到生成vcf/gvcf结果的BWA+GATK标准生信分析流程的FPGA加速,解决全过程的所有高密度计算的同时,提供标准的解决方案,方便客户的使用。
-
丰富可靠的云存储
提供丰富的大数据存储,EVS/SFS满足不同计算诉求的读写存储服务,OBS提供超高网络带宽的数据传输、交付服务,以及冷数据的下沉存储,降低冷数据的存储成本。
功能描述
-
支持BWA比对软件的FPGA异构加速,显著提升BWA计算效率,大大缩短数据比对时间。经测试30x人重测序数据(90GB)比对耗时从常规的20小时下降到2.5小时以内,且比对准确度完全一致。
支持BWA比对软件的FPGA异构加速,显著提升BWA计算效率,大大缩短数据比对时间。经测试30x人重测序数据(90GB)比对耗时从常规的20小时下降到2.5小时以内,且比对准确度完全一致。
-
支持GATK v3.8和GATK v4.0.6版本的 HaplotypeCaller 模式FPGA异构加速,提高germline突变检测运行效率,一致率高达99.5%;经测试30x人重测序数据(90GB)采用BWA+GATK(HaplotypeCaller)的FPGA加速计算germline突变检测,耗时可达6小时以内。
支持GATK v3.8和GATK v4.0.6版本的 HaplotypeCaller 模式FPGA异构加速,提高germline突变检测运行效率,一致率高达99.5%;经测试30x人重测序数据(90GB)采用BWA+GATK(HaplotypeCaller)的FPGA加速计算germline突变检测,耗时可达6小时以内。
-
支持GATK v3.8和GATK v4.0.6版本的 Mutect2 模式FPGA异构加速,提高Somatic突变检测运行效率,一致率高达99.5%。
支持GATK v3.8和GATK v4.0.6版本的 Mutect2 模式FPGA异构加速,提高Somatic突变检测运行效率,一致率高达99.5%。
-
支持GATK v3.8和GATK v4.0.6版本的 HaplotypeCaller --emitRefConfidence GVCF + GenotypeGVCFs 模式FPGA异构加速,提高群体样本基因型GVCF检测效率,一致率高达99.5%。
支持GATK v3.8和GATK v4.0.6版本的 HaplotypeCaller --emitRefConfidence GVCF + GenotypeGVCFs 模式FPGA异构加速,提高群体样本基因型GVCF检测效率,一致率高达99.5%。
应用场景
二代基因组测序加速
使用基于FPGA平台对GATK Best Practices进行加速,WGS(30X)分析从40+H降至6H,WES分析低于1H,同时精准性与GATK标准流程完全吻合。
客户案例
-
客户痛点
从事癌症疾病样本的WES和panel数据的基因变异检测。在本地使用GATK/Mutect2流程对样本数据进行体细胞变异检测需要3+天时间。流程耗时长,严重制约了业务拓展。
-
解决方案
采用华为云FPGA基因加速方案,加速流程在完全遵循原始GATK标准流程基础上,帮助客户实现从FASTQ到VCF germline or somatic)全步骤加速。
-
加速效果
客户本地一对39G的WES tumor/ normal样本用GATK最佳实践流程进行体细胞变异检测耗时为79.5小时,使用华为云FPGA加速流程仅需13小时,一致性在99%以上。
-
客户价值
样本变异检测平均提速6倍以上,大大缩短项目周期,提升了单位时间项目流量。提升产品竞争力的同时大大降低了成本,满足了业务拓展的需求。
使用指南
— 帮助文档 —