检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
基于二代测序的基因组突变检测 NGS流程简介 配置命令行工具 上传数据 制作并上传镜像 创建应用 搭建NGS流程 执行分析作业 批量执行NGS分析
单击“存储路径”右侧文件夹图标,设置用于存储Notebook数据的OBS路径。如果想直接使用已有的文件或数据,可将数据提前上传至对应的OBS路径下。 包含本项目桶最多挂载6个,不包含本项目桶最多挂载5个。 用户在Notebook列表的所有文件读写操作是基于所选择的OBS路径下的内容操作。 参数填写无误后,单击“立即创建”,创建Notebook。
如何将生物信息学软件封装为镜像并上传 本章节提供了在EIHealth平台创建FastQC应用的样例,帮助您快速熟悉平台的使用方法。 FastQC是一款高通量序列数据的质量检查工具,此样例基于开源的FastQC软件,将软件制作成镜像,上传至平台,并基于此镜像创建应用。应用创建完成后可以直接使用FastQC应用,或将其编排至流程,和其他应用一起使用。
gatk-bqsr:4.1.9.0 gatk ApplyBQSR 基于比对bam文件进行矫正。 gatk-applybqsr:4.1.9.0 gatk HaplotypeCaller 基于比对和矫正之后的bam文件进行Variant Calling的工作。 gatk-haplotypecaller:4
ux、Mac等)原因,无法实现统一的运维管理。同时,这些软件具有不同的版本和软件包,安装、使用过程复杂。 将生物信息学软件封装成Docker镜像,可以使程序在不同的环境中运行,并通过EIHealth平台的镜像管理,实现高效的调用,极大方便了软件的安装和运行。 Docker镜像是一
支持十亿节点、百亿边的超大规模图数据库查询,提供适用于基因和生物网络数据的图深度学习算法。 拥有基于基因组数据自动深度学习的技术框架AutoGenome,深度融合人工智能技术,产生更加便捷、快速、准确、可解释的医疗智能模型,加速医疗大健康行业的研究工作。 成熟的权限管理体系,保障数据安全的同时,确保团队高效协作。
优先级:运行优先级,分为0~9级,优先级高的作业会被优先执行(该特性规划中,暂未上线)。 计算节点标签:作业会调度到含有相应标签的计算节点上。 当应用也配置了标签,如果应用和作业的计算节点标签在同一计算节点上,则应用调度至该计算节点上;应用和它的作业,不管节点标签是否一致,都会被调度到应用的节点标签所对应的计算节点上。
将gatk-markduplicates的输出参数markduped-bam与gatk-bqsr、gatk-applybqsr的输入参数markduped-bam相连。将gatk-bqsr的输出参数recal-table与gatk-applybqsr的输入参数recal-table相连。
本示例中以Windows系统为例,介绍安装命令行工具的方法。 下载Windows版本的客户端,得到health.exe文件,health文件无需安装,放置在任一文件夹中即可。 图1 下载命令行工具 使用win键+R,输入cmd打开windows的cmd窗口。进入工具所在的目录,输入health命令,即可使用。
引用外部桶时,需要确保所引用的数据不超过45层级的目录。 单击“提交”。可在作业中心查看该作业的运行情况。 运行完成后,可在作业中心单击该作业查看输出结果,输出结果缩略图。 图2 查看运行结果(1) 单击查看路径,查看输出结果详情。 可以单击左上角“下载”,下载当前的输出结果。 下载操作将会产生流量费用,具体可参考计费说明。
NGS流程中需使用二代测序得到的原始fastq文件、参考基因组序列、参考Variants数据集。 本示例中以Windows系统命令行工具为例,介绍如何将本地数据上传到EIHealth平台。更多的命令介绍请参见命令行工具。 使用命令行工具,用switch命令进入待操作的项目。 例如,使用health
基因组数据生成的参考基因拷贝数分布为参考基线,能够自动的完成输入数据的比对排序,以及拷贝数分布计算,并输出可视化图表以供查看。 我的发布 在“资产市场>我的发布”中可以查看该用户所有发布资产的情况。对于发布成功的资产,可以在“组织共享”中查看和订阅。 对于发布成功的资产,可以进行
程所需的应用。 图2 填充应用内容 对于测序得到的大量数据,如果需要批量执行NGS分析,可以选取以下任意一种方式进行批量执行: 方式一:对于输入参数,打开“并发”开关,在启动作业时,每个参数可以设置多个参数值,自动生成多个作业并发执行。并发执行的作业数为设置的参数值个数的乘积。
批量执行NGS分析 对于测序得到的大量数据,批量并自动执行NGS分析是提高工作效率的有效方式。 从搭建、执行NGS流程中可以看出,图形化的操作界面提供了友好、便捷的操作体验,但是当面临大批量的测序数据时,需要重复设置输入、输出、执行等步骤。为进一步提高NGS流程的执行效率,本章节介绍如何
HaplotypeCaller 基于比对和矫正之后的bam文件进行Variant Calling的工作。 gatk MergeVcfs 合并分bin变异检测的VCF文件。 Variant QC 针对输出的VCF文件进行质控。 图1 NGS执行步骤 图2 搭建步骤 父主题: 基于二代测序的基因组突变检测
影像医生紧缺的局面及隔离防控压力,减轻医生诊断工作负荷。同时,基于华为云强大算力,该服务可实现单病例量化结果秒级输出,AI+医生复核的总体效率是纯人工量化评估速度的数十倍,可大幅提升诊断效率。 新冠病毒CT影像分析实现了如下优势: 病灶的智能识别与分割。 病灶体积的自动准确测量,并与解剖学位置对应。
创建FastQC应用样例 本章节提供了在EIHealth平台创建FastQC应用的样例,帮助您快速熟悉平台的使用方法。 FastQC是一款高通量序列数据的质量检测工具,此样例基于开源的FastQC软件,将软件制作成镜像,上传至平台,并基于此镜像创建应用。应用创建完成后可以直接使用FastQC应用,或将其编排至流程,和其他应用一起使用。
作业配置文件说明 流程创建完成后,可基于已创建的流程运行分析作业。 在EIHealth平台,运行分析作业的过程通过图形化的界面操作完成。在命令行工具中,该过程以配置文件的形式给出。您可以基于已获取到的模板使用命令行工具启动分析作业,运行的分析作业将同步显示到EIHealth平台。
盘古药物分子大模型 盘古药物分子大模型是基于华为与中科院上海药物所共同研发、专门面向药物研发领域推出的预训练大模型,旨在帮助医药公司开启AI辅助药物研发的新模式。盘古药物分子大模型学习了17亿个药物分子的化学结构,模型参数上亿,是目前最大的小分子药物模型。华为盘古药物分子大模型在
盘古药物分子大模型 盘古药物分子大模型是基于华为与中科院上海药物所共同研发、专门面向药物研发领域推出的预训练大模型,旨在帮助医药公司开启AI辅助药物研发的新模式。盘古药物分子大模型学习了17亿个药物分子的化学结构,模型参数上亿,是目前最大的小分子药物模型。华为盘古药物分子大模型在