检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如何将生物信息学软件封装为镜像并上传 本章节提供了在EIHealth平台创建FastQC应用的样例,帮助您快速熟悉平台的使用方法。 FastQC是一款高通量序列数据的质量检查工具,此样例基于开源的FastQC软件,将软件制作成镜像,上传至平台,并基于此镜像创建应用。应用创建完成后
镜像管理简介 运行生物信息学软件,往往由于不同的操作系统(Windows、Linux、Mac等)原因,无法实现统一的运维管理。同时,这些软件具有不同的版本和软件包,安装、使用过程复杂。将生物信息学软件封装成Docker镜像,可以使程序在不同的环境中运行,并通过EIHealth平台
本示例中制作FastQC镜像,并基于镜像创建应用,运行分析作业。 镜像简介 由于生物信息学软件,往往由于不同的操作系统(Windows、Linux、Mac等)原因,无法实现统一的运维管理。同时,这些软件具有不同的版本和软件包,安装、使用过程复杂。 将生物信息学软件封装成Docker镜像,可以使程序在不同的环境中运行,
关键概念 镜像 运行生物信息学软件,往往由于不同的操作系统(Windows、Linux、Mac等)原因,无法实现统一的运维管理。同时,这些软件具有不同的版本和软件包,安装、使用过程复杂。将生物信息学软件封装成Docker镜像,可以使程序在不同的环境中运行,并通过EIHealth平
目、数据等资产。这些信息的处理将遵循您已接收的《华为云用户协议》及《隐私政策声明》约束。 下载地址中带有sha256后缀的链接,指的是对应软件包的校验文件。例如:Windows x64版本的下载链接是health-windows-x86_64 ,它的校验文件下载链接则是health-windows-x86_64
--exclude -x 否 不包含源对象的匹配模式,如:*.txt。 支持“*”匹配多个任意字符和“?”匹配单个任意字符,例如abc*.txt代表匹配以abc开头以.txt结尾的任意文件。 您可以使用“\*”代表匹配“*”字符本身,使用“\?”代表匹配“?”字符本身。如果待下
目、数据等资产。这些信息的处理将遵循您已接收的《华为云用户协议》及《隐私政策声明》约束。 下载地址中带有sha256后缀的链接,指的是对应软件包的校验文件。例如:Windows x64版本的下载链接是health-windows-x86_64 ,它的校验文件下载链接则是health-windows-x86_64
工具管理简介 EIHealth中的每一个分析作业都依托于应用运行。应用可以组合形成分析流程。 应用是生物信息学软件的镜像封装。您可以将软件制作成镜像,并将镜像上传至EIHealth平台,通过应用引入镜像。制作好的应用可以单独使用,也可以将多个应用编排入流程串联使用。在“项目管理”
若新购买的账号则列表为空。 图1 计算资源 单击“购买计算资源”按钮购买计算资源。可以根据业务需要选择不同的资源类型,其中可用区可以选择任意可用区即可。并支持包年包月购买,或者按需购买。 图2 购买计算资源 父主题: 购买计算资源(主账号操作)
快照方式制作镜像(偶尔制作的镜像):在基础镜像上,比如Ubuntu,先登录镜像系统并安装Docker软件,然后整体制作快照,即可得到所需软件的Docker镜像。 Dockerfile方式制作镜像(经常更新的镜像):将软件安装的流程写成DockerFile,使用Docker build构建成Docker镜像。
EIHealth平台集成了基于开源的Jupyter Notebook,可为您提供在线的开发和调试工具,用于编写和调测模型训练代码。Notebook使您无需关心分析软件包的安装、升级和维护等工作,只需聚焦于科研工作,从而加快科研进展。 关于Jupyter Notebook的详细操作指导,请参见Jupyter
Hub获取bwa软件(用于将基因序列比对到参考基因组上)。 以下类型镜像,建议您通过Docker Hub获取,不建议自己制作。 基础操作系统类镜像,如Ubuntu、Suse、Centos等。 基础编程语言类镜像,如Java、Python、R语言等。 基础通用类软件镜像,如Tomcat、Mysql、Ngnix等。
功能点4:特定步骤中断(人为or非人为),前序步骤状态继承,重新执行中断步骤 功能点5:手动中断当前状态,进行修改或加载其他步骤状态 中断修改计划 中断修改代码 人为中断、加载任意步骤状态,可以应对多种意外情况,比如: 第n步报错了,但实际上根因错误在第m步。 特定步骤任务卡死/崩溃/意外原因阻塞,可以手动中断当前步骤,并继承状态重试。
创建应用时,需要设置应用的输入、输出参数和镜像的启动命令。需要您熟悉所制作的生物信息学软件的使用并具备一定的开发经验。 例如,设置FastQC应用的参数和镜像启动命令时,首先通过阅读FastQC介绍和FastQC命令说明了解软件的使用。并依照FastQC的调用命令设置参数和镜像启动命令。 图1 FastQC命令
并运行作业。以二代基因组分析流程:fastp,bwa-mem,bamqc,picard-insertsize两个算法为例。 应用是对每个软件的镜像封装,将应用封装好后可以反复利用并也可以让其他人很容易的使用,不用担心复杂的开发环境问题。 流程是由1各或者N个应用串联构建而成,平
应用配置文件说明 EIHealth中的每一个分析作业都依托于应用运行。应用是生物信息学软件和运行该软件所依赖的运行环境的镜像封装。 在EIHealth平台,创建应用的过程通过图形化的界面操作完成。在命令行工具中,该过程以配置文件的形式给出。您可以基于获取到的模板使用命令行工具创建
FastQC是一款高通量序列数据的质量检测工具,此样例基于开源的FastQC软件,将软件制作成镜像,上传至平台,并基于此镜像创建应用。应用创建完成后可以直接使用FastQC应用,或将其编排至流程,和其他应用一起使用。 创建FastQC应用时,需要您熟悉该软件的使用,并具备一定的开发经验。FastQC的详细介
依据“应用参数说明表”依次创建搭建NGS流程所需的应用。 图2 填充应用内容 对于测序得到的大量数据,如果需要批量执行NGS分析,可以选取以下任意一种方式进行批量执行: 方式一:对于输入参数,打开“并发”开关,在启动作业时,每个参数可以设置多个参数值,自动生成多个作业并发执行。并发执行的作业数为设置的参数值个数的乘积。
OBS服务 OBS全称Object Stroage Service(对象存储服务),提供海量、安全、高可靠、低成本的数据存储能力,可供用户存储任意类型和大小的数据。 宫颈癌细胞病理筛查API支持直接使用华为云OBS服务进行数据的存储,以减少服务使用成本,降低服务的响应时长,提升服务使用的体验。
快照方式制作镜像(偶尔制作的镜像):在基础镜像上,比如Ubuntu,先登录镜像系统并安装Docker软件,然后整体制作快照,即可得到所需软件的Docker镜像。 Dockerfile方式制作镜像(经常更新的镜像):将软件安装的流程写成DockerFile,使用Docker build构建成Docker镜像。