检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
EIHealth平台集成了基于开源的Jupyter Notebook,可为您提供在线的开发和调试工具,用于编写和调测模型训练代码。Notebook使您无需关心分析软件包的安装、升级和维护等工作,只需聚焦于科研工作,从而加快科研进展。 关于Jupyter Notebook的详细操作指导,请参见Jupyter
error或file xxx not exists。 问题原因 OBS集群到计算集群之间的带宽达到了上限。 OBS集群的IOPS达到了上限。 解决方案 更改分析存储介质,例如使用更高性能的IO加速方案(SFS Turbo、EVS),如使用SFS Turbo加速,在投递作业时可以选择“IO加速”。
优先级:设置作业优先级。在资源充足的情况,高优先级先于低优先级。在满足条件的资源规格情况下,高优先级的先于低优先级投递。如果资源不满足,则优先处理资源满足的作业。例如,资源有2u2g,低优先级的需要1.8u1.8g,高优先级的需要2.2u2.2g,则低优先级的会先投递。但是两者都是1.8u1
获取镜像 获取创建分析应用的镜像 创建分析应用时,您可以通过Docker Hub等镜像仓库,搜索引擎,自己制作等途径获取所需的镜像。 例如,可在Docker Hub获取bwa软件(用于将基因序列比对到参考基因组上)。 以下类型镜像,建议您通过Docker Hub获取,不建议自己制作。
计算节点标签添加方法:在平台右上角单击用户名,选择“系统资源 > 计算资源”,在计算节点的操作列单击“更多 > 标签管理”,添加标签。上图示例中需要添加的标签名称为labelsss1。 使用本地已填写好的作业模板job.yaml运行分析作业。 health create job -y D:\job.yaml
ux、Mac等)原因,无法实现统一的运维管理。同时,这些软件具有不同的版本和软件包,安装、使用过程复杂。 将生物信息学软件封装成Docker镜像,可以使程序在不同的环境中运行,并通过EIHealth平台的镜像管理,实现高效的调用,极大方便了软件的安装和运行。 Docker镜像是一
为云AI和大数据技术优势,为基因组分析、药物研发和临床研究三个领域提供的专业AI研发平台。平台提供大量相关模型、算法及数据资源,是一站式的医疗研发平台。EIHealth以开放API的方式提供给用户,您可以根据本文档提供的API来使用服务,支持的全部API请参见API概览。 在调用
将EIHealth平台预置的应用构建成流程,并运行作业。以二代基因组分析流程:fastp,bwa-mem,bamqc,picard-insertsize两个算法为例。 应用是对每个软件的镜像封装,将应用封装好后可以反复利用并也可以让其他人很容易的使用,不用担心复杂的开发环境问题。 流程
程所需的应用。 图2 填充应用内容 对于测序得到的大量数据,如果需要批量执行NGS分析,可以选取以下任意一种方式进行批量执行: 方式一:对于输入参数,打开“并发”开关,在启动作业时,每个参数可以设置多个参数值,自动生成多个作业并发执行。并发执行的作业数为设置的参数值个数的乘积。
EIHealth中的每一个分析作业都依托于应用运行。应用是生物信息学软件和运行该软件所依赖的运行环境的镜像封装。 在EIHealth平台,创建应用的过程通过图形化的界面操作完成。在命令行工具中,该过程以配置文件的形式给出。您可以基于获取到的模板使用命令行工具创建应用,创建好的应用将同步显示到EIHealth平台。
新建流程 流程说明 分析流程至少由一个应用组成,在多个应用构成的流程中,一个应用的输出作为另一个应用的输入,流程中的各个应用由其前后顺序形成完整的计算工作流。 EIHealth中的流程由应用搭建形成,应用包含了数据的输入、输出等参数定义。 应用呈现的信息在创建应用过程中定义,包含参数名称、数据类型、描述、默认值等。
流程设计器 分析流程至少由一个应用构成,流程中的各个应用由其前后顺序形成完整的计算工作流,一个应用的输出作为另一个应用的输入。 流程设计器是一种用于创建、查看、修改流程的图形化工具。借助流程设计器,您可以拖拽工具到画布中,可视化链接各应用,指定应用的先后顺序。 流程设计器界面 流
用户只能删除来源为本平台的用户,如果来源为IAM,则只支持移除。 项目是存储数据、镜像、分析作业等的工作空间,执行删除用户操作时,只有在该用户名下没有项目时,才可以被删除。在用户的操作列,单击“删除”,删除对应的用户。 图1 删除子用户 移除子用户 导入的用户,不支持删除,只支持
对于由多个应用构成的分析作业,通过颜色方便地区分应用的执行状态。 绿色:运行成功。 红色:运行失败。 蓝色:等待运行。 灰色:被取消运行。 蓝色圆圈:运行中。 作业运行的时间,可以通过“概述”列的进度条进行查看。进度条中的颜色与应用状态颜色对应。单击进度条中的颜色块,可以展开并查
创建用户的详细方法请参见创建平台用户。 存在一个创建好的项目。 操作步骤 添加项目成员有两种不同的方法,请任选其中一种方法操作。 方法一 单击项目名称,进入项目“设置”页。 单击“添加”,添加成员。 图1 添加成员 输入已添加至平台的用户的全称。 图2 输入用户名全称 单击“添加”,设置用户角色。详细成员角色介绍请参见表1。
作业投递后显示运行成功,但是根据日志分析作业有报错,也未能正确输出相关信息。 排查思路、解决方法请参考查看执行结果章节的说明。 场景4 参数配置的不合理导致的作业执行失败。 解决方法 选择运行失败的分析作业,单击操作列“更多>重试”。 在弹出的提示框中选择“更改参数”。 图6 更改参数
成员具备相应的权限,不同类型成员所拥有的权限请参见成员角色和权限。 冻结:冻结项目。一个项目可能由于某些原因暂时中止,此时可以将项目暂时冻结,待下次重新启动时再激活。处于“冻结”状态的项目,用户无法进入该项目查看项目的开发环境、流程等历史运行情况,当前正在运行的分析作业会继续执行
基于二代测序的基因组突变检测 NGS流程简介 配置命令行工具 上传数据 制作并上传镜像 创建应用 搭建NGS流程 执行分析作业 批量执行NGS分析
并设置是否“清空作业状态更新列”,状态更新列的值为空的数据才会投递作业。 选择“新建一列”,需要输入新建的列名。 图2 设置作业基本信息 定义触发器。使用触发器来筛选需要运行作业的数据,并且满足状态更新列的值为空的数据才会被投递作业。 单击“添加条件”,在数据列名、判断模式、值中定义投递作业的触发条件。数据列
平台由项目管理、数据管理、作业、工具、开发环境、镜像等核心部件组成,各个部件沉淀了丰富的技术细节和人性化的设计。 初学者能够基于页面可视化的完成数据管理、复现业内的分析流程和算法。资深从业者能够基于镜像打造自己的分析流程。 快速入门 关键概念 使用流程 初始化数据盘 什么是ECS 创建容器应用基本流程