检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
镜像管理简介 运行生物信息学软件,往往由于不同的操作系统(Windows、Linux、Mac等)原因,无法实现统一的运维管理。同时,这些软件具有不同的版本和软件包,安装、使用过程复杂。将生物信息学软件封装成Docker镜像,可以使程序在不同的环境中运行,并通过EIHealth平台
ocker的机器。请使用自己的电脑搭建Docker环境,或者使用华为云弹性云服务器ECS搭建Docker环境。 例如,在Linux操作系统下,可以使用如下命令快速安装容器引擎。 curl -fsSL get.docker.com -o get-docker.sh sh get-docker
在代码输入栏输入以下命令,获取激活TensorFlow-1.8的命令并激活环境。 cat /home/ma-user/README source /home/ma-user/anaconda3/bin/activate TensorFlow-1.8 如果使用其他引擎,请将命令中“TensorFlow-1
JupyterLab”,然后选择“Terminal”,进入Terminal界面。 图1 Terminal 例如,您可以执行wget命令在公开数据集中下载基因组测序数据。 图2 执行命令 父主题: Notebook
分享:关闭分享后,项目内数据不允许分享给其他项目,包括拷贝、引用两种方式。 下载:关闭下载后,项目内数据不允许下载至本地。 删除:关闭删除后,项目内数据不允许通过平台、命令行工具删除。 图1 数据保护策略 数据审计 平台通过云审计服务(CTS)提供操作记录的收集、存储和查询,审计操作可以设置导出用户的写操作(
(SK)两部分,华为云通过AK识别用户的身份,通过SK对请求数据进行签名验证,用于确保请求的机密性、完整性和请求者身份的正确性。 您在使用命令行工具时,需要使用AK/SK进行身份验证。 操作步骤 登录华为云管理控制台,鼠标指向页面右上角的用户名,在下拉列表中单击“我的凭证”。 图1
据不能在该项目中进行更改。只能用来运行作业,导入数据到数据库等操作。 图3 引用数据 URL导入数据 以URL导入的方式添加数据类似于linux中的wget操作。单击“添加URL”按钮可以添加具体的链接,最多可添加10条链接。 图4 URL导入数据
输入数据,批量运行NGS。同时,您也可以参考本示例,将批量运行的方法复制到其他的分析任务中。 配置命令行工具 批量执行分析需要通过命令行工具完成。请参考配置命令行工具章节,下载命令行工具并完成配置。 获取NGS作业配置文件 编写NGS作业配置文件有两种方式,建议您使用第一种,通过
从其他项目导入的镜像,在镜像列表“源项目”列中,显示所属的项目。 客户端上传镜像 使用命令行工具eihealth-toolkit上传镜像,详细的上传过程请参见上传镜像到SWR镜像仓库,详细的命令介绍请参见“命令行工具 > 镜像管理命令”章节。 父主题: 镜像管理
project <project-name>命令进入待操作的项目。 例如,使用health switch project ngs-project命令进入到名为ngs-project的项目中。 通过health docker tag命令给要上传的镜像打标签。 命令结构 health docker
应用名称和版本 应用名称:fastp 版本:0.20.1 应用名称:bwa_samtools 版本:0.7.17 镜像和启动命令 镜像:fastp:0.20.1 启动命令: fastp --fix_mgi_id -w 16 -i ${fastq-file1} -I ${fastq-file2}
代码单元格。每一个Cell有两种模式:命令模式和编辑模式。 最左侧为蓝色条时,是命令模式,绿色条表示编辑模式(此时Cell中有光标,可以进行代码编写)。在命令模式下,按下“Enter”键或者鼠标单击代码框可以进入编辑模式。在编辑模式下,按下“ESC”键或者鼠标单击代码框左侧区域即可进入命令模式。 删除文件或文件夹
数据上传方法请参见“数据”页面上传。 使用命令行工具上传 命令行工具(eihealth-toolkit)配套EIHealth平台,提供数据、应用、流程和作业资源的管理和使用,支持上传最大为48.8TB的单个文件。 数据上传方法请参见命令行工具概述。 对于非挂载目录以外的目录下的文
数据上传方法请参见“数据”页面上传。 使用命令行工具上传 命令行工具(eihealth-toolkit)配套EIHealth平台,提供数据、应用、流程和作业资源的管理和使用,支持上传最大为48.8TB的单个文件。 数据上传方法请参见命令行工具概述。 父主题: 数据管理
检查作业是否存在文件或目录类型的输入参数,并且未开启并发,同时改输入参数还填入了多个值,并且路径存在包含关系,如上图所示。 假定镜像命令为cp -rf ${input} ${output},变量替换后实际执行命令为cp -rf /test/sub /test /output,此时会触发cp: will not create
流程、作业 应用的参数和镜像启动命令如何设置 直接挂载OBS目录进行大规模计算,如何解决偶现报错
数据同步。 表1 上传数据方法 上传方法 说明 “数据”页面上传 通过“数据”页面上传数据,支持上传最大为1GB的单个文件。 使用命令行工具上传 命令行工具(eihealth-toolkit)配套EIHealth平台,提供数据、应用、流程和作业资源的管理和使用,支持上传最大为48
基于二代测序的基因组突变检测 NGS流程简介 配置命令行工具 上传数据 制作并上传镜像 创建应用 搭建NGS流程 执行分析作业 批量执行NGS分析
数据管理 数据管理简介 添加数据 发布数据 数据管理常用操作 归档数据 数据控制与数据审计 命令行工具概述 父主题: 用户指南(基因平台)
入门实践 表1 常用最佳实践 实践 描述 基于二代测序的基因组突变检测 本最佳实践提供了通过命令行工具上传数据、上传镜像后,在医疗智能体平台搭建NGS流程,执行分析作业及批量执行NGS分析。 新型冠状病毒(COVID-19)虚拟药物筛选 本最佳实践介绍如何使用EIhealth平台