检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在使用Nextflow时,作业运行失败的可能原因 由于Nextflow支持的特殊字符继承了Nextflow原有特性,因此请排查参数值,或者选择的数据名称,或者路径中带的特殊字符是否符合Nextflow原有特性。 建议启动并发作业数最多为8个。 父主题: Nextflow
运行大规模虚拟药筛任务 药物数据输入格式说明 订阅Docking Summary流程 新建研究 查看药筛结果 查看药筛作业和结果下载
本示例中使用华为云弹性云服务器服务(ECS)创建一台云服务器,并使用快照方式制作bwa镜像。 购买弹性云服务器。 云服务器创建成功后,在云服务器列表页,选中待登录的弹性云服务器。单击“远程登录”,输入ECS初始账号,登录ECS。 图1 云服务器列表 安装容器引擎。 例如,在Linux操
运行作业 方式1:使用预置的NGS流程 方式2:使用预置应用搭建NGS流程 方式3:自定义镜像运行FastQC流程
快照方式制作镜像示例: 本示例中使用华为云弹性云服务器服务(ECS)创建一台云服务器,并使用快照方式制作bwa镜像。 购买弹性云服务器。 云服务器创建成功后,在云服务器列表页,选中待登录的弹性云服务器。单击“远程登录”,输入ECS初始账号,登录ECS。 图1 云服务器列表 安装容器引擎。 启动一个空白的基础容器,并进入容器。
过程复杂。 将生物信息学软件封装成Docker镜像,可以使程序在不同的环境中运行,并通过EIHealth平台的镜像管理,实现高效的调用,极大方便了软件的安装和运行。 Docker镜像是一个模板,是容器应用打包的标准格式,在部署容器化应用时可以指定镜像。例如一个Docker镜像可以
镜像管理简介 运行生物信息学软件,往往由于不同的操作系统(Windows、Linux、Mac等)原因,无法实现统一的运维管理。同时,这些软件具有不同的版本和软件包,安装、使用过程复杂。将生物信息学软件封装成Docker镜像,可以使程序在不同的环境中运行,并通过EIHealth平台
子文件里面的小分子进行一一对接。 超时时间 根据受体配体对个数进行调整,一个受体配体对对接大约需要25s。 图2 运行信息 单击“提交”,运行作业。 父主题: 运行大规模虚拟药筛任务
输入配体小分子,配体小分子为如下格式的txt文件。 第一列为smiles字符串,第二列为smiles名称,中间用tab键分割。 父主题: 运行大规模虚拟药筛任务
查看药筛结果 药筛运行状态可在“专题”页面查看。 图1 查看运行状态 运行完成后可单击任务名称,查看对接结合能的热图。 热图的横坐标为蛋白质名称,以及对接结合能的均值和标准差。纵坐标为配体小分子名称,数值为结合能的大小,结合能越小,颜色越偏紫色。 可以根据结合能的大小进行排序,结合能越小代表配体和受体结合越稳定。
查看药筛作业和结果下载 查看作业进程 用户可以在“项目 > 作业”中查看药筛作业的后台进程。 图1 查看作业进程 对接完成后的小分子构象下载 单击应用中的“qvina-w”,获取输出结果的路径。 文件的命名方式为:蛋白质名称_vs_配体名称_blinddock.pdbqt。 图2
容器引擎几乎支持在所有操作系统上安装,用户可以根据需要选择要安装的容器引擎版本。请使用自己的电脑搭建Docker环境,或者使用华为云弹性云服务器ECS搭建Docker环境。 例如,在Linux操作系统下,可以使用如下命令快速安装容器引擎。 curl -fsSL get.docker.com -o get-docker
NOTEBOOK:用于创建Notebook的镜像。 为了保证平台业务安全,您在平台内购买的计算资源,将部署在独立的、专属资源池中。Notebook与流程作业均在此资源池运行,其中Notebook启动用户为health-user,流程作业默认启动用户为root。 平台提供了必要的加
关键概念 镜像 运行生物信息学软件,往往由于不同的操作系统(Windows、Linux、Mac等)原因,无法实现统一的运维管理。同时,这些软件具有不同的版本和软件包,安装、使用过程复杂。将生物信息学软件封装成Docker镜像,可以使程序在不同的环境中运行,并通过EIHealth平
允许删除”取消禁止删除设置。 图7 开启禁止删除数据 支持设置最多15个数据的禁止删除状态。 如果平台或者父目录设置禁止删除状态,则对应的数据根路径或者子路径均为禁止删除状态,子路径不支持同时设置允许删除状态;如果平台或者父目录设置允许删除,则之前子路径设置的禁止删除权限失效,全部子路径允许删除。
a、Docker、Singularity结合起来使用,可以很好的将流程在不同平台之间进行迁移,并且能够保证结果的可重复性。Nextflow最大的优点是它是基于数据流的程序模型,因此不用自己去写复杂的并行化的程序,只需要关注“数据流”即可。流程中的每个process可以通过配置文件
同时会跳转回作业列表。 图12 作业列表 步骤4:查看作业运行状态、获取作业结果 在作业列表中,单击对应的作业名称,可查看作业运行状态,运行时间等信息。 图13 作业运行状态 单击具体的每个应用,可以查看每个应用的运行信息:输入输出,节点参数,应用以及日志等信息。 单击具体的输出参数便可跳转到具体的文件位置。
步骤3:新建作业 单击作业页面的“新建作业”按钮,并选择需要运行的流程。这里作业名称可以用默认的名称,也可自己更改一个名称。同时,若想比较好的方式管理输出文件,也可以自行指定输出路径。 图6 新建作业 在作业页面添加好运行参数,添加方式与方式1相同。 配置好参数后,单击右上角“启动
大模型输出计划步骤 图2 写出生信代码 图3 自动执行完成 可以在jupyter的文件系统中看到运行结果,也可以在基因平台项目的数据页面查看文件结果: 图4 jupyter中查看运行结果 图5 基因平台查看运行结果 在基因平台项目中查看自动投递的作业。 图6 查看自动投递的作业 父主题:
订阅Docking Summary流程 进入资产市场订阅Docking Summary流程。 图1 订阅流程 可以在“工具 > 流程”列表可以看到刚刚订阅的流程。 图2 查看订阅的流程 父主题: 运行大规模虚拟药筛任务