正在生成
详细信息:
检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
批量执行NGS分析 对于测序得到的大量数据,批量并自动执行NGS分析是提高工作效率的有效方式。 从搭建、执行NGS流程中可以看出,图形化的操作界面提供了友好、便捷的操作体验,但是当面临大批量的测序数据时,需要重复设置输入、输出、执行等步骤。为进一步提高NGS流程的执行效率,本章节
创建自动作业 针对存在需要批量创建分析作业的场景,您可以选择创建自动作业。 在“自动作业”页签,您可以查看已创建的自动作业,包含作业名称、状态、数据表、创建者、创建时间;在操作列,您可以对已创建的自动作业执行启动、编辑、删除操作,运行中的作业可以执行停止操作。 图1 自动作业 前提条件
自定义数据库 盘古辅助制药平台支持用户自定义数据库,可以上传自己的数据构建自己的数据库,进行后续的分子搜索。构建自定义数据库需要先购买CSS资源和绑定CSS资源,详情见资源中心 自定义数据库 返回主页,单击“自定义数据库”进入界面,单击页面左上角的“创建数据库”,并填写相关信息。每个用户可新建100个自定义数据库。
作业执行失败排查思路 启动作业后作业一直处于已提交的状态 问题现象 作业投递后一直处于已提交的状态。 问题排查和解决方案 查看execution log, 若execution log为空,请提交工单或联系服务技术支持。 execution log 提示K8S pod can‘t
添加数据 在添加数据前,您可以创建存储数据的文件夹,将数据存储在对应的文件夹中。如果已有存储数据的文件夹,可以直接添加数据。 (可选)新建文件夹 在项目页面选择“数据中心”。 单击“新建文件夹”,创建文件夹。 图1 新建文件夹 文件夹名称命名规则: 支持创建单个文件夹和多层级的文件夹。
添加数据 在添加数据前,您可以创建存储数据的文件夹,将数据存储在对应的文件夹中。如果已有存储数据的文件夹,可以直接添加数据。 (可选)新建文件夹 单击项目名称,并选择“数据”。 图1 数据管理 单击“新建文件夹”,创建文件夹。 文件夹名称命名规则: 支持创建单个文件夹和多层级的文件夹。
创建Notebook 在开始进行模型开发前,您需要创建Notebook,并打开Notebook进行编码。 在“项目管理 > 开发”页面,单击“创建Notebook”,参考表 参数说明填写信息。 图1 创建Notebook 表1 参数说明 参数名称 说明 名称 Notebook的名
数据的上传和下载 在Notebook页面,可以通过“Upload”和“Download”上传和下载文件。上传和下载的文件大小限制为100MB。 当在Notebook中上传文件提示大小受限时,您可以根据以下不同场景将大文件上传或下载到Notebook中。 图1 上传和下载文件 OBS存储类型的Notebook
获取镜像 获取创建分析应用的镜像 创建分析应用时,您可以通过Docker Hub等镜像仓库,搜索引擎,自己制作等途径获取所需的镜像。 例如,可在Docker Hub获取bwa软件(用于将基因序列比对到参考基因组上)。 以下类型镜像,建议您通过Docker Hub获取,不建议自己制作。
Notebook安装Conda指导 打开Notebook,在“File”页签下选择“Terminal”。 图1 选择Terminal 下载和安装Anaconda。 获取Repository和Anaconda安装包。 Repository: https://repo.anaconda
药物虚拟筛选 计算机辅助药物虚拟筛选是新药早期研发的重要环节,可根据靶点蛋白和小分子药物的3D结构,计算蛋白与药物之间的结合能量,并且依托云端大算力实现超大规模筛选和成药性分析,从成千上百万的小分子库中快速筛选出与蛋白结合最紧密的候选药物,从而为药物研究和临床试验提供方向。药物虚
制作并上传镜像 NGS流程由fastp、bwa-mem、picard-insertsize、qualimap-bamqc、gatk-markduplicates、gatk-bqsr、gatk-applybqsr、gatk-haplotypecaller、gatk-mergevcf
执行分析作业 创建分析作业 登录医疗智能体平台,进入项目并选择“工具 > 流程”页签,单击NGS流程行的“启动作业”。 请参考配置输入和依赖数据章节,设置NGS流程数输入数据。 在新建作业页面,填写作业信息。 基本信息:包含作业名称、标签、描述。 输出路径:存放输出结果的路径,格
数据管理常用操作 复制数据 解除引用 下载数据 禁止/允许删除数据 删除数据 恢复数据 执行数据管理类操作需要项目成员具备相应的权限,详细的权限介绍请参见项目成员和权限。 数据文件的名称,不可以含有特殊字符。如果文件名包含特殊字符,将不支持下载,可通过去除文件名中的特殊字符方式解决。
NGS流程简介 二代基因组测序即Next Generation Sequencing (NGS)是一种基于边合成边测序的方式。NGS在保持了测序高准确度的同时,大幅地提高了测序速度,有力推动了相关研究。目前,NGS已广泛应用于全基因组测序、外显子测序、表观遗传学修饰等重要的生物学问题。
下载镜像 通过health docker pull命令下载项目中的镜像。 命令结构 health docker pull <project-name>/<image-name>:<tag-name> [flags] 表1 参数说明 参数 简写 是否必选 说明 project-name
查看对象属性 查看对象属性。 命令格式 health stat <obj> [flags] 表1 参数说明 参数 简写 是否必选 说明 obj 不涉及 是 查看的文件、文件夹对象。 注意: 如果为引用数据,必须要使用绝对路径(文件夹最后要加/)。未引用的数据不能查看。 --bf -b
流程设计器 分析流程至少由一个应用构成,流程中的各个应用由其前后顺序形成完整的计算工作流,一个应用的输出作为另一个应用的输入。 流程设计器是一种用于创建、查看、修改流程的图形化工具。借助流程设计器,您可以拖拽工具到画布中,可视化链接各应用,指定应用的先后顺序。 流程设计器界面 流
分子对接 分子对接基于华为云大算力,可根据靶点蛋白和小分子药物的3D结构,计算对接结合能,实现百万级别虚拟筛选。 单击“分子对接”功能卡片,进入分子对接受体预处理页面,单击上传受体文件,进行受体蛋白预处理配置。 受体文件仅支持PDB格式,若文件中存在多个受体,默认只处理第一个。受
上传镜像 通过health docker push命令将镜像上传至EIHealth平台项目中。 命令结构 health docker push <image-name:tag-name> [flags] 表1 参数说明 参数 简写 是否必选 说明 image-name 无 是 镜像名称。