检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
基于二代测序的基因组突变检测 NGS流程简介 配置命令行工具 上传数据 制作并上传镜像 创建应用 搭建NGS流程 执行分析作业 批量执行NGS分析
受体口袋检测 功能介绍 检测受体口袋,检测类型基于配体,基于氨基酸残基,自动检测,自定义和全局对接。 URI POST /v1/{project_id}/eihealth-projects/{eihealth_project_id}/drug-common/receptor/pocket
批量执行NGS分析 对于测序得到的大量数据,批量并自动执行NGS分析是提高工作效率的有效方式。 从搭建、执行NGS流程中可以看出,图形化的操作界面提供了友好、便捷的操作体验,但是当面临大批量的测序数据时,需要重复设置输入、输出、执行等步骤。为进一步提高NGS流程的执行效率,本章节介绍如何通过循环读取输入数据
配置命令行工具 医疗智能体平台命令行工具(eihealth-toolkit)是配套EIHealth平台,为EIHealth平台各功能组件提供命令行管理工具。借助此工具,可以辅助您对EIHealth平台项目中数据、应用、流程和作业资源进行管理和使用。 操作步骤 下载命令行工具。 安装命令行工具
NGS流程简介 二代基因组测序即Next Generation Sequencing (NGS)是一种基于边合成边测序的方式。NGS在保持了测序高准确度的同时,大幅地提高了测序速度,有力推动了相关研究。目前,NGS已广泛应用于全基因组测序、外显子测序、表观遗传学修饰等重要的生物学问题
搭建NGS流程 登录医疗智能体平台,进入项目并选择“工具 > 流程”页签,单击“新建流程”。 图1 新建流程 在弹出的“流程设置”页面填写“流程名称”和“版本”,其他参数可选填。参数填写完成后,单击“确定”,完成流程设置。 在流程设计器左侧应用列表中选择fastp、bwa-mem应用
执行分析作业 创建分析作业 登录医疗智能体平台,进入项目并选择“工具 > 流程”页签,单击NGS流程行的“启动作业”。 请参考配置输入和依赖数据章节,设置NGS流程数输入数据。 在新建作业页面,填写作业信息。 基本信息:包含作业名称、标签、描述。 输出路径:存放输出结果的路径,格式以
药物数据输入格式说明 药物虚拟筛选平台的输入数据,需要输入蛋白质和配体小分子数据。参考以下数据要求,将数据上传至项目中。 输入蛋白质,pdb格式,将要进行对接的所有靶标蛋白放在一个文件夹内。 输入配体小分子,配体小分子为如下格式的txt文件。 第一列为smiles字符串,第二列为smiles
方式1:使用预置的NGS流程 使用EIHealth平台预置的流程进行运行作业。 步骤1:订阅流程 进入资产市场订阅已有的流程,以二代基因测序数据的变异检测流程为例。 图1 订阅流程 可以在“工具 > 流程”列表可以看到刚刚订阅的流程。 图2 查看订阅的流程 步骤2:订阅数据 若您本地有需要分析的二代基因组数据
创建应用 登录医疗智能体平台,进入项目并选择“工具 > 应用”页签,单击“新建应用”。 图1 新建应用 依据“应用参数说明表”依次创建搭建NGS流程所需的应用。 图2 填充应用内容 对于测序得到的大量数据,如果需要批量执行NGS分析,可以选取以下任意一种方式进行批量执行: 方式一:
创建FastQC应用样例 本章节提供了在EIHealth平台创建FastQC应用的样例,帮助您快速熟悉平台的使用方法。 FastQC是一款高通量序列数据的质量检测工具,此样例基于开源的FastQC软件,将软件制作成镜像,上传至平台,并基于此镜像创建应用。应用创建完成后可以直接使用FastQC
方式2:使用预置应用搭建NGS流程 将EIHealth平台预置的应用构建成流程,并运行作业。以二代基因组分析流程:fastp,bwa-mem,bamqc,picard-insertsize两个算法为例。 应用是对每个软件的镜像封装,将应用封装好后可以反复利用并也可以让其他人很容易的使用
数据管理简介 EIHealth平台使用对象存储服务(OBS)存储原始数据、流程执行中间数据和执行结果数据。数据按项目维度进行隔离和划分,从项目角度进行数据的管理,不同项目的数据可以通过“导入数据”实现跨项目使用。您可以在“项目管理”页面,“数据”页签中,完成数据的添加、导入、归档、
数据管理简介 盘古辅助制药平台使用对象存储服务(OBS)存储原始数据、作业执行中间数据和执行结果数据。数据按项目维度进行隔离和划分,从项目角度进行数据的管理,不同项目的数据可以通过“复制数据”实现跨项目使用。您可以在“项目管理”页面,“数据”页签中,完成数据的添加、导入、归档、复制
上传数据 NGS流程中需使用二代测序得到的原始fastq文件、参考基因组序列、参考Variants数据集。 本示例中以Windows系统命令行工具为例,介绍如何将本地数据上传到EIHealth平台。更多的命令介绍请参见命令行工具。 使用命令行工具,用switch命令进入待操作的项目
计算配体间的3D结构差异 功能介绍 计算配体间的3D结构差异。 URI POST /v1/{project_id}/eihealth-projects/{eihealth_project_id}/drug-common/ligand/diff3d 表1 路径参数 参数 是否必选 参数类型
移动对象 使用mv命令移动对象或批量移动对象。 命令结构 health mv <object> <object-dest> [flags] 表1 参数说明 参数 简写 是否必选 说明 object 无 移动对象时必选 批量移动时可选 移动对象时的源对象名,或批量移动时源对象名前缀。
制作并上传镜像 NGS流程由fastp、bwa-mem、picard-insertsize、qualimap-bamqc、gatk-markduplicates、gatk-bqsr、gatk-applybqsr、gatk-haplotypecaller、gatk-mergevcfs
合成路径规划 合成路径规划基于盘古药物分子大模型,根据给定的目标分子,可以设计出完整且合理的合成路径。 单击“合成路径规划”功能卡片,进入配置页面。 在配置页面,可以在左侧绘制分子,也可以通过上传分子文件方式上传分子或者在白框内输入小分子SMILES表达式。 上传分子文件:支持SDF
使用Variant Calling Based On NGS流程 二代基因组测序即Next Generation Sequencing (NGS)是一种基于边合成边测序的方式。NGS在保持了测序高准确度的同时,大幅的提高了测序速度。目前NGS已经普遍的应用于全基因组测序、全外显子测序