检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
NGS流程中需使用二代测序得到的原始fastq文件、参考基因组序列、参考Variants数据集。 本示例中以Windows系统命令行工具为例,介绍如何将本地数据上传到EIHealth平台。更多的命令介绍请参见命令行工具。 使用命令行工具,用switch命令进入待操作的项目。 例如,使用health
配置命令行工具 步骤1:获取认证信息 步骤2:获取命令行工具 步骤3:初始化配置
本页面命令行工具下载后,在使用时,需用到您注册华为账号并开通华为云时提供的用户名等信息,用于登录并操作EIHealth平台的项目、数据等资产。这些信息的处理将遵循您已接收的《华为云用户协议》及《隐私政策声明》约束。 下载地址中带有sha256后缀的链接,指的是对应软件包的校验文件。例如:Windows
步骤3:初始化配置 在使用命令行工具前,需要初始化配置信息,通过config命令对eihealth-toolkit进行初始化配置。本节以Windows为例介绍配置过程,Linux和macOS环境配置过程相同。 方法1:使用账号、密码初始化 执行以下命令,进行初始化,命中的xxx和region信息请参考表2进行替换。
Key)即访问密钥,包含访问密钥ID(AK)和秘密访问密钥(SK)两部分,华为云通过AK识别用户的身份,通过SK对请求数据进行签名验证,用于确保请求的机密性、完整性和请求者身份的正确性。 登录华为云管理控制台,鼠标指向页面右上角的用户名,在下拉列表中单击“我的凭证”。 图1 我的凭证入口 在“我的凭证”
基于二代测序的基因组突变检测 NGS流程简介 配置命令行工具 上传数据 制作并上传镜像 创建应用 搭建NGS流程 执行分析作业 批量执行NGS分析
程所需的应用。 图2 填充应用内容 对于测序得到的大量数据,如果需要批量执行NGS分析,可以选取以下任意一种方式进行批量执行: 方式一:对于输入参数,打开“并发”开关,在启动作业时,每个参数可以设置多个参数值,自动生成多个作业并发执行。并发执行的作业数为设置的参数值个数的乘积。
执行NGS的配置文件。本示例介绍使用方法一获取配置文件的方法。 方式一 使用EIHealth平台完成NGS流程的搭建,并执行成功,然后在“分析作业”页面导出作业信息.yaml文件。 方式二 使用命令行工具完成NGS流程的搭建,进而获取相应的配置文件。详细的操作请参见命令行工具。
4.1.9.0 . 详细的Dockerfile指令请参见Dockerfile参考。 上传镜像 请依据表1提供的镜像下载命令下载搭建NGS流程所需的镜像。并依据制作bwa-mem镜像和制作gatk-haplotypecaller镜像制作镜像。制作好后的镜像如图1所示,请按照以下步骤将镜像上传至EIHealth平台。
受体口袋检测 功能介绍 检测受体口袋,检测类型基于配体,基于氨基酸残基,自动检测,自定义和全局对接。 URI POST /v1/{project_id}/eihealth-projects/{eihealth_project_id}/drug-common/receptor/pocket
基于比对和矫正之后的bam文件进行Variant Calling的工作。 gatk MergeVcfs 合并分bin变异检测的VCF文件。 Variant QC 针对输出的VCF文件进行质控。 图1 NGS执行步骤 图2 搭建步骤 父主题: 基于二代测序的基因组突变检测
将gatk-markduplicates的输出参数markduped-bam与gatk-bqsr、gatk-applybqsr的输入参数markduped-bam相连。将gatk-bqsr的输出参数recal-table与gatk-applybqsr的输入参数recal-table相连。
lth平台的命令行工具进行数据文件、文件夹传输。命令行配置方法请参见配置命令行工具。 上传数据 使用命令行工具upload命令,将本地数据上传到EIHealth平台中。该命令不支持将数据上传到引用目录。 最小可以上传0Byte的空文件或文件夹,最大可以上传48.8TB的单个文件。
优先级:运行优先级,分为0~9级,优先级高的作业会被优先执行(该特性规划中,暂未上线)。 计算节点标签:作业会调度到含有相应标签的计算节点上。 当应用也配置了标签,如果应用和作业的计算节点标签在同一计算节点上,则应用调度至该计算节点上;应用和它的作业,不管节点标签是否一致,都会被调度到应用的节点标签所对应的计算节点上。
docker images命令查看已有的镜像。 详细的命令介绍请参见“命令行工具 > 镜像管理命令”章节。 单击“镜像”,在镜像列表中查看已上传的镜像。 图1 镜像列表 【可选】单击“镜像类型”,对上传的镜像进行分类。 上传镜像时如果上传命令中未指定镜像类型,新上传的镜像默认显示为“OT
上传应用 通过在本地修改应用的yaml模板,上传应用至项目中。 获取应用yaml模板。 单击“上传应用”,在弹出的页面中下载yaml示例文件。 使用命令行工具,执行health get app -s命令获取创建应用的yaml模板,复制模板并保存到本地。可以保存成.yaml或.tx
上传流程 通过在本地修改流程的yaml模板,上传流程至项目中。 获取流程yaml模板。 单击“上传流程”,在弹出的页面中下载yaml示例文件。 使用命令行工具,执行health get workflow -s命令获取创建流程的yaml模板,复制模板并保存到本地。可以保存成.yaml或
初学者能够基于页面可视化的完成数据管理、复现业内的分析流程和算法。资深从业者能够基于镜像打造自己的分析流程。 快速入门 关键概念 使用流程 初始化数据盘 什么是ECS 创建容器应用基本流程 05 实践 基于EIHealth平台,搭建NGS流程,流程以fastq格式数据作为输入,对碱基的质量信息进
平台的数据下载到本地,此命令不支持下载引用项目中的数据。 数据在下载的过程中,受网络影响可能出现损坏,下载命令默认会在下载完成后,验证项目中数据的MD5值与本地数据的MD5值的一致性,以及验证项目中数据的大小与本地数据大小一致性。 命令结构 health download <srcdir>
详细的镜像介绍和制作方法请参见镜像管理。 填写镜像启动命令。 镜像启动命令需要引用输入、输出参数中的变量,并以大括号扩起,以$符号进行引用。 镜像启动命令支持多行输入,每行最多256字符,最多支持300行。 例如,bamqc软件输入参数填写为genomedir、thread和input,输出参数为