检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
若您本地有需要分析的二代基因组数据,则您可以用本地的数据。数据上传方法请参见上传数据。 若没有,可以先订阅资产市场里的示例数据进行分析,这里先用资产市场中的“人类基因组数据”和“NGS小数据集”进行分析。 图3 订阅数据 可以在“数据”列表可以看到刚刚订阅的流程。 图4 查看订阅的数据 步骤3:启动作业
ADMET属性预测接口(默认+自定义属性) 功能介绍 计算小分子的物化性质,包括默认的吸收(adsorption)、分布(distribution)、代谢(metabolism)、清除(excretion)与毒性(toxicity),以及用户自定义的属性。 URI POST /v2/{project_id}/admet
员。 节点数上限 设置自动扩容的节点数上限。 取值范围为0-50。 节点数下限 设置自动扩容的节点数下限。 取值范围为0-50。 CPU执行规则 设置CPU自动扩容的条件。 启用规则:默认开启。 触发条件:设置CPU分配率达到的条件,当满足设置的条件时进行自动扩容。取值范围:1-100。默认值:80。
清理本地记录的上传文件 上传对象时,支持断点续传功能,本地因此可能会残留上传异常产生的文件,可以使用该命令对异常文件进行清理。 命令结构 health clear [flags] 表1 参数说明 参数 简写 是否必选 说明 upload -u 是 上传文件时,本地生成的断点目录。 命令示例
在创建Notebook时,如果“存储配置”选择的是“OBS”。Notebook列表的所有文件读写操作是基于所选择的OBS路径下的内容操作,即Notebook中的数据和OBS中的数据是同步的。在OBS路径中创建文件夹、上传数据,会同步到Notebook中,Notebook中的操作也会同步到OBS中,如图2所示。
可以将数据恢复至本项目或有权限的其他项目。 图2 归档数据 执行归档操作时,归档的对象,其最深目录下的对象路径长度不能超过987,否则会归档失败。例如,选择项目中的 a/目录进行归档,a/目录下最深一级的文件 a/xxxx/xxx./.../obj的总长度不能超过987。 执行归
X-Auth-Token 是 String 用户Token。Token认证就是在调用API的时候将Token加到请求消息头,从而通过身份认证,获得操作API的权限,获取Token接口响应消息头中X-Subject-Token的值即为Token。 最小长度:1 最大长度:32768 表3 请求Body参数
基于二代测序的基因组突变检测 NGS流程简介 配置命令行工具 上传数据 制作并上传镜像 创建应用 搭建NGS流程 执行分析作业 批量执行NGS分析
几种不同类型的归档,区别是什么 标准存储 标准存储访问时延低和吞吐量高,因而适用于有大量热点文件(平均一个月多次)或小文件(小于1MB),且需要频繁访问数据的业务场景。 适合高性能,高可靠,高可用,频繁访问场景。 归档存储 归档存储适用于很少访问(平均一年访问一次)数据的业务场景,
在使用Nextflow时,作业运行失败的可能原因 由于Nextflow支持的特殊字符继承了Nextflow原有特性,因此请排查参数值,或者选择的数据名称,或者路径中带的特殊字符是否符合Nextflow原有特性。 建议启动并发作业数最多为8个。 父主题: Nextflow
应用的参数和镜像启动命令如何设置 创建应用时,需要设置应用的输入、输出参数和镜像的启动命令。需要您熟悉所制作的生物信息学软件的使用并具备一定的开发经验。 例如,设置FastQC应用的参数和镜像启动命令时,首先通过阅读FastQC介绍和FastQC命令说明了解软件的使用。并依照Fa
程所需的应用。 图2 填充应用内容 对于测序得到的大量数据,如果需要批量执行NGS分析,可以选取以下任意一种方式进行批量执行: 方式一:对于输入参数,打开“并发”开关,在启动作业时,每个参数可以设置多个参数值,自动生成多个作业并发执行。并发执行的作业数为设置的参数值个数的乘积。
NGS流程中需使用二代测序得到的原始fastq文件、参考基因组序列、参考Variants数据集。 本示例中以Windows系统命令行工具为例,介绍如何将本地数据上传到EIHealth平台。更多的命令介绍请参见命令行工具。 使用命令行工具,用switch命令进入待操作的项目。 例如,使用health
将gatk-markduplicates的输出参数markduped-bam与gatk-bqsr、gatk-applybqsr的输入参数markduped-bam相连。将gatk-bqsr的输出参数recal-table与gatk-applybqsr的输入参数recal-table相连。
4.1.9.0 . 详细的Dockerfile指令请参见Dockerfile参考。 上传镜像 请依据表1提供的镜像下载命令下载搭建NGS流程所需的镜像。并依据制作bwa-mem镜像和制作gatk-haplotypecaller镜像制作镜像。制作好后的镜像如图1所示,请按照以下步骤将镜像上传至EIHealth平台。
作业配置文件说明 流程创建完成后,可基于已创建的流程运行分析作业。 在EIHealth平台,运行分析作业的过程通过图形化的界面操作完成。在命令行工具中,该过程以配置文件的形式给出。您可以基于已获取到的模板使用命令行工具启动分析作业,运行的分析作业将同步显示到EIHealth平台。 获取作业模板
引用数据 选择需要引用的项目以及项目中的数据,或者选择待引用的OBS桶路径,先选择OBS桶所在区域,再选择OBS桶名称,支持选择不在同一区域的OBS桶。 单击“确定”,引用其他项目中的数据至本项目。 引用的数据和项目将显示在左侧的数据列表中。 图4 引用的数据 引用OBS类型数据
取、删除中间文件的时间。 流程针对GATK4中的限速步骤,进行了系统的优化加速。流程从contig-file中提取contig,根据contig下发对应的任务,并依据不同任务,指定并行下发的任务数,以降低流程整体的运行时间。 流程执行信息 NGS流程由fastp、bwa-mem、
用户Token。Token认证就是在调用API的时候将Token加到请求消息头,从而通过身份认证,获得操作API的权限,获取Token接口响应消息头中X-Subject-Token的值即为Token。 最小长度:1 最大长度:32768 响应参数 无 请求示例 获取指定归档的全数据清单 https://eihealth
Viewer打开,会出现蛋白显示不完整的情况,如下图所示。 此时可将受体文件中的REMARK行进行删除,即可解决该问题。 父主题: 盘古辅助药物