检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在创建Notebook时,如果“存储配置”选择的是“OBS”。Notebook列表的所有文件读写操作是基于所选择的OBS路径下的内容操作,即Notebook中的数据和OBS中的数据是同步的。在OBS路径中创建文件夹、上传数据,会同步到Notebook中,Notebook中的操作也会同步到OBS中,如图2所示。
购买服务时,需使用华为主账号购买。如果不确定账号类型,可登录账号中心查看所属账号是主账号还是子账号(IAM账号)。 在账号中心左侧导航栏中有“我的主账号”页签,则说明是子账号;没有“我的主账号”页签,则说明是主账号。 图1 查看账号信息 联系技术支持开通白名单。 需要提供账号名,账号
如何使用Notebook的Terminal功能 对于习惯编码的开发者可以使用Terminal功能进行开发、调试和运行分析任务。 在“Files”页签下,单击右上角“Open JupyterLab”,然后选择“Terminal”,进入Terminal界面。 图1 Terminal
参数类型 描述 X-Auth-Token 是 String 用户Token。Token认证就是在调用API的时候将Token加到请求消息头,从而通过身份认证,获得操作API的权限,获取Token接口响应消息头中X-Subject-Token的值即为Token。 最小长度:1 最大长度:32768
若您本地有需要分析的二代基因组数据,则您可以用本地的数据。数据上传方法请参见上传数据。 若没有,可以先订阅资产市场里的示例数据进行分析,这里先用资产市场中的“人类基因组数据”和“NGS小数据集”进行分析。 图3 订阅数据 可以在“数据”列表可以看到刚刚订阅的流程。 图4 查看订阅的数据 步骤3:启动作业
清理本地记录的上传文件 上传对象时,支持断点续传功能,本地因此可能会残留上传异常产生的文件,可以使用该命令对异常文件进行清理。 命令结构 health clear [flags] 表1 参数说明 参数 简写 是否必选 说明 upload -u 是 上传文件时,本地生成的断点目录。 命令示例
应用的参数和镜像启动命令如何设置 创建应用时,需要设置应用的输入、输出参数和镜像的启动命令。需要您熟悉所制作的生物信息学软件的使用并具备一定的开发经验。 例如,设置FastQC应用的参数和镜像启动命令时,首先通过阅读FastQC介绍和FastQC命令说明了解软件的使用。并依照Fa
不同类型的归档,费用分别是多少 选择归档存储类别涉及以下三种计费: 归档类别数据的存储费用 恢复归档数据的流量费用 提前删除归档数据(不满90天)收取的费用 存储类型 存储空间(按需) 存储套餐包(1TB 1年) 数据取回(直读) 数据取回(加急/标准) 删除对象 标准存储 0.0990元/GB/月
取、删除中间文件的时间。 流程针对GATK4中的限速步骤,进行了系统的优化加速。流程从contig-file中提取contig,根据contig下发对应的任务,并依据不同任务,指定并行下发的任务数,以降低流程整体的运行时间。 流程执行信息 NGS流程由fastp、bwa-mem、
基于二代测序的基因组突变检测 NGS流程简介 配置命令行工具 上传数据 制作并上传镜像 创建应用 搭建NGS流程 执行分析作业 批量执行NGS分析
几种不同类型的归档,区别是什么 标准存储 标准存储访问时延低和吞吐量高,因而适用于有大量热点文件(平均一个月多次)或小文件(小于1MB),且需要频繁访问数据的业务场景。 适合高性能,高可靠,高可用,频繁访问场景。 归档存储 归档存储适用于很少访问(平均一年访问一次)数据的业务场景,
NGS流程中需使用二代测序得到的原始fastq文件、参考基因组序列、参考Variants数据集。 本示例中以Windows系统命令行工具为例,介绍如何将本地数据上传到EIHealth平台。更多的命令介绍请参见命令行工具。 使用命令行工具,用switch命令进入待操作的项目。 例如,使用health
eihealth_project_id 是 String 平台项目ID,您可以在平台单击所需的项目名称,进入项目设置页面查看。 最小长度:1 最大长度:128 project_id 是 String 华为云项目ID,您可以从获取项目ID中获取。 最小长度:1 最大长度:128 study_id 是 String
在使用Nextflow时,作业运行失败的可能原因 由于Nextflow支持的特殊字符继承了Nextflow原有特性,因此请排查参数值,或者选择的数据名称,或者路径中带的特殊字符是否符合Nextflow原有特性。 建议启动并发作业数最多为8个。 父主题: Nextflow
eihealth_project_id 是 String 平台项目ID,您可以在平台单击所需的项目名称,进入项目设置页面查看。 最小长度:1 最大长度:128 notebook_id 是 String notebook id 最小长度:1 最大长度:128 project_id 是 String 华为
eihealth_project_id 是 String 平台项目ID,您可以在平台单击所需的项目名称,进入项目设置页面查看。 最小长度:1 最大长度:128 job_id 是 String 作业id 最小长度:1 最大长度:128 project_id 是 String 华为云项目ID,您可以从获取项目ID中获取。
backup_id 是 String 归档ID 最小长度:1 最大长度:128 eihealth_project_id 是 String 平台项目ID,您可以在平台单击所需的项目名称,进入项目设置页面查看。 最小长度:1 最大长度:128 project_id 是 String 华
优先级:运行优先级,分为0~9级,优先级高的作业会被优先执行(该特性规划中,暂未上线)。 计算节点标签:作业会调度到含有相应标签的计算节点上。 当应用也配置了标签,如果应用和作业的计算节点标签在同一计算节点上,则应用调度至该计算节点上;应用和它的作业,不管节点标签是否一致,都会被调度到应用的节点标签所对应的计算节点上。
Viewer打开,会出现蛋白显示不完整的情况,如下图所示。 此时可将受体文件中的REMARK行进行删除,即可解决该问题。 父主题: 盘古辅助药物
将gatk-markduplicates的输出参数markduped-bam与gatk-bqsr、gatk-applybqsr的输入参数markduped-bam相连。将gatk-bqsr的输出参数recal-table与gatk-applybqsr的输入参数recal-table相连。