检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
项目是EIHealth平台的一个工作空间,可以在项目中存储数据,上传镜像和创建分析作业。也可以将团队成员引入到项目中,并通过设置成员角色实现项目权限的划分。 项目管理是以项目为粒度对数据、分析作业、开发环境和镜像进行分组。以便用户通过项目进行资源的访问、共享和协作。您可以创建项目,并向其中上传数据、搭建流程、创建分析
天内最新的1万条数据审计日志,查看按钮可以查看及下载保存的审计日志。 通过审计日志可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。您可以在项目的“数据审计”页面下载最近7天的数据审计日志,其他操作的审计日志请登录云审计服务控制台查看。 图4 数据审计 父主题: 项目管理
${output-dir} ${input-file} 选择“X86”CPU架构,CPU需求建议0.2起。GPU类型选择“无”。 按需填写内存大小,单位为GB。FastQC运行中所需内存大小依赖于输入数据大小,建议至少1GB。计算节点标签可将作业运行于指定的资源节点上,标签设置方法请参见计算资源标签管理。
JupyterLab”,然后选择“Terminal”,进入Terminal界面。 图1 Terminal 例如,您可以执行wget命令在公开数据集中下载基因组测序数据。 图2 执行命令 父主题: Notebook
批量执行NGS分析 对于测序得到的大量数据,批量并自动执行NGS分析是提高工作效率的有效方式。 从搭建、执行NGS流程中可以看出,图形化的操作界面提供了友好、便捷的操作体验,但是当面临大批量的测序数据时,需要重复设置输入、输出、执行等步骤。为进一步提高NGS流程的执行效率,本章节
默认使用前一级的配置,填值会覆盖更新。覆盖关系:作业->流程->应用 最小长度:0 最大长度:24 cpu_type String cpu架构类型,不填默认X86 最小长度:0 最大长度:24 memory String 内存申请使用量,取值范围[0.1-3072],单位G,支持
资源看板 在“资源看板”中,您可以实时监控计算资源、存储资源、性能加速、数据库的使用情况。 图1 资源看板 父主题: 购买计算资源(主账号操作)
流程配置文件说明 EIHealth中的分析流程包含分析过程中所需应用的执行信息和数据的输入、输出等参数定义。分析流程至少由一个应用组成,在多个应用构成的流程中,一个应用的输出作为另一个应用的输入,流程中的各个应用由其前后顺序形成完整的计算工作流。 在EIHealth平台,创建流程
使用前一级的配置,填值会覆盖更新。覆盖关系:作业->流程->应用 最小长度:0 最大长度:24 cpu_type 否 String cpu架构类型,不填默认X86 最小长度:0 最大长度:24 memory 否 String 内存申请使用量,取值范围[0.1-3072],单位G,
使用前一级的配置,填值会覆盖更新。覆盖关系:作业->流程->应用 最小长度:0 最大长度:24 cpu_type 否 String cpu架构类型,不填默认X86 最小长度:0 最大长度:24 memory 否 String 内存申请使用量,取值范围[0.1-3072],单位G,
基础配置:选择“计费模式”、“当前区域”。 集群类型选择“Elasticsearch”,输入集群名称。 图2 基础配置 节点规格:参考自己的数据库大小。自定义数据库所需要的的CSS节点规格大于“4 vCPUs | 8GB”,不支持“4 vCPUs | 8GB”。 节点存储:建议选择“超高I/O”。
包。 数据 人基因组数据 GRch38-reference数据集为人类基因参考基因组,广泛用于人类基因组分析中,如WGS、callvariants 等。数据集总大小约 13GB。 NGS大数据集 NA24385-raw数据集为NGS流程测试数据集,作为该流程的原始输入。数据集总大小约
可以很好的将流程在不同平台之间进行迁移,并且能够保证结果的可重复性。Nextflow最大的优点是它是基于数据流的程序模型,因此不用自己去写复杂的并行化的程序,只需要关注“数据流”即可。流程中的每个process可以通过配置文件快速的定制并行执行的样本数目,大大节约了生信人员搭建组学分析流程的时间。
分子搜索 可自定义数据库,以用户输入的参考化合物结构为起点,可以按照相似度或者骨架从小分子数据库中搜索到相似结构和排序,可实现百亿级小分子的秒级搜索。 单击“分子搜索”功能卡片,进入分子搜索页面。 在配置页面,进行分子搜索配置,包括输入小分子、选择搜索算法、选择输出个数。 图1 分子搜索页面
使用rmi命令删除当前项目中指定镜像标签。 对于本项目的私有镜像tag会做彻底删除,即删除数据库记录及远程仓库中的镜像tag。 对于其他项目的导入镜像tag或者资产市场订阅的镜像tag仅删除导入或者订阅关系,即只删除数据库记录。 命令结构 health docker rmi <project-n
应用场景 基因组分析 提供从基因组数据管理、生物信息分析流程到科研分析管理整个流程的服务,快速实现基因组数据分析及AI建模,提供高性能、高可靠性、高性价比的基因测序计算、存储、分析和AI能力支持,让科研过程标准化、可执行。 基因组测序是新型冠状病毒疑似病例确诊的病原学证据之一,基
性能加速(可选) 当普通的计算资源不满足业务场景时,可以选择购买性能加速资源,加快算法的数据分析速度。 单击“购买性能加速”。选择包年包月或者按需,同时选择购买的性能盘大小。 图1 购买性能加速 父主题: 购买计算资源(主账号操作)
# 应用的资源配额 cpu_type: 'X86' # cpu架构类型,不填默认X86 cpu: '0.1C' # cpu申请使用量,取值范围[0
DELETE_DATA 数据删除。删除数据时给予消息提示,删除结果给予消息提示。 CLONE_DATA 数据拷贝。数据拷贝时给予消息提示,拷贝结果给予消息提示。 IMPORT_DATA 数据导入。数据导入时给予消息提示,导入结果给予消息提示。 ARCHIVE_DATA 归档数据。归档数据时给予消息提示,归档结果给予消息提示。
图12 性能加速节点信息 购买数据库 使用数据库功能前,需要先购买数据库,数据库只能购买一个。 在“数据库”页面,单击“购买数据库”。 选择“数据库规格”、“性能规格”、“磁盘加密”、“计费模式”、“购买时长”、“购买数量”。 图13 购买数据库 数据库规格:选择“标准版”。 性能规格:根据您的需求选择规格。