检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
入门 平台由项目管理、数据管理、作业、工具、开发环境、镜像等核心部件组成,各个部件沉淀了丰富的技术细节和人性化的设计。 初学者能够基于页面可视化的完成数据管理、复现业内的分析流程和算法。资深从业者能够基于镜像打造自己的分析流程。 快速入门 关键概念 使用流程 初始化数据盘 什么是ECS
64],允许大小写字母、数字、空格、下划线(_)和中划线(-),只能以数字或字母开头。 最小长度:5 最大长度:64 labels 否 Array of strings 标签,取值范围[0,5],单个标签最大长度32字符,支持中文、字母、数字、空格、下划线和中划线,且不能以空格开头或者结尾。 最小长度:1
NGS配置文件示例 NGS作业由十个Task执行完成,本示例以fastp和bwa-mem两个Task为例,介绍.yaml文件填写规则,完整的NGS配置文件请参考本示例以及获取NGS作业配置文件章节得到的作业信息和模板填写。 job: name: ngs-test description
64],允许大小写字母、数字、空格、下划线(_)和中划线(-),只能以数字或字母开头。 最小长度:5 最大长度:64 labels 否 Array of strings 标签,取值范围[0,5],单个标签最大长度32字符,支持中文、字母、数字、空格、下划线和中划线,且不能以空格开头或者结尾。 最小长度:1
项目成员和权限 医疗智能体以项目为粒度对数据、分析作业、开发环境和镜像进行分组。以便用户通过项目进行资源的访问、共享和协作。 添加项目成员 移除、修改项目成员 成员角色和权限 添加项目成员 前提条件 平台管理员首先通过“用户管理”功能添加平台用户,才能将该用户添加至项目中。 创建用户的详细方法请参见创建平台用户。
基于盘古药物分子大模型,靶点口袋分子设计功能主要是能够根据给定的口袋和小分子利用AI的预测出更优小分子。 单击“靶点口袋分子设计”功能卡片,进入配置页面。 在配置页面上选择设计方式 设计方式:支持侧链修饰、骨架跃迁、片段生长和从头生成四种方式。 侧链修饰:会在不同的侧链上进行侧链生长,生成新颖小分子。
最小长度:1 最大长度:512 数组长度:10 - 10000 molecule_file DrugFile object 分子文件,分子表达式列表和分子文件二选一,分子文件优先级最高。 num_trials Integer 生成分子数量。 最小值:0 最大值:5000 initial_dataset_size
picard-insertsize算法拖拽到中间画布上。 图4 拖拽应用 设置输入、输出关系。 fastp的两个输出参数fq-file1和fq-file2是bwa-mem算法的输入参数,bwa-mem的sorted-bam参数是bamqc与picard-insertsize输入参数,参考图进行连接。
图2 基于Res-VAE和表达谱对单细胞数据降维 使用该Notebook时需要运行相应的代码模块,运行步骤如下所示。 环境配置:加载AutoGenome以及辅助绘图的软件包。 读取配置文件:通过json文件配置输入和输出路径。 模型训练:针对提供的数据和模型参数,AutoGeno
在弹出的“流程设置”页面填写“流程名称”和“版本”,其他参数可选填。参数填写完成后,单击“确定”,完成流程设置。 在流程设计器左侧应用列表中选择fastp、bwa-mem应用,并使用鼠标拖拽至画布中。 将fastp的输出参数fq-file1、fa-file2和bwa-mem的输入参数fq-filefq-file2相连。
20,取值范围2-20。 作业名称:可修改,修改后左上角也同步修改。长度为5~64个字符;仅可以使用字母、数字、下划线“_”、中划线“-”和空格;首位只能以数字或字母开头。 标签:设置作业标签。 功能调用次数:合成路径规划目前是一个运行成功得作业消耗一次功能调用次数。 图1 分子合成路径
载运动轨迹。结果页面支持Pair和Ligand两种查看方式。 Ligand查看方式下,可对结果进行收藏,在Ligand中的收藏同步3D视图。如果取消收藏,单击,弹出取消收藏页面,单击“确认”,取消收藏。 也可以下载输出结果文件包含小分子的基本信息和属性。 下载操作将会产生流量费用,具体可参考计费说明。
BindSiteDto object 结合位点。 binding_sites Array of BindSiteDto objects 受体列表和受体是二选一的关系,受体列表优先级最高。 数组长度:0 - 2 weak_constraints Array of WeakConstraintDto
参数确认无误后,单击“立即创建”,创建应用。 表1 fastp、bwa_samtools应用参数说明 应用名称和版本 应用名称:fastp 版本:0.20.1 应用名称:bwa_samtools 版本:0.7.17 镜像和启动命令 镜像:fastp:0.20.1 启动命令: fastp --fix_mgi_id
参数 是否必选 参数类型 描述 name 是 String 模型名称,取值范围:[5,32],允许大小写字母、数字、下划线(_)、中划线(-)和空格,只能以字母开头。 最小长度:5 最大长度:32 description 否 String 模型描述信息。 最小长度:0 最大长度:1024
在界面显示数据作业执行日志,需要与data-job-id一起使用。 说明: 参数--log和--file不能同时使用。 参数--log的优先级高于--file。如果命令中同时包含参数--log和--file,默认只执行--log。 --file -f 否 本地文件夹路径及自定义文件
labels 否 Array of strings 作业标签,取值范围[0,5],单个标签最大长度32字符,支持中文、字母、数字、空格、下划线和中划线,且不能以空格开头或者结尾。 最小长度:1 最大长度:32 数组长度:0 - 5 workflow_id 是 String 作业依赖的流程id
目前分子属性预测返回的结果小分子数较多,无法进行批量分析,通过一些聚类的辅助方式能更好的选择分子。从每个类里挑选出一两个分子进行后续分析和验证,提高分析的效率和分析质量。也可以通过聚类找出一些关键的骨架,来进行下游分析或者优化等。 在输出结果页面左上角单击“聚类分析”后,系统开始进行分析,同时显示“聚类分析中”。
下待载文件大小与本地文件大小不一致。 文件的最后修改时间不一致。 命令示例 本节以Windows为例介绍eihealth-toolkit的使用过程,Linux和macOS环境使用方法基本相同,可参考。 下载数据前需要使用switch命令进入待操作的项目。例如,使用health switch project
bqsr、gatk-haplotypecaller、gatk-mergevcfs和discvrseq-variantqc应用构成。在创建应用前,请先制作并上传应用所需的镜像。搭建NGS流程所需的镜像和版本如表1所示。 表1 NGS流程镜像信息 NGS流程步骤 描述 依赖镜像及版本