检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
作自定义应用,创建分析流程。 流程 医疗智能体流程包含基因组学分析过程所需应用的执行先后信息以及数据输入输出等定义。分析流程由至少一个应用组成,流程中的各个应用由其前后顺序关系形成数据流,前序应用为后序应用提供输入。医疗智能体基因组分析平台为您提供了多种分析流程,帮助您快速完成分析任务。
分子搜索 可自定义数据库,以用户输入的参考化合物结构为起点,可以按照相似度或者骨架从小分子数据库中搜索到相似结构和排序,可实现百亿级小分子的秒级搜索。 单击“分子搜索”功能卡片,进入分子搜索页面。 在配置页面,进行分子搜索配置,包括输入小分子、选择搜索算法、选择输出个数。 图1 分子搜索页面
包。 数据 人基因组数据 GRch38-reference数据集为人类基因参考基因组,广泛用于人类基因组分析中,如WGS、callvariants 等。数据集总大小约 13GB。 NGS大数据集 NA24385-raw数据集为NGS流程测试数据集,作为该流程的原始输入。数据集总大小约
可以很好的将流程在不同平台之间进行迁移,并且能够保证结果的可重复性。Nextflow最大的优点是它是基于数据流的程序模型,因此不用自己去写复杂的并行化的程序,只需要关注“数据流”即可。流程中的每个process可以通过配置文件快速的定制并行执行的样本数目,大大节约了生信人员搭建组学分析流程的时间。
在先导化合物优化阶段,提供分子优化、靶点口袋分子设计(骨架跃迁、片段优化、片段连接、片段生成)、自由能微扰、合成路径规划功能。 模型管理 支持客户用自己的数据进行模型训练、对模型进行管理以及在平台上用自己的模型进行分析。 父主题: 盘古辅助制药平台
回归型:预测一系列连续变量的模型,主要侧重定量描述。 二分型:预测二分类离散变量的模型,主要侧重定性分析。 模型数据 选择模型数据。可选择数据中心数据,或者示例数据。 仅支持CSV格式,数据条数支持100-50000条,文件不大于5MB。 组织共享 如果关闭,则该模型只能自己使用。 如果开启
EIHealth中的流程由应用搭建形成,应用包含了数据的输入、输出等参数定义。 应用呈现的信息在创建应用过程中定义,包含参数名称、数据类型、描述、默认值等。 单击参数名称,可查看参数的详细信息。 单击输入参数图标,可指定输入数据路径。输出数据路径在新建流程和运行分析作业时可指定。 新建流程
内置大量生物医疗领域标准分析流程,并结合华为特有的高性能云计算,多样性算力,大数据等技术加速计算过程。 支持十亿节点、百亿边的超大规模图数据库查询,提供适用于基因和生物网络数据的图深度学习算法。 拥有基于基因组数据自动深度学习的技术框架AutoGenome,深度融合人工智能技术,产生更
性能加速(可选) 当普通的计算资源不满足业务场景时,可以选择购买性能加速资源,加快算法的数据分析速度。 单击“购买性能加速”。选择包年包月或者按需,同时选择购买的性能盘大小。 图1 购买性能加速 父主题: 购买计算资源(主账号操作)
在使用Nextflow时,作业运行失败的可能原因 由于Nextflow支持的特殊字符继承了Nextflow原有特性,因此请排查参数值,或者选择的数据名称,或者路径中带的特殊字符是否符合Nextflow原有特性。 建议启动并发作业数最多为8个。 父主题: Nextflow
创建项目 使用create或submit命令创建项目,并可设置项目级数据权限策略。 命令结构 health create project <project-name> [flags] 或 health submit project <project-name> [flags] 表1
存储资源 存储资源的计费模式是按需或者购买套餐包的形式, 按需计费可根据数据量的大小收费,故不需要提前进行购买 套餐包需提前购买,当存储用量超过套餐包规格时,超出部分将自动按量按需计费 图1 存储资源 图2 存储套餐包 图3 购买存储套餐包 父主题: 购买计算资源(主账号操作)
单击“功能模块 > 通用工具 > MOL Editor”,进入Mol Editor页面即可操作。可以通过单击右上角的“保存”,将编辑的分子结构保存在数据中心。 图1 保存分子结构 父主题: 通用工具
只有项目所有者和管理员能修改。 --tags -t 否 项目标签,多个标签使用分号(;)分隔。 只有项目所有者和管理员能修改。 --policy -p 否 设置项目级数据权限策略。只有项目所有者能修改。 用数字0和1表示关闭和打开,以data-share、data-download、data-delete、
String 自动作业的描述,取值范围:输入字符最大长度为255 最大长度:255 database_id 是 String 自动作业依赖的数据库ID 最小长度:1 最大长度:128 database_column 是 String 自动作业状态更新列 最小长度:1 最大长度:55
节点带有“数据盘”。OBS桶中的数据不支持本地盘加速,使用OBS桶中数据用于本地盘加速,可能会导致作业运行失败。 图1 “OBS”标签代表数据引用来源为OBS桶 单击“确定”,保存作业信息。 配置输入和依赖数据 NGS流程中涉及的输入、输出和依赖数据如表1所示。配置数据前,请先参
新建自定义属性任务接口 功能介绍 输入自定义属性的任务数据,创建自定义属性建模任务。 URI POST /v1/{project_id}/custom-props 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 华为云项目id 请求参数 表2
否 Array of strings 可供搜索分子的公共数据库名称列表。 最小长度:1 最大长度:128 数组长度:0 - 10 custom_databases 否 Array of strings 可供搜索分子的自定义数据库id列表。 最小长度:1 最大长度:128 数组长度:0
ModelFile 参数 是否必选 参数类型 描述 source 是 String 模型数据文件来源。 枚举值: public private url 是 String 文件URL,用户私有数据中心为项目路径、公共数据场景为obs地址。 最小长度:1 最大长度:2000 eihealth_project_id
SDF、PDB、MOL2格式。 受体蛋白:受体蛋白文件,支持PDB格式。 图2 选择配体分子和受体蛋白 设置数据库。 数据库功能可以将任务运行过程中产生的数据文件按照模板生成数据库。 数据库名称:数据库的名称。 输出文件格式:可以将流程生成的分子对接结果,保存为.txt、.csv或.vcf格式。使用“Docking