检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
使用AutoGenome镜像 AutoGenome是Notebook镜像,利用AutoML等技术帮助科研工作者在基因组学数据上端到端实现深度学习网络搜索,训练,评估,预测和解释的工具包。 使用AutoGenome镜像的详细步骤如下所示: 步骤1:订阅镜像 步骤2:创建Notebook
JupyterLab”,然后选择“Terminal”,进入Terminal界面。 图1 Terminal 例如,您可以执行wget命令在公开数据集中下载基因组测序数据。 图2 执行命令 父主题: Notebook
根据表面离散点坐标集生成可渲染的文件内容 功能介绍 根据表面离散点坐标集生成可渲染的文件内容。 URI POST /v1/{project_id}/eihealth-projects/{eihealth_project_id}/drug-common/toolkit/surface-points
导入网上数据 功能介绍 导入网上数据 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI POST /v1/{project_id}/eihealth-projects/
上传数据 NGS流程中需使用二代测序得到的原始fastq文件、参考基因组序列、参考Variants数据集。 本示例中以Windows系统命令行工具为例,介绍如何将本地数据上传到EIHealth平台。更多的命令介绍请参见命令行工具。 使用命令行工具,用switch命令进入待操作的项目。
分子生成基于盘古药物分子大模型,对初始数据集进行采样,多目标、多方向的快速生成新颖且与靶点蛋白亲和力高的化合物。 单击“分子生成”功能卡片,进入配置页面。 输入初始数据集,有两种输入方式: 选择文件:支持SDF、MOL2、PDB、SMI格式文件;小分子支持10-10000个。如果没有初始数据集,可以选择官方库,ZINC数据集。
NA24385-raw数据集为NGS流程测试数据集,作为该流程的原始输入。数据集总大小约 186.2GB。 NGS小数据集 NA12878-small数据集为NGS流程测试数据集,作为该流程的原始输入。数据集总大小约 216MB。 docking summary测试数据 配体文件:小分子化合物SMILES结构式文件。
获取节点标签集 功能介绍 获取节点标签集 URI GET /v1/{project_id}/system/nodes/{server_id}/labels 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 华为云项目ID,您可以从获取项目ID中获取。
获取节点标签集 功能介绍 获取节点标签集 URI GET /v1/{project_id}/system/cluster/labels 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 华为云项目ID,您可以从获取项目ID中获取。 最小长度:1
购买系统资源 医疗智能体平台购买完成后,单击“进入平台”,在平台右上角单击用户名,选择“系统资源”。 您可以根据实际需求选择购买计算资源、性能加速、数据库。在后续使用过程中,也可根据使用情况随时购买资源。 资源看板 在“资源看板”中,您可以实时监控计算资源、存储资源、性能加速、数据库的使用情况。
合成路径规划 合成路径规划基于盘古药物分子大模型,根据给定的目标分子,可以设计出完整且合理的合成路径。 单击“合成路径规划”功能卡片,进入配置页面。 在配置页面,可以在左侧绘制分子,也可以通过上传分子文件方式上传分子或者在白框内输入小分子SMILES表达式。 上传分子文件:支持S
多样性算力,大数据等技术加速计算过程。 支持十亿节点、百亿边的超大规模图数据库查询,提供适用于基因和生物网络数据的图深度学习算法。 拥有基于基因组数据自动深度学习的技术框架AutoGenome,深度融合人工智能技术,产生更加便捷、快速、准确、可解释的医疗智能模型,加速医疗大健康行业的研究工作。
新建分子合成路径规划任务接口 功能介绍 输入要进行合成路径规划的分子以及输出可行方案的个数。 URI POST /v1/{project_id}/task/synthesis 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 华为云项目id 请求参数
JupyterLab”,然后选择“Terminal”,进入Terminal界面。 图5 Terminal 例如,您可以执行wget命令在公开数据集中下载基因组测序数据。 图6 执行命令 父主题: 开发环境(Notebook)
GenerationResultItem objects 分子生成结果条目 initial_dataset_size Integer 初始化数据集的分子条目数 strong_constraints Array of MoleculeConstraint objects 强约束集合 weak_constraints
num_trials Integer 生成分子数量。 最小值:0 最大值:5000 initial_dataset_size Integer 初始化数据集的分子数目。当为-1时,表示分子数目未知。 最小值:-1 最大值:100000 binding_sites Array of BindSiteDto
查询分子合成路径规划任务 功能介绍 通过分子合成路径规划任务ID查询分子合成路径规划任务状态及结果。 URI GET /v1/{project_id}/task/synthesis/{task_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
的数据。数据上传方法请参见上传数据。 若没有,可以先订阅资产市场里的示例数据进行分析,这里先用资产市场中的“人类基因组数据”和“NGS小数据集”进行分析。 图3 订阅数据 可以在“数据”列表可以看到刚刚订阅的流程。 图4 查看订阅的数据 步骤3:启动作业 在流程页面,单击“启动作
输入的参考基因组序列,已经通过bwa构建了index。 依赖 Variant Sets GATK4在做Variant Calling阶段需要输入的参考Variants数据集。 输出 FastQC Report 原始测序数据的质控报告,以HTML文件形式展示。 输出 BamQC Report 测序比对数据的质量控制报告,以HTML文件的形式展示。
NGS流程简介 二代基因组测序即Next Generation Sequencing (NGS)是一种基于边合成边测序的方式。NGS在保持了测序高准确度的同时,大幅地提高了测序速度,有力推动了相关研究。目前,NGS已广泛应用于全基因组测序、外显子测序、表观遗传学修饰等重要的生物学问题。