检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
txt;projectname:/test3.txt" } } --output_dir -o 否 输出路径(EIHealth平台数据路径)。可自定义。不指定时,按照“作业名称+UUID”格式自动生成存放输出结果的目录。输出路径只能以/开头,不能以/结尾。 --timeout
基于二代测序的基因组突变检测 本最佳实践提供了通过命令行工具上传数据、上传镜像后,在医疗智能体平台搭建NGS流程,执行分析作业及批量执行NGS分析。 新型冠状病毒(COVID-19)虚拟药物筛选 本最佳实践介绍如何使用EIhealth平台虚拟药物筛选功能,通过获取示例数据,创建药物虚拟筛选任务并查看结果。
泛应用于全基因组测序、外显子测序、表观遗传学修饰等重要的生物学问题。 本示例中NGS流程基于医疗智能体(EIHealth)平台搭建,流程以fastq格式数据作为输入,对碱基的质量信息进行评估,判断可靠程度,通过质控、比对、变异检测等步骤,最终输出包含样本SNP、INDEL的VCF文件。
Notebook简介 EIHealth平台集成了基于开源的Jupyter Notebook,可为您提供在线的开发和调试工具,用于编写和调测模型训练代码。Notebook使您无需关心分析软件包的安装、升级和维护等工作,只需聚焦于科研工作,从而加快科研进展。 关于Jupyter No
药物机制研究、临床试验提供线索。 本案例介绍如何使用EIhealth平台虚拟药物筛选功能复现上述研究成果(https://doi.org/10.1021/acs.jcim.0c00821),并搭建虚拟药物筛选数据库。 图1 药物筛选之旅 父主题: 新型冠状病毒(COVID-19)虚拟药物筛选
使用docker push命令将镜像上传至EIHealth平台。 # –t APP 可不加,在平台上也可以对其进行设置 health docker push user-tutorials/fastqc:latest –t APP 上传成功后,可以转至平台查看已经上传的镜像。 步骤3:创建fastqc应用
JupyterLab”,然后选择“Terminal”,进入Terminal界面。 图1 Terminal 例如,您可以执行wget命令在公开数据集中下载基因组测序数据。 图2 执行命令 父主题: Notebook
资源看板 在“资源看板”中,您可以实时监控计算资源、存储资源、性能加速、数据库的使用情况。 图1 资源看板 父主题: 购买计算资源(主账号操作)
进入医疗智能体“总览”页面,单击“购买平台”。 图3 购买平台 购买盘古辅助制药平台。 图4 购买盘古辅助制药 区域:请就近选择靠近您业务的区域,可减少网络延迟,提高访问速度。不同区域云服务产品之间内网互不相通。 平台规格:选择“盘古辅助制药平台”基础版或者专业版。 平台计费方式:选择“包年包月”或“按需”计费。
终端节点不同,您可以从地区和终端节点中查询服务的终端节点。 医疗智能体平台的终端节点如表1所示,药物设计、临床研究的终端节点如表2所示,请您根据业务需要选择对应区域的终端节点。 表1 终端节点(医疗智能体平台API) 区域名称 区域 终端节点(Endpoint) 协议类型 华北-北京四
分子搜索 可自定义数据库,以用户输入的参考化合物结构为起点,可以按照相似度或者骨架从小分子数据库中搜索到相似结构和排序,可实现百亿级小分子的秒级搜索。 单击“分子搜索”功能卡片,进入分子搜索页面。 在配置页面,进行分子搜索配置,包括输入小分子、选择搜索算法、选择输出个数。 图1 分子搜索页面
使用rmi命令删除当前项目中指定镜像标签。 对于本项目的私有镜像tag会做彻底删除,即删除数据库记录及远程仓库中的镜像tag。 对于其他项目的导入镜像tag或者资产市场订阅的镜像tag仅删除导入或者订阅关系,即只删除数据库记录。 命令结构 health docker rmi <project-n
或上传的配体所占空间及相应Padding空间扩展值确定口袋的中心及大小。 选择残基 选择残基方式由用户点选多个平台识别到的残基定义口袋的位置。 自动预测 自动预测通过平台内置的蛋白口袋预测算法为用户提供多个可选择的口袋位置。 自定义 自定义则由用户通过指定口袋的中心位置及大小确定口袋位置。
标签管理 在平台右上角用户名中选择“标签管理”。 系统标签用于设置作业分类,可以在系统标签管理中添加、删除标签。 添加标签 在“标签管理”页面,单击“添加”。 在“添加标签”弹窗中,输入标签名称、标签描述。 标签名称长度为1~32,支持中文、字母、数字、空格、下划线和中划线,且不能以空格开头或者结尾。
配体列表可显示总条数,但最多展示1000个小分子,对接时使用全量小分子。配体来源包含:数据中心、示例数据、公共库。且公共库预置了分子数据库,包含了陶术数据库、DrugSpaceX数据库、DrugBank数据库可以进行使用,单击“公共库”,可以进行选择。 图2 选择配体文件 单击“下一步”,在对接设置页面配置相关参数。
管理用户 删除子用户 管理员用户包含子管理员,均具备删除权限。但子管理员不可将管理员删除。删除用户只能删除来源为本平台的用户,如果来源为IAM,则只支持移除。 在用户的操作列,单击“删除”,删除对应的用户。 图1 删除子用户 移除子用户 导入的用户,不支持删除,只支持移除。移除后
性能加速(可选) 当普通的计算资源不满足业务场景时,可以选择购买性能加速资源,加快算法的数据分析速度。 单击“购买性能加速”。选择包年包月或者按需,同时选择购买的性能盘大小。 图1 购买性能加速 父主题: 购买计算资源(主账号操作)
节点带有“数据盘”。OBS桶中的数据不支持本地盘加速,使用OBS桶中数据用于本地盘加速,可能会导致作业运行失败。 图1 “OBS”标签代表数据引用来源为OBS桶 单击“确定”,保存作业信息。 配置输入和依赖数据 NGS流程中涉及的输入、输出和依赖数据如表1所示。配置数据前,请先参
选择文件:选择分子文件,最多支持100万个小分子,且分子文件大小不超过2GB。支持SDF、MOL2、PDB、SMI格式。文件来源包括数据中心和示例数据。 手动输入:输入小分子SMILES表达式。最多支持输入1000行,每行最多输入512个字符,SMILES不支持输入空格或者中文。
在使用Nextflow时,作业运行失败的可能原因 由于Nextflow支持的特殊字符继承了Nextflow原有特性,因此请排查参数值,或者选择的数据名称,或者路径中带的特殊字符是否符合Nextflow原有特性。 建议启动并发作业数最多为8个。 父主题: Nextflow