检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
操作步骤 下载命令行工具。 安装命令行工具。 本示例中以Windows系统为例,介绍安装命令行工具的方法。 下载Windows版本的客户端,得到health.exe文件,health文件无需安装,放置在任一文件夹中即可。 图1 下载命令行工具 使用win键+R,输入cmd打开win
上传数据 NGS流程中需使用二代测序得到的原始fastq文件、参考基因组序列、参考Variants数据集。 本示例中以Windows系统命令行工具为例,介绍如何将本地数据上传到EIHealth平台。更多的命令介绍请参见命令行工具。 使用命令行工具,用switch命令进入待操作的项目。
最大长度:10000000 表8 BoundingBoxDto 参数 参数类型 描述 center Array of floats 口袋中心坐标; x, y, z轴的坐标。 最小值:-9999999 最大值:99999999 数组长度:3 - 3 size Array of floats 口袋尺寸大小;
应用名称 说明 fastqc 对测序得到的fastq数据进行质控。 trimmomatic 使用trimmomatic工具去掉测序接头,得到去接头后fastq格式的reads。 star 使用STAR比对工具将去接头后的reads比对到参考基因组,得到bam文件和多种格式的统计报告。
分子优化 分子优化基于盘古药物分子大模型,以参考化合物为起点,针对给定的期望理化性质,得到性质更优、结构新颖、与靶点蛋白亲和力高的化合物。 单击“立即使用”,进入输入分子页面。 图1 输入分子页面 在白框内输入需要优化的小分子SMILES表达式或者上传分子文件。 上传的文件支持SDF、MOL2、PDB、SMI格式。
批量执行NGS分析 对于测序得到的大量数据,批量并自动执行NGS分析是提高工作效率的有效方式。 从搭建、执行NGS流程中可以看出,图形化的操作界面提供了友好、便捷的操作体验,但是当面临大批量的测序数据时,需要重复设置输入、输出、执行等步骤。为进一步提高NGS流程的执行效率,本章节
最小长度:0 最大长度:24 表6 VertexLocationDto 参数 参数类型 描述 x Double 子任务的画布横坐标 y Double 子任务的画布纵坐标 表7 TaskParameterDto 参数 参数类型 描述 name String 子任务的参数名称,长度为[1,3
最大长度:10000000 表9 BoundingBoxDto 参数 参数类型 描述 center Array of doubles 口袋中心坐标; x, y, z轴的坐标。 最小值:-9999999 最大值:99999999 数组长度:3 - 3 size Array of floats 口袋尺寸大小;
表8 BoundingBoxDto 参数 是否必选 参数类型 描述 center 是 Array of doubles 口袋中心坐标; x, y, z轴的坐标。 最小值:-9999999 最大值:99999999 数组长度:3 - 3 size 是 Array of floats 口袋尺寸大小;
表8 BoundingBoxDto 参数 是否必选 参数类型 描述 center 是 Array of doubles 口袋中心坐标; x, y, z轴的坐标。 最小值:-9999999 最大值:99999999 数组长度:3 - 3 size 是 Array of floats 口袋尺寸大小;
最大长度:10000000 表9 BoundingBoxDto 参数 参数类型 描述 center Array of floats 口袋中心坐标; x, y, z轴的坐标。 最小值:-9999999 最大值:99999999 数组长度:3 - 3 size Array of floats 口袋尺寸大小;
以下类型镜像,建议您通过Docker Hub获取,不建议自己制作。 基础操作系统类镜像,如Ubuntu、Suse、Centos等。 基础编程语言类镜像,如Java、Python、R语言等。 基础通用类软件镜像,如Tomcat、Mysql、Ngnix等。 获取创建Notebook的镜像 创建Note
file 以HTML的格式输出易于阅读的质控报告。 bwa-mem 输入参数 fq-file1 file 测序得到的fastq1文件。 fa-file2 file 测序得到的fastq2文件。 ref-file file 参考基因组序列。 seq-platform string 测序平台,如MGI、Illumina。
最小长度:0 最大长度:24 表8 VertexLocationDto 参数 参数类型 描述 x Double 子任务的画布横坐标 y Double 子任务的画布纵坐标 表9 TaskParameterDto 参数 参数类型 描述 name String 子任务的参数名称,长度为[1,3
深度等。 低质量Reads过滤 过滤低质量的测序Reads,得到Clean Reads。 基因组比对 将Clean Reads比对到参考基因组上,同时输出比对率、深度、覆盖度的统计信息。 基因组变异检测 基于上述比对得到的bam文件,通过GATK4做Variant Calling,输出变异检测结果。
最小长度:0 最大长度:24 表7 VertexLocationDto 参数 参数类型 描述 x Double 子任务的画布横坐标 y Double 子任务的画布纵坐标 表8 TaskParameterDto 参数 参数类型 描述 name String 子任务的参数名称,长度为[1,3
提高了测序速度。目前NGS已经普遍的应用于全基因组测序、全外显子测序、转录组测序、表观遗传学等领域。 该流程以NGS得到的fastq作为输入,通过质控,比对,得到比对后的bam文件,及对fastq和bam文件的质控报告。 Docking Summary 对一组小分子化合物配体和一
sha256。 安装eihealth-toolkit 本示例中以Windows系统为例,介绍安装命令行工具的方法。 获取Windows版本的命令行工具,得到health.exe文件,health文件无需安装,放置在任一文件夹中即可。 图1 下载命令行工具 使用win键+R,输入cmd打开win
Read Quality 对测序得到的fastq数据进行质控。 fastp:0.20.1 docker pull biocontainers/fastp:v0.20.1_cv1 Mapping and Sort and index 将质控之后得到的Clean Reads比对到参考基因组上。
模型训练:针对提供的数据和模型参数,AutoGenome会搜索得到最优的神经网络结构。训练过程经过模型搜索阶段和模型训练阶段,在模型搜索阶段,根据json文件中的配置参数,对于选定的模型参数会训练一定步数,搜索得到较好结果的参数进行后续训练。训练过程中可选择在验证数据集上进行评估,评估结果更好的模型参数将会保留。