检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
您可以在Notebook工作目录中上传数据,使用AutoGenome工具。数据上传下载请参见数据的上传和下载。 对于非挂载目录以外的目录下的文件,重启Notebook后会消失。例如,上传文件至Notebook的根目录下,该文件并不在被挂载的obs路径中,重启Notebook,该文件会消失。 图3 Upload上传数据
订阅的流程将显示在“项目管理 > 工具”页面的流程列表中。 步骤2:上传待分析数据 您在使用NGS流程前,请先上传待分析的数据,上传数据方法请参见数据管理。数据要求是成对的双端测序样本,即您需要上传两个样本数据文件,例如:xxx.R1.fastq.gz和xxx.R2.fastq.gz。
String 作业id。 limit_concurrency Integer 限制的并发量。 请求示例 创建靶点优化作业,作业名称为demo-job,受体文件为project:/dir/file,配体文件为project:/dir/file,时间步长为2fs,温度为300k,能量最
通过引用本地标准的workflow yaml文件创建workflow。 命令结构 health nextflow create workflow [params] 表1 参数说明 参数 简写 是否必选 说明 --workflow -w 是 本地workflow文件路径,可以是zip或nf文件。 --name
最大长度:512 数组长度:10 - 10000 molecule_file 否 DrugFile object 分子文件,分子表达式列表和分子文件二选一,分子文件优先级最高。 binding_sites 否 Array of BindSiteDto objects 靶点列表。 数组长度:0
file cannot be none. 检查上传的nextflow流程文件是否已选择。 400 eihealth.01090002 The nextflow workflow cannot be empty. 检查上传的nextflow流程文件内容是否已填写。 400 eihealth
流程”列表可以看到刚刚订阅的流程。 图2 查看订阅的流程 步骤2:订阅数据 若您本地有需要分析的二代基因组数据,则您可以用本地的数据。数据上传方法请参见上传数据。 若没有,可以先订阅资产市场里的示例数据进行分析,这里先用资产市场中的“人类基因组数据”和“NGS小数据集”进行分析。 图3 订阅数据
--simple -s 否 以精简格式显示查询结果,返回结果只包含对象名。 --recursive -r 否 递归列举本项目文件夹中的所有文件和子文件夹。 --v -v 否 列举桶内多版本对象,列举结果包含最新版本的对象和历史版本的对象。 --marker -M 否 列举桶内对
fasta格式文件,最多上传1个文件,文件中最多支持100条氨基酸序列,每个靶点的氨基酸序列长度不超过2048。 pdb格式文件,最多上传100个靶点文件,如果上传多聚体靶点,仅解析第一条链,每个靶点的氨基酸序列长度不超过2048。 图2 靶点配置选择文件 输入PDB ID,最多输入100个PDB
是 Array of DockingReceptorDto objects 受体文件列表。 数组长度:1 - 20 ligands 是 Array of LigandDto objects 配体文件列表,当前仅支持1个。 数组长度:1 - 1 engine 否 String 引擎
模型数据文件来源。 枚举值: public private url 是 String 文件URL,用户私有数据中心为项目路径、公共数据场景为obs地址。 最小长度:1 最大长度:2000 eihealth_project_id 否 String 模型文件所在项目id,仅文件为数据中心时填写。
workflow_id 是 String 作业依赖的流程id 最小长度:0 最大长度:135 params 否 File 流程参数列表文件,取值范围[0, 10M] priority 否 Integer 作业的优先级,取值范围[0,9],0最低,默认数值0 最小值:0 最大值:9 缺省值:0
创建数据库 创建数据库 数据库支持使用.csv、.txt、.vcf文件生成数据库。创建的数据库需要保证数据文件与模板对应。创建数据库时,可以不选择导入的数据文件,建立空的数据库,后期可以新增数据行或者导入数据。如果使用自动作业的数据表创建数据库,在导入数据,需要参照数据库模板格式进行导入。
fastq目录,包含待分析的fastq格式的文件。 fastq-extend string fastq文件后缀<extend>,适配不同的后缀。 read-cmd string 读取输入文件时使用的命令,如读取.gz文件使用zcat,文本文件使用cat。 para-str string
存放配体3D sdf文件的文件,默认文件名为3d.sdf。 输出参数 dir-out directory 转换后存放配体pdbqt文件的文件夹。 receptor-pdb-to-pdbqt 输入参数 dir-in directory 受体的pdb文件所在的文件夹。 输出参数 dir-out
选择一个文件上传。 图7 上传文件 编辑文件 JupyterLab可以在同一个窗口同时打开几个Notebook或文件(如HTML、TXT、Markdown等),以页签形式展示。 JupyterLab的一大优点是,可以任意排版多个文件。在右侧文件展示区,您可以拖动打开文件,随意调整文件展示位置,可以同时打开多个文件。
二代测序fastq的Read1文件。 fastq-file2 file 二代测序fastq的Read2文件。 输出参数 fq-file1 file Read1过滤之后输出fq.gz文件。 fq-file2 file Read2过滤之后输出fq.gz文件 json-file file 以JSON文件的格式输出的质控报告。
在配置页面输入分子信息,及配置相关参数。 输入方式:支持绘制分子、选择文件、手动输入。 绘制分子:只能绘制一个分子,能够输入分子的SMILES。 选择文件:选择分子文件,最多支持100万个小分子,且分子文件大小不超过2GB。支持SDF、MOL2、PDB、SMI格式。文件来源包括数据中心和示例数据。 手动输入:
递归下载项目中src文件夹中的所有文件和文件夹(包含src文件夹本身)至本地data路径,且下载过程中不进行询问提示。 health download /src/ D:\local\data -r -f 递归下载项目中src文件夹中的所有文件和文件夹(不包含src文件夹本身)至本地d
单击“操作”列的“更多>删除”,删除数据。 图8 删除数据 批量删除 勾选文件名左侧图标,单击“删除”,删除数据。 图9 批量删除 批量删除时,若选择的文件包含禁止删除的文件或文件夹,则这些文件或文件夹会删除失败,其他文件/文件夹删除正常。 恢复数据 平台支持数据的恢复机制,您可以将归档的核心数据进行恢复,避免造成损失。