云服务器内容精选

  • 为什么下载的部分靶点文件,显示不完整 由于molstar插件自身问题,部分靶点文件中存在REMARK行,会导致受体展示不完整。可通过手动删除文件中REMARK行来解决该问题。 如下所示: 分子优化靶点设置界面,受体展示正常。 但是下载该靶点文件后,使用通用工具Mol 3D Viewer打开,会出现蛋白显示不完整的情况,如下图所示。 此时可将受体文件中的REMARK行进行删除,即可解决该问题。 父主题: 盘古辅助药物
  • 不同类型的归档,费用分别是多少? 选择归档存储类别涉及以下三种计费: 归档类别数据的存储费用 恢复归档数据的流量费用 提前删除归档数据(不满90天)收取的费用 存储类型 存储空间(按需) 存储套餐包(1TB 1年) 数据取回(直读) 数据取回(加急/标准) 删除对象 标准存储 0.0990元/GB/月 828元 不涉及 不涉及 不涉及 归档存储 0.0330元/GB/月 279元 0.2000元/GB 0.0600元/GB 恢复完成后,会同时收取标准+归档存储两份钱。 存储空间单价*容量*剩余天数/30。超过90天不需要补。 用户每次恢复归档数据,按照流量收取费用。 用户的归档存储类型的归档数据不足90天删除,需收取相应费用,费用参照OBS存储费用。 用户可将归档数据恢复到项目桶,恢复到项目桶后,平台不会进行删除(恢复到项目桶中的数据会正常收取标准存储的费用)。 在归档管理页面,可以在“归档天数”列查看已归档天数(从归档拷贝完成时间开始算)。若用户早于90天删除归档数据,将收取费用,收取的费用=对应存储类别存储空间按需月单价*容量*剩余天数/30,超过90天不需要补。 父主题: 计费
  • 几种不同类型的归档,区别是什么? 标准存储 标准存储访问时延低和吞吐量高,因而适用于有大量热点文件(平均一个月多次)或小文件(小于1MB),且需要频繁访问数据的业务场景。 适合高性能,高可靠,高可用,频繁访问场景。 归档存储 归档存储适用于很少访问(平均一年访问一次)数据的业务场景,例如:数据归档、长期备份等场景。归档存储安全、持久且成本极低,可以用来替代磁带库。为了保持成本低廉,数据取回时间可能长达数分钟到数小时不等。 归档数据的长期存储,存储单价更优惠。 父主题: 数据管理
  • 实名认证类型介绍 表1 实名认证详细介绍 账号类型 认证类型(任选一种类型) 详细操作指导 个人账号 推荐扫码认证(即时完成认证) 请参见如何进行扫码认证。 银行卡认证(即时完成认证) 请参见如何进行银行卡认证。 证件认证(1-3个工作日) 请参见如何进行证件认证。 企业账号 推荐银行对公账户认证(最快30分钟) 请参见如何进行企业银行对公账户打款认证。 企业证件认证(0-3个工作日) 请参见如何进行企业证件认证。
  • 保留期与欠费 套餐包到期后,如果账号欠费,会根据“客户等级”和“订购方式”定义不同的保留期时长,保留期内您将不能进行资源访问,保留期内资源处理和费用详见“保留期”。保留期满仍未续订或充值,数据将被删除且无法恢复。 当平台处于冻结状态,且资源不再使用,您可以进入 EIHealth 控制台,在操作列的“更多”中手动删除或释放平台。 图1 删除平台(按需计费) 图2 释放平台(包年包月计费) 父主题: 计费
  • 平台计费方式 基因平台 基因平台提供包年包月、按需两种计费方式,您可以按需求进行选择,计费详情请参见价格计算器。 盘古辅助制药平台 盘古辅助制药平台提供包年包月、按需两种计费方式,您可以按需求进行选择,计费详情请参见价格计算器。 OBS数据下载 OBS数据下载产生的流量费用为按需计费,计费详情请参考OBS流量费用中“公网流出流量 / 00:00-08:00(闲时)”和“公网流出流量 / 08:00-24:00(忙时)”。 父主题: 计费
  • 在Terminal中安装 例如,通过terminal在“TensorFlow-1.8”的环境中使用pip安装Shapely。 打开一个Notebook实例。 在Jupyter控制面板中,选择“New”(新建)然后选择“Terminal”。 在代码输入栏输入以下命令,获取激活TensorFlow-1.8的命令并激活环境。 cat /home/ma-user/README source /home/ma-user/anaconda3/bin/activate TensorFlow-1.8 如果使用其他引擎,请将命令中“TensorFlow-1.8”替换为其他引擎的名称及其版本号。 图1 激活环境 在代码输入栏输入以下命令安装Shapely。 pip install Shapely
  • OBS存储类型的Notebook 在创建Notebook时,如果“存储配置”选择的是“OBS”。Notebook列表的所有文件读写操作是基于所选择的OBS路径下的内容操作,即Notebook中的数据和OBS中的数据是同步的。在OBS路径中创建文件夹、上传数据,会同步到Notebook中,Notebook中的操作也会同步到OBS中,如图2所示。 图2 通过OBS同步数据 “Upload”上传数据大小受限时,您可以通过以下多种方式将文件上传到OBS中,通过OBS与Notebook进行数据同步。 表1 上传数据方法 上传方法 说明 “数据”页面上传 通过“数据”页面上传数据,支持上传最大为1GB的单个文件。 使用命令行工具上传 命令行工具(eihealth-toolkit)配套EIHealth平台,提供数据、应用、流程和作业资源的管理和使用,支持上传最大为48.8TB的单个文件。
  • 步骤2:制作镜像 方法1:直接下载官方的FastQC镜像。 执行如下命令下载FastQC镜像。 docker pull biocontainers/fastqc:v0.11.5 方法2:通过Dockerfile制作FastQC镜像。 执行vi Dockerfile命令,进入Dockerfile文件中,编写文件。 FROM ubuntu:16.04 # FastQC依赖java运行,需安装java环境。安装执行下载、解压缩的软件包 RUN apt-get update && apt-get upgrade -y \ && apt-get install -y default-jre perl wget zip # 下载FastQC,解压缩,设置FastQC可执行权限 RUN wget https://www.bioinformatics.babraham.ac.uk/projects/fastqc/fastqc_v0.11.5.zip \ && unzip fastqc_v0.11.5.zip \ && rm fastqc_v0.11.5.zip \ && chmod +x /FastQC/fastqc # 将FastQC添加到环境变量中 ENV PATH "/FastQC:$PATH 按Esc键,并执行:wq退出Dockerfile。 制作镜像。 docker build -t fastqc:v0.11.5 . 详细的Dockerfile指令请参见Dockerfile参考。
  • 步骤4:创建应用 在“项目管理”页面“工具”页签中,单击“新建应用”。 填写应用的基本信息。 “名称”填写fastqc,“版本”填写v0.11.5.2。“短描述”、“描述”、“标签”可选填。 图2 填写基本信息 选择镜像。 单击“选择镜像”,在“ 自定义镜像 ”列表中选择fastqc镜像和镜像版本。 依据FastQC命令说明填写镜像启动命令。 镜像启动命令需要引用输入、输出参数中的变量,并以大括号扩起,以$符号进行引用。 fastqc软件输入参数填写为input-file、threads,输出参数为output-dir,则镜像启动命令如下所示。 使用-t命令,指定运行所需的线程数量。-o命令,指定存放输出结果的文件夹。输入文件夹已在填写参数时指定。 fastqc -t ${threads} -o ${output-dir} ${input-file} 选择“X86”CPU架构,CPU需求建议0.2起。GPU类型选择“无”。 按需填写内存大小,单位为GB。FastQC运行中所需内存大小依赖于输入数据大小,建议至少1GB。 图3 CPU、内存、GPU 填写参数。 通过阅读FastQC命令说明,了解命令。 图4 FastQC命令 填写所需的输入参数。 图5 输入参数 填写所需的输出参数。 因镜像启动命令中指定了输出参数,设置输出参数时,需勾选“必传”,并填写“默认值”。例如,输出结果默认存放在fastqc_output文件夹中。 图6 输出参数 单击“立即创建”,完成fastqc应用的创建。 创建完成后的应用,将显示在应用列表中,您可以使用该应用创建分析作业。
  • 步骤1:搭建Docker环境 搭建Docker环境,您可以任选以下两种方式搭建Docker环境。 使用自己的电脑搭建Docker环境。 使用华为云弹性 云服务器ECS 搭建Docker环境。 本示例中使用华为云弹性服务器E CS ,并通过ECS搭建Docker环境。在创建ECS时,可以选择ECS的操作系统。例如,在Linux操作系统下,可以使用如下命令快速安装容器引擎。 curl -fsSL get.docker.com -o get-docker.sh sh get-docker.sh 检查安装结果。 执行docker --version命令,如果显示如下类似信息,表示Docker安装成功。 图1 Docker安装成功
  • 快照方式制作镜像 如果后续镜像没有变化,可通过快照方式制作镜像。 快照方式制作镜像示例: 本示例中使用华为云弹性云服务器服务(ECS)创建一台云服务器,并使用快照方式制作bwa镜像。 购买弹性云服务器。 云服务器创建成功后,在云服务器列表页,选中待登录的弹性云服务器。单击“远程登录”,输入ECS初始账号,登录ECS。 图1 云服务器列表 安装容器引擎。 例如,在Linux操作系统下,可以使用如下命令快速安装容器引擎。 curl -fsSL get.docker.com -o get-docker.sh sh get-docker.sh 启动一个空白的基础容器,并进入容器。 例如,启动一个CentOS容器。 docker run -it centos 安装依赖包。 yum -y install https://dl.fedoraproject.org/pub/epel/epel-release-latest-8.noarch.rpm yum -y install git yum -y install gcc automake autoconf libtool make yum install -y zlib zlib-devel 安装bwa软件,在github上下载bwa的源代码,并使用make编译。 yum install bwa git clone https://github.com/lh3/bwa.git cd bwa;make 请预先安装好Git,并检查本机是否有ssh key设置。 输入exit退出容器。 查询容器id。 docker ps -a 制作快照。 docker commit -m "xx" -a "tsj" container-id tsj/image:tag 例如:docker commit -m "test" -a "username" adb1127979a1 bwa:v0.7 -a:提交的镜像作者,例如tsj。 container-id:容器id。 -m:提交时的说明文字,例如xx。 tsj/image:tag:仓库名/镜像名:TAG名,名称可自定义。 执行docker images查看制作完成的Docker镜像。
  • 操作步骤 登录华为云管理控制台,鼠标指向页面右上角的用户名,在下拉列表中单击“我的凭证”。 图1 我的凭证入口 在“我的凭证”页面中选择“访问密钥”页签。单击“新增访问密钥”,按操作指引获取认证账账号的AK/SK,请妥善保管AK/SK信息。 图2 访问密钥 每个用户仅允许新增两个访问密钥。 为保证访问密钥的安全,访问密钥仅在初次生成时自动下载,后续不可再次通过管理控制台页面获取。请在生成后妥善保管。
  • 分子生成 分子生成基于盘古药物分子大模型,对初始数据集进行采样,多目标、多方向的快速生成新颖且与靶点蛋白亲和力高的化合物。 单击“分子生成”功能卡片,进入配置页面。 输入初始数据集,有两种输入方式: 选择文件:支持SDF、MOL2、PDB、SMI格式文件;小分子支持10-10000个。如果没有初始数据集,可以选择官方库,ZINC数据集。 图1 输入初始数据集 手动输入:最少输入10行,最多输入10000行,每行字符不超过512;SMILES不支持输入空格或者中文 单击“下一步”,进入靶点设置,此步骤为可选步骤,如果需要设置靶点,并且将对接结合能作为一个约束条件进行分子生成,需要进行配置。最多可添加2个靶点。 如果不需要设置靶点,此步骤可以进行省略,如果设置了靶点,作业运行时间会加长。 通过“靶点设置”上传靶点,并且设置对接口袋。 此处靶点设置为可选参数,如果选择靶点设置,可以将对接活性作为一个约束条件进行分子生成。靶点1对应的约束条件是target1_binding_energy,靶点2对应的约束条件是target2_binding_energy 您可以通过“上传靶点”,将受体文件上传。受体文件仅支持pdb格式的文件,提交任务时系统会自动删除受体中包含水、配体和金属离子。删除受体文件后,运行任务时会跳过靶点设置步骤。 口袋设置。 原始配体: 将原始配体作为口袋位置,也可以通过上传配体文件来进行口袋设置。 选择残基 选择某些残基来作为口袋位置。 自动预测 如果没有受体口袋位置未知,可以使用自动预测软件来进行口袋位置预测。 全局对接 将整个受体作为口袋位置。 自定义 手动修改口袋位置和大小。 padding 口袋位置放大多少尺寸。 对接引擎类型:DSDP、AutoDock Vina 图2 靶点设置 图3 Target1设置 图4 Target2设置 图5 靶点设置完成 单击“下一步”,进入参数设置页面。 选择基模型:支持选择基模型。此参数仅专业版支持。如果选择的基模型是非官方盘古药物大模型,则约束条件不支持官方机器学习属性,只支持以该基模型创建的属性模型作为约束条件。基模型列表见AI建模。 选择属性模型:选择AI模型。如果需要创建模型,可参考AI模型。此参数只有专业版支持。一次最多可以选10个模型属性。属性模型的基模型必须与上一步所选择的基模型一致。 设置强约束、弱约束的参数和参数值,相关参数含义见相关参数章节。 强约束:生成的小分子必须要满足的约束条件。强约束用于严格筛选输出分子,若分子不满足其中任何一条约束则会被直接丢弃。强约束条件个数1~3个最佳,不宜过多,过多的强约束会导致输出结果数量少于预期或者没有分子生成。如果设置的官能团结构太大,建议放到弱约束,因为这样设置会使模型可探索的区间比较小,导致可能没有结果生成。 弱约束:生成的小分子不必要满足的约束条件。弱约束用于打分排序最终结果,输出分子会按照弱约束顺序尽可能多地满足所有弱约束;不满足弱约束的结果依然会被保留在结果中,对于一个比较关注且重要的分子属性,建议放到强约束条件设置里,因为弱约束不会做过滤。 如果进行了“靶点设置”,会自动加上相应靶点的“Binding Free Energy”才会计算对接结合能,并将对接结合能作为约束条件进行分子生成。 您可以通过“添加”来添加新的约束条件,也可以在操作列单击删除图标,删除约束参数。每个约束参数的含义参考相关参数。 强约束最多选择5个,仅Substructure和Interaction参数可重复选择,其余不可以;弱约束最多选择10个,可以重复选择,弱约束的初始权重与弱约束的顺序有关,弱约束条件越靠前则初始权重越大。 输出个数:选择输出个数,目前支持500、1000、5000。输出个数越多,任务时间越长。 名称:可修改,修改后左上角也同步修改。长度为5~64个字符;仅可以使用字母、数字、下划线“_”、中划线“-”和空格;首位只能以数字或字母开头。 标签:设置任务标签。 功能调用消耗:运行一次功能会消耗一次。 生成后的小分子在满足强约束条件的基础上,会根据满足弱约束条件的权重总和以及与参考小分子的相似度来打分并进行排序。在初始化权重的基础上,每个约束所占的权重,会在每一轮的分子生成迭代中,根据所满足的约束来进行动态调整。比如说约束条件1,在分子生成迭代中比较容易满足,那么该条件的权重会降低,如果不容易满足,该条件的权重会升高。 如果需要设置官能团的约束,可以在约束条件中设置“Substructure”,然后选择“包含”或者“排除”,包含官能团或者去除官能团条件,设置1个官能团数为佳。在官能团设置中,可以单击蓝色按钮来设置生长方向,即我们所生成的分子只会往我们所标记的方向生长。如果在一个Substructure约束条件里面添加多个官能团,则官能团之间的关系是“或”,即生成的分子满足其中一个官能团即可。如果添加多个Substructure约束,则官能团之间的关系是“和”,即生成的分子都会满足这几个官能团。 如果需要设置相互作用力的约束,可以在约束条件中设置“Interaction”,然后选择“包含”或者“排除”,包含相互作用力或者去除相互作用力。在相互作用力约束条件设置中,可以选择相应的靶点、氨基酸和相互作用力,相互作用力支持H bond,Hydrophobic,Salt Bridge,Pi Stacking,Pi Cation。如果在一个Interaction约束条件里面添加多个相互作用力,则相互作用力之间的关系是“或”,即生成的分子满足其中一个相互作用力即可。如果添加多个Interaction约束,则相互作用力之间的关系是“和”,即生成的分子都会满足这几个相互作用力。 约束方式,包含“区间”,“最大化”和“最小化”种方式,“区间”指的是我们所选择的属性包含在我们所设置的参数设置区间内。“最大化”指的是我们所设置的属性越大越好,而不只是限定在某区间内,当我们无法判断属性应该设置在什么区间,但是属性越高,成药性越好,可以设置属性设置条件为最大化,这个只能在弱约束里面进行设置。“最小化”指的是所设置的属性越小越好,与最大化相反,也是只能在弱约束里面进行设置。 相似度分数,是利用ECFP4分子指纹计算生成后分子与原始分子的Tanimoto相似性。我们设置了禁止优化列表,禁止以高毒性为优化目标的属性优化,列表为:hERG Blockers,H-HT,DILI,AMES,Skin Sensitization,Carcinogencity,Eye Irritation,Eye Corrosion。 图6 参数设置页面 单击“提交”,提交任务。 分子生成结果支持以列表视图的形式进行查看 可以以列表的形式查看分子生成的作业,单击左上角“下载”,下载分子生成的结果或者分子3D构象。如果分子设置了靶点,可以下载小分子或复合物,若分子未设置靶点,只能下载小分子。小分子支持SDF和PDB格式,复合物只支持PDB格式。 分子生成对应的下游分析为分子搜索、分子优化和合成路径规划,如果分子设置了靶点,可以选择自由能微扰进行下游分析,通过单击“下游分析”可以进行创建。 如果添加了靶点,支持按照相互作用力进行高级筛选,单击进行条件配置。 单击可以收藏分子生成结果,收藏的结果可在收藏夹页直接查看。 图7 查看结果(1) 图8 高级筛选 下载操作会产生流量费用,具体可参考计费说明。 分子生成结果支持以卡片视图的形式进行查看,参考图10,在卡片视图中: 单击右上方的选择下拉框,可以选择分子的排序方式,将分子按照所选的排序方式进行展示。 图9 排序方式 单击每个分子卡片右上方的可以收藏分子生成结果,收藏的结果可在收藏夹页直接查看。 单击每个分子卡片右上方的,可以选择“查看详情”、“查看3D”、“下游分析”、“下载3D”。 查看详情:单击查看详情,跳转至分子详情页进行查看。 查看3D:查看分子的3D视图。 下游分析:分子生成对应的下游分析为分子搜索、分子优化和合成路径,如果分子设置了靶点,可以选择自由能微扰进行下游分析,单击“确定”即可创建。 下载3D:如果分子设置了靶点,可以单击“下载3D”下载生成的小分子或者复合物,如果分子未设置靶点,单击“下载3D”只能下载小分子。小分子下载支持SDF和PDB格式,复合物下载只支持PDB格式。 每个分子卡片上会展示相应分子序号与对应的参数Vina Score(有靶点)、Score、QED、SaScore Vina Score:代表分子如果添加了靶点,将会计算对接结合能,并按照Vina Score进行排序 Score:代表生成小分子的综合打分 QED:代表分子的成药性。 SaScore:代表合成可及性分数,旨在评估分子的合成难易程度。 图10 查看结果(2) 分子生成结果支持以3D视图的形式进行查看 单击“查看3D”,可以看到分子的3D构象,如果设置了靶点,还可以看到生成的小分子与靶点的结合构象。 如果上传了双靶点,可以通过切换来切换靶点,查看相应靶点和生成分子的结合构象。如果设置了两个靶点会默认下载两个靶点的结果。 图11 查看3D图 在查看3D的页面中,单击右侧的配体列表中,每个配体卡片右上角的,可以查看 查看详情:可以查看每个分子的属性信息和score。 查看属性:查看每个分子的基本属性。 查看2D相互作用图:查看靶点和分子之间的2D相互作用图,并且可以进行图片下载。 下游分析:分子生成对应的下游分析为分子搜索、分子优化和合成路径规划,如果分子设置了靶点,可以选择自由能微扰进行下游分析,单击“确定”即可创建。 下载3D:选择下载小分子或者复合物后,单击“确定”,小分子下载支持SDF和PDB格式,复合物只支持PDB格式。 查看分子详情 图12 查看分子详情 查看作业信息 单击“作业信息”切换到作业信息页签,可以查看作业的初始数据集、靶点信息与参数信息等。 图13 作业信息 父主题: 苗头化合物发现
  • CPI预测 CPI预测基于蛋白质的一级序列和化合物的2D结构进行靶点匹配,精确的预测化合物-蛋白相互作用。 单击“CPI预测”功能卡片,进入配置页面。 配置靶点文件。 支持3种输入方式,分别是输入氨基酸序列、选择文件、输入PDB ID 输入FASTA格式氨基酸序列,输入框最多支持输入100条氨基酸序列,每条氨基酸序列最多支持输入2048个字符。 图1 靶点配置输入氨基酸序列 选择文件,支持fasta格式和pdb文件。 fasta格式文件,最多上传1个文件,文件中最多支持100条氨基酸序列,每个靶点的氨基酸序列长度不超过2048。 pdb格式文件,最多上传100个靶点文件,如果上传多聚体靶点,仅解析第一条链,每个靶点的氨基酸序列长度不超过2048。 图2 靶点配置选择文件 输入PDB ID,最多输入100个PDB ID,用逗号或换行方式隔开;不区分大小写;如果输入多聚体靶点,仅解析第一条链;每个靶点的氨基酸序列长度不超过2048。 图3 靶点配置输入PDB ID 在配置页面输入分子信息,及配置相关参数。 输入方式:支持绘制分子、选择文件、手动输入。 绘制分子:只能绘制一个分子,能够输入分子的SMILES。 选择文件:选择分子文件,最多支持100万个小分子,且分子文件大小不超过2GB。支持SDF、MOL2、PDB、SMI格式。文件来源包括数据中心和示例数据。 手动输入:输入小分子SMILES表达式。最多支持输入1000行,每行最多输入1024个字符,SMILES不支持输入空格或者中文。 作业名称:设置作业名称。长度为5~64个字符,仅可以使用字母、数字、下划线“_”、中划线“-”和空格,首位只能以数字或字母开头。 标签:设置任务标签。 功能调用消耗:100000个小分子记一次功能调用。 配置完成后,单击“提交”。 提交成功后,可以在“作业中心”查看执行结果。 查看多对多运行结果。 如果是多受体对多配体,打开作业结果页面可以看到结合能二维矩阵,支持分别按照靶点和小分子进行排序。 图4 查看结果(1) 查看一对多运行结果。 单击受体结合能框,跳转到单受体对多配体的结果表页面,可以下载全量及单条CPI预测结果。 如果需要下载多个结果,可以选择结果后,单击左上角的“下载”。如果需要下载单条数据,单击数据操作列的“下载”即可。 下载操作将会产生流量费用,具体可参考计费说明。 单个受体对多个配体的结果页面有列表视图、卡片视图,支持搜索、高级筛选,排序等功能。每个小分子支持“查看详情”可以进入小分子的属性详情页;支持“下游分析”,可以进行分子属性预测、分子搜索、分子优化、合成路径规划分析。支持收藏功能,单击按钮,即可收藏CPI预测结果,收藏后可直接在收藏夹页查看。 图5 查看结果(2) 图6 查看结果(3) 查看作业信息页面。 从作业结果页面单击“作业信息”查看作业信息界面。 图7 查看作业信息 父主题: 苗头化合物发现