检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
功能总览 功能总览 全部 鲲鹏系列实例 通用计算型实例S系列 通用计算增强型实例C系列 内存优化型实例M系列 GPU加速型实例 ECS计费模式 竞价计费型实例 竞享计费型实例 购买ECS 规格选型引导 开启/关闭超线程 定时删除实例 智能购买助手 设置有序的云服务器名称 重置密码
开始使用 请根据云服务器操作系统类型选择部署指导方案。 Centos环境安装与部署 检查Master节点基础环境安装配置情况。 登录Master节点。centos系统登录时请采用"root"身份登录。 图1 root身份登录 使用如下命令查看环境初始化日志文件,检查相关软件及环境是否安装配置完成
超高I/O型 超高I/O型实例类型总览 超高I/O型弹性云服务器使用高性能NVMe SSD本地磁盘,提供高存储IOPS以及低读写时延,您可以通过管理控制台创建挂载有高性能NVMe SSD盘的弹性云服务器。 该类型弹性云服务器默认开启超线程,每个vCPU对应一个底层超线程HT(Hyper-Threading
获取集群下所有节点池 功能介绍 该API用于获取集群下所有节点池。 集群管理的URL格式为:https://Endpoint/uri。其中uri为资源路径,也即API访问的路径 nodepool是集群中具有相同配置的节点实例的子集。 调用方法 请参见如何调用API。 URI GET
错误码 功能说明 所有的扩展接口发生400错误时,会有自定义错误信息返回,该节为您介绍每个错误码的含义。 返回体格式 STATUS CODE 400 1 2 3 4 5 6 { "error": { "message": "The imagetype is
非分离部署推理服务 本章节介绍如何使用vLLM 0.6.0框架部署并启动推理服务。 什么是非分离部署 全量推理和增量推理在同一节点上进行。 前提条件 已准备好Server环境,具体参考资源规格要求。推荐使用“西南-贵阳一”Region上的Server和昇腾Snt9b资源。 安装过程需要连接互联网
连接参数参考 info参数连接的所有属性名称对大小写敏感。常用的属性如表1所示。 表1 info参数的连接属性 属性名称 属性说明 属性值 PGDBNAME 表示数据库名称(url中无需配置该参数,自动从Properties文件中解析)。 属性类型:String PGHOST 主机
创建集群 功能介绍 创建一个MRS集群。使用接口前,您需要先获取下的资源信息。 通过VPC创建或查询VPC、子网 通过ECS创建或查询密钥对 通过终端节点获取区域信息 参考MRS服务支持的组件获取MRS版本及对应版本支持的组件信息 接口约束 无 调用方法 请参见如何调用API。 URI
非分离部署推理服务 本章节介绍如何使用vLLM 0.6.0框架部署并启动推理服务。 什么是非分离部署 全量推理和增量推理在同一节点上进行。 前提条件 已准备好Server环境,具体参考资源规格要求。推荐使用“西南-贵阳一”Region上的Server和昇腾Snt9b资源。 安装过程需要连接互联网
非分离部署推理服务 本章节介绍如何使用vLLM 0.6.3框架部署并启动推理服务。 什么是非分离部署 全量推理和增量推理在同一节点上进行。 前提条件 已准备好Server环境,具体参考资源规格要求。推荐使用“西南-贵阳一”Region上的Server和昇腾Snt9b资源。 安装过程需要连接互联网
创建集群并执行作业 功能介绍 创建一个MRS集群,并在集群中提交一个作业。该接口不兼容Sahara。 (建议优先使用创建集群V2接口和创建集群并提交作业V2接口来完成创建集群或创建集群并提交作业的功能) 支持同一时间并发创建10个集群。 使用接口前,您需要先获取下的资源信息。 通过
CREATE TABLE PARTITION 功能描述 创建分区表。逻辑上的一张表根据某种方案分成几张物理块进行存储,这张逻辑上的表称之为分区表,物理块称之为分区。分区表是一张逻辑表,不存储数据,数据实际是存储在分区上的。 常见的分区策略包括:范围分区(Range Partitioning
CREATE TABLE PARTITION 功能描述 创建分区表。逻辑上的一张表根据某种方案分成几张物理块进行存储,这张逻辑上的表称之为分区表,物理块称之为分区。分区表是一张逻辑表,不存储数据,数据实际是存储在分区上的。 常见的分区策略包括:范围分区(Range Partitioning
新规格实例的规格变更 功能介绍 实例规格变更。 当前通过调用API,只支持按需实例进行实例规格变更。 调用方法 请参见如何调用API。 URI POST /v2/{engine}/{project_id}/instances/{instance_id}/extend 表1 路径参数
获取指定的集群 功能介绍 该API用于获取指定集群的详细信息。 集群管理的URL格式为:https://Endpoint/uri。其中uri为资源路径,也即API访问的路径。 调用方法 请参见如何调用API。 URI GET /api/v3/projects/{project_id
更新指定ID任务详情 功能介绍 更新租户指定ID任务详情。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 接口约束 目前仅支持Redis->GeminiDB Redis迁移、
连接参数参考 info参数连接的所有属性名称对大小写敏感。常用的属性如表1所示。 表1 info参数的连接属性 属性名称 属性说明 属性值 PGDBNAME 表示数据库名称(URL中无需配置该参数,自动从Properties文件中解析)。 属性类型:String PGHOST 主机
云管理网络 (*):该特性需要跳转至旧版云管理网络界面操作。 表1 华为乾坤云管理网络解决方案规格清单 一级分类 二级分类 三级分类 四级分类 规格名称 规格描述 网络数字地图 全网资源可视 GIS地图 站点位置 - 站点在GIS地图基于经纬度呈现,站点的tips支持呈现设备、应用
获取指定项目下的集群 功能介绍 该API用于获取指定项目下所有集群的详细信息。 调用方法 请参见如何调用API。 URI GET /api/v3/projects/{project_id}/clusters 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是
自定义指标列表 指标名称 指标描述 指标返回参数 指标返回参数类型 指标返回参数描述 AbnormalJob 异常作业监控统计 ctime Timestamp 采集时间。 virtual_cluster_id Integer 集群虚拟ID。 query_id String 查询ID