检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
非分离部署推理服务 本章节介绍如何使用vLLM 0.6.3框架部署并启动推理服务。 什么是非分离部署 全量推理和增量推理在同一节点上进行。 前提条件 已准备好DevServer环境,具体参考资源规格要求。推荐使用“西南-贵阳一”Region上的DevServer和昇腾Snt9b资源。
创建节点池 功能介绍 该API用于在指定集群下创建节点池。仅支持集群在处于可用、扩容、缩容状态时调用。 1.21版本及以上的turbo网络类型的集群创建节点池时支持绑定安全组,每个节点池最多绑定五个安全组。 更新节点池的安全组后,只针对新创的pod生效,建议驱逐节点上原有的pod。
更新指定节点池 功能介绍 该API用于更新指定的节点池。仅支持集群在处于可用、扩容、缩容状态时调用。 集群管理的URL格式为:https://Endpoint/uri。其中uri为资源路径,也即API访问的路径 当前仅支持更新节点池名称,spec下的initialNodeCoun
连接数据库 在创建数据库连接之后,才能使用它来执行SQL语句操作数据。 函数原型 JDBC提供了三个方法,用于创建数据库连接。 DriverManager.getConnection(String url) DriverManager.getConnection(String url
分离部署推理服务 本章节介绍如何使用vLLM 0.6.3框架部署并启动推理服务。 什么是分离部署 大模型推理是自回归的过程,有以下两阶段: Prefill阶段(全量推理) 将用户请求的prompt传入大模型,进行计算,中间结果写入KVCache并推出第1个token,属于计算密集型。
创建节点 功能介绍 该API用于在指定集群下创建节点。 若无集群,请先创建集群。 集群管理的URL格式为:https://Endpoint/uri。其中uri为资源路径,也即API访问的路径。 接口约束 仅支持创建KVM虚拟化类型的节点,非KVM虚拟化类型的节点创建后无法正常使用。
删除节点池 功能介绍 该API用于删除指定的节点池。 集群管理的URL格式为:https://Endpoint/uri。其中uri为资源路径,也即API访问的路径 调用方法 请参见如何调用API。 URI DELETE /api/v3/projects/{project_id}/
获取指定的节点池 功能介绍 该API用于获取指定节点池的详细信息。 集群管理的URL格式为:https://Endpoint/uri。其中uri为资源路径,也即API访问的路径 调用方法 请参见如何调用API。 URI GET /api/v3/projects/{project_
创建集群并提交作业 功能介绍 创建一个MRS集群并提交作业,并支持作业完成后删除集群,支持MRS 1.8.9及以上集群版本使用。使用接口前,您需要先获取下的资源信息。 通过VPC创建或查询VPC、子网 通过ECS创建或查询密钥对 通过终端节点获取区域信息 参考MRS服务支持的组件获取MRS版本及对应版本支持的组件信息
获取集群下所有节点池 功能介绍 该API用于获取集群下所有节点池。 集群管理的URL格式为:https://Endpoint/uri。其中uri为资源路径,也即API访问的路径 nodepool是集群中具有相同配置的节点实例的子集。 调用方法 请参见如何调用API。 URI GET
连接数据库 在创建数据库连接之后,才能使用它来执行SQL语句操作数据。 函数原型 JDBC提供了三个方法,用于创建数据库连接。 DriverManager.getConnection(String url) DriverManager.getConnection(String url
数据湖探索 DLI 服务中的(Service Control Policy,以下简称SCP)可以使用以下授权项元素设置访问控制策略。 SCP不直接进行授权,只划定权限边界。将SCP绑定到组织单元或者成员账号时,并没有直接对组织单元或成员账号授予操作权限,而是规定了成员账号或组织单元包含的成员账号的授权范围。
连接参数参考 info参数连接的所有属性名称对大小写敏感。常用的属性如表1所示。 表1 info参数的连接属性 属性名称 属性说明 属性值 PGDBNAME 表示数据库名称(URL中无需配置该参数,自动从Properties文件中解析)。 属性类型:String PGHOST 主
设置建议:该参数不允许用户进行设置,只能查看。 设置不当的风险与影响:无 max_subpro_nested_layers 参数说明:嵌套子程序的最大嵌套深度。该参数可在PDB级别设置。 参数类型:整型 参数单位:无 取值范围:0 ~ 100 当设置为0时,不允许使用嵌套子程序。 默认值:3。在
分离部署推理服务 本章节介绍如何使用vLLM 0.6.0框架部署并启动推理服务。 什么是分离部署 大模型推理是自回归的过程,有以下两阶段: Prefill阶段(全量推理) 将用户请求的prompt传入大模型,进行计算,中间结果写入KVCache并推出第1个token,属于计算密集型。
分离部署推理服务 本章节介绍如何使用vLLM 0.5.0框架部署并启动推理服务。 什么是分离部署 大模型推理是自回归的过程,有以下两阶段: Prefill阶段(全量推理) 将用户请求的prompt传入大模型,进行计算,中间结果写入KVCache并推出第1个token,属于计算密集型。
分离部署推理服务 本章节介绍如何使用vLLM 0.6.0框架部署并启动推理服务。 什么是分离部署 大模型推理是自回归的过程,有以下两阶段: Prefill阶段(全量推理) 将用户请求的prompt传入大模型,进行计算,中间结果写入KVCache并推出第1个token,属于计算密集型。
文档修订记录 修订记录 发布日期 第一百五十九次正式发布。 本次变更说明如下: “伙伴信息管理 > 管理基本信息”章节新增修改公司信息(基本信息)。 “伙伴组织管理 > 项目专员 > 伙伴管理员 > 邀请成员”章节新增项目专员数据概览。 “伙伴权益申请 > 专职人员激励(FH) >
数据仓库服务 GaussDB(DWS) Organizations服务中的服务控制策略(Service Control Policy,以下简称SCP)可以使用以下授权项元素设置访问控制策略。 SCP不直接进行授权,只划定权限边界。将SCP绑定到组织单元或者成员账号时,并没有直接对
其它函数 pgxc_pool_check() 描述:检查连接池中缓存的连接数据是否与pgxc_node一致。 返回值类型:Boolean pgxc_pool_reload() 描述:更新连接池中缓存的连接信息。 返回值类型:Boolean reload_active_coordinator()