检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
部署推理服务 本章节介绍如何使用vLLM 0.6.3框架部署并启动推理服务。 前提条件 已准备好Lite k8s Cluster环境,具体参考准备环境。推荐使用“西南-贵阳一”Region上的Cluster和昇腾Snt9b资源。 安装过程需要连接互联网git clone,确保集群可以访问公网。
云上指定IP地址访问VPC外主机 应用场景 在不改变现有IDC网络组织架构的前提下,需要将网络组织架构迁移上云,并实现以IDC中指定IP地址访问外部资源。 在本最佳实践中,根据行业监管部门的要求,业务上云之后仍需要部门A定期以指定的IP地址(10.1.0.55)访问行业监管部门的主机,上传必要的监管数据。
产品模型(联通用户专用) 概述 产品模型(也称Profile)用于描述设备具备的能力和特性。开发者通过定义Profile,在物联网平台构建一款设备的抽象模型,使平台理解该款设备支持的服务、属性、命令等信息,如颜色、开关等。当定义完一款产品模型后,在进行设备注册时,就可以选择已在控制台上导入的产品模型。
座席汇总报表 操作步骤 以租户管理员角色或者质检员角色登录AICC,选择“报表 > 座席汇总报表”,可查询座席汇总报表信息。 图1 座席汇总报表 报表类型:包括日报、周报、月报。 报表时间:选择需要查询的报表时间。 日报:只能查询31天的数据。 周报:选择年份和周数。 月报:选择年份和月份。
客户端错误码 本章节介绍了SDK的客户端错误码HRtcErrorCode的详细信息。 表1 类成员说明 类成员 错误码 描述 错误原因 HRTC_ERR_CODE_SUCCESS 0 成功 - HRTC_ERR_CODE_SDK_INTERNAL_ERROR 90000001 SDK内部系统错误
约束与限制 云数据库 GeminiDB Redis在使用上有一些固定限制,用来提高实例的稳定性和安全性。 规格与限制 表1 规格说明 资源类型 规格 说明 CPU和内存规格 GeminiDB Redis支持Proxy集群版、Cluster集群版、主备版。 不同版本规格具体参见实例规格说明。
常见错误码 表1 SDKError枚举说明 变量 值 描述 UISDK_COMMON_ERROR 430100001 通用错误 UISDK_API_INVALID_PARAMETERS 430100002 参数错误 USG_ERR_PASSWORD 206010000 账号或密码错误
在Notebook调试环境中部署推理服务 在ModelArts的开发环境Notebook中可以部署推理服务进行调试。 Step1 准备Notebook 参考准备Notebook完成Notebook的创建,并打开Notebook。 Step2 准备权重文件 将OBS中的模型权重上传
获取指定函数流实例的元数据 功能介绍 获取指定函数流实例的元数据 调用方法 请参见如何调用API。 URI GET /v2/{project_id}/fgs/workflows/{workflow_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
信息模板实名认证失败如何处理? 信息模板实名认证的过程是华为云将您提交的实名认证材料上传至审核机构进行审核的过程。实名认证审核主要判断域名所有者信息和提交材料是否真实、完整、准确、一致。 主要审核以下内容: 域名所有者 证件类型 证件号码 实名认证材料 任何部分出现问题都会导致信
查看专享版实例详情 功能介绍 查看专享版实例详情 调用方法 请参见如何调用API。 URI GET /v2/{project_id}/apigw/instances/{instance_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
健康医疗数据通过EDS共享和安全管控实践 场景介绍 本实践以xx医疗集团和某慢病院交换“风湿病患者医疗数据”为例,指导用户在医疗场景中如何安全的进行数据交换。 图1 场景介绍 操作流程 图2 流程图 xx医疗集团开通交换数据空间,请参见xx医疗集团开通交换数据空间。 xx医疗集团
连接设置 介绍设置客户端和服务器连接方式相关的参数。 light_comm 参数说明:指定服务器是否使用轻量通信方式。 该参数指定服务器是否使用基于轻量锁和非阻塞socket的通信方式。该参数属于POSTMASTER类型参数,请参考表1中对应设置方法进行设置。 取值范围:布尔型 TRUE
修改网关规格 功能介绍 修改网关规格,当前仅支持按需计费网关。 调用方法 请参见如何调用API。 URI POST /v5/{project_id}/vpn-gateways/{vgw_id}/update-specification 表1 参数说明 名称 类型 是否必选 说明 project_id
YARN组件 为了实现一个Hadoop集群的集群共享、可伸缩性和可靠性,并消除早期MapReduce框架中的JobTracker性能瓶颈,开源社区引入了统一的资源管理框架YARN。 YARN是将JobTracker的两个主要功能(资源管理和作业调度/监控)分离,主要方法是创建一个全局的R
Python SDK使用指南(联通用户专用) 非联通用户请查看设备接入服务。 本文以提供的应用侧Python SDK Demo为例说明如何使用Python SDK与物联网平台对接。Demo以Python工程为例,以invokeapiTest下的每个类都包含了main方法,可单独运行,旨在演示如何调用SDK接口。
修改API 功能介绍 修改指定API的信息,包括后端服务信息。 调用方法 请参见如何调用API。 URI PUT /v2/{project_id}/apigw/instances/{instance_id}/apis/{api_id} 表1 路径参数 参数 是否必选 参数类型 描述
创建后端API脚本 功能介绍 在某个实例中创建后端API脚本。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI POST /v2/{project_id}/apic/
启动推理服务 本章节主要介绍大语言模型的推理服务启动方式,包括离线推理和在线推理2种方式。 离线推理 编辑一个python脚本,脚本内容如下,运行该脚本使用ascend-vllm进行模型离线推理。 from vllm import LLM, SamplingParams def
获取指定ID的任务信息 功能介绍 获取TaurusDB任务中心指定ID的任务信息。 接口约束 该接口只可查询任务中心一个月内的异步任务。 job生成后,通常需要数秒之后才能查询到job ID。 调用方法 请参见如何调用API。 URI GET /v3/{project_id}/jobs