检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
华为账号与华为云账号的区别是什么? 华为云账号只能登录华为云,无法登录其他华为服务。 华为账号是用户访问华为各网站的统一“身份标识”,您只需注册一个华为账号,即可访问所有华为服务,如:华为云、终端云、华为手机等终端、华为开发者联盟等。 华为账号与华为云账号的相同点 均可以购买AppStage。
将已有模型部署为模型服务 模型需要部署成功后才可正式提供模型服务。部署成功后,可以对模型服务进行模型调测,并支持在创建Agent时使用或通过模型调用接口调用。 本文介绍如何将微调后的模型或部分平台资产中心的模型部署为模型服务。 前提条件 已购买推理单元资源,具体购买方法请参见购买AI原生应用引擎包年包月资源。
换为另一个可用的模型提供服务,从而提高模型服务的稳定性和可用性。 路由策略创建完成后,可以进行模型调测,并支持在创建Agent时使用或通过接口调用。 前提条件 需要具备AI原生应用引擎管理员或开发者权限,权限申请操作请参见AppStage组织成员申请权限。 创建路由策略 在AI原生应用引擎的左侧导航栏选择“模型中心
10的突发量,如用到则触发保护,下个1/10s不得再用。 (可选)如果需要对特定接口uri进行特别的流控策略,则单击“新建子项”。 表7 特定接口uri流控参数说明 参数 说明 接口URL 流控的接口URL。 匹配条件 equal pettern 限流门限值 单个子项的限流门限值。
概述 系统架构 图1 SLB系统架构 系统架构说明: 调用部署服务接口获取业务微服务列表,以及发布的微服务版本信息,用于配置不同微服务版本的灰度策略。 运维在灰度发布管理台配置微服务灰度策略,支持配置同一个微服务不同版本的灰度规则,以及不同微服务相同的灰度规则。 微服务的灰度策略同步到灰度配置中心。
10的突发量,如用到则触发保护,下个1/10s不得再用。 (可选)如果需要对特定接口uri进行特别的流控策略,则单击“新建子项”。 表7 特定接口uri流控参数说明 参数 说明 接口URL 流控的接口URL。 匹配条件 equal pettern 限流门限值 单个子项的限流门限值。
在ACMS中查询认证凭据 某微服务有多个业务来接入,为了认证接入业务的身份,微服务会给业务分配不同的认证凭据,用于认证。为了把认证凭据授权给业务A、B、C,需要将认证凭据明文发送给业务A、B、C的开发人员,从而两边持有相同的认证凭据。本章介绍如何通过管理台查询认证凭据。 查询认证凭据
查询认证凭据 某微服务有多个业务来接入,为了认证接入业务的身份,微服务会给业务分配不同的认证凭据,用于认证。为了把认证凭据授权给业务A、B、C,需要将认证凭据明文发送给业务A、B、C的开发人员,从而两边持有相同的认证凭据。本章介绍如何通过管理台查询认证凭据。 查询认证凭据 进入AppStage运维中心。
获取方式:在华为云控制台,鼠标悬停在右上角的用户名,选择下拉列表中的“我的凭证”,在“API凭证”页面查看。 华为公有云账号名称 使用华为云并购买资源时注册的账号的账号名。 获取方式:在华为云控制台,鼠标悬停在右上角的用户名,选择下拉列表中的“我的凭证”,在“API凭证”页面查看。 纳管方式 AK-SK:通过AKS
平台预置的开源模型chatglm3-6b 平台预置开源模型chatglm3-6b,并提供对应的模型服务API,但是该模型能力有限,只能作为问答模型,不能作为思考模型。首次使用该模型服务API需要订购免费的“ChatGLM3-6B大模型服务API在线调用”资源,订购后即可进行体验,订购操作请参见购买AppStage。
一些故障问题,暂时无法为您提供服务” 问题现象 图1 Agent报错 解决方法 检查创建Agent时选择的模型是否为模型服务商API,使用模型服务商API时,需要配置模型服务鉴权,新开的租户没有配置模型鉴权,具体操作请参见如何对模型供应商提供的模型服务设置鉴权。 父主题: AI原生应用引擎
图5 授权设置 自行选择授权范围。 图6 选择授权范围 查看创建好的Demo应用配置密钥。 在应用管理页面,选择“通用配置”,复制接口认证凭证。 接口认证凭证为OrgID侧生成的应用密钥,请开发者妥善保管。 图7 查看应用密钥 修改Demo工程的应用配置信息。 将application
│ │ UserLoginApi.java ----接口api定义 │ │ │ │ │
体验Agent 以对话的形式,对创建的Agent或平台资产中心预置的AI应用进行体验调测,以发现并解决Agent接口上的问题和错误。 3 使用Agent 支持通过API接口调用或Web界面访问两种方式使用Agent。
aS和SaaS类云服务内部的安全以及对租户定制配置进行安全有效的管理,包括但不限于虚拟网络、虚拟主机和访客虚拟机的操作系统,虚拟防火墙、API网关和高级安全服务,各项云服务,租户数据,以及身份账号和密钥管理等方面的安全配置。 《华为云安全白皮书》详细介绍华为云安全性的构建思路与措
概述 Cloud Map SDK服务软件开发工具包是对服务发现(Cloud Map)服务提供的REST API进行的封装,以简化用户的开发工作。 Cloud Map是注册发现中心,主要用于注册发现微服务、中间件/数据库、一方/二方/三方服务,单体应用无需对接Cloud Map(微
tGLM3-6B大模型服务API在线调用、大模型微调服务API在线调用-SFT局部调优,按需计费模式能大幅降低客户的业务成本。 适用计费项 AI原生应用引擎的以下计费项支持按需计费。 表1 适用计费项 计费项 说明 ChatGLM3-6B大模型服务API在线调用 根据实际输入和输
无模型时配置的阈值上限(固定阈值线)。 对于新增的接口,因为没有历史数据,无法训练出该接口的模型,此时可以配置合适的值用来监控此类接口。 no_model_threshold_lower 无模型阈值下限 0-100000000 默认值0 无模型时配置的阈值下限(固定阈值线)。 对于新增的接口,因为没有历史数据,
续费 续费概述 手动续费 自动续费
配置运行时引擎负载均衡 运行时引擎负载均衡功能介绍 在SLB中创建和管理负载均衡实例 在SLB中创建和管理监听 在SLB中创建和管理灰度服务 在SLB中创建和管理流控服务 在SLB中创建和管理资源