检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
M3-6B服务、大模型调优服务API在线调用。 套餐包单价+按需计费(ChatGLM3-6B服务、大模型调优服务API在线调用) 知识库容量:50GB 智能应用运行时引擎(20实例):2个 ChatGLM3-6B服务、大模型调优服务API在线调用根据实际输入和输出tokens总量计费,计费规则请参考按需计费
登录AppStage控制台。 在弹出的“服务授权”对话框,勾选需要授权的授权项,单击“同意授权”。 购买AI原生应用引擎、运维中心或运营中心之后,系统将自动识别到您未同意服务授权并弹框提示您进行服务授权。 (可选)在应用平台控制台左侧导航,选择“服务授权”,在“服务授权”页面,单击“一键授权”,重
登录AppStage控制台。 在弹出的“服务授权”对话框,勾选需要授权的授权项,单击“同意授权”。 购买AI原生应用引擎、运维中心或运营中心之后,系统将自动识别到您未同意服务授权并弹框提示您进行服务授权。 (可选)在应用平台控制台左侧导航,选择“服务授权”,在“服务授权”页面,单击“一键授权”,重
在CloudMap中新增接入地址 Cloud Map里的接入地址通过环境(namespace)+服务名+地址名唯一确定。一个地址下可以包含多个实例,多个实例之间对等。不同的实例可以有不同的属性。 前提条件 需要具备AppStage服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。
支持将平台资产中心预置的部分模型作为微调前基础模型,也可以选择微调后的新模型作为基础模型再次进行微调。 前提条件 已订购大模型微调服务API在线调用-SFT局部调优,订购方法请参见购买AI原生应用引擎按需计费资源。 已具备格式为“对话文本”的微调数据集,具体请参考创建微调数据集或收藏预置微调数据集。
在CloudMap中新增接入地址 Cloud Map里的接入地址通过环境(namespace)+服务名+地址名唯一确定。一个地址下可以包含多个实例,多个实例之间对等。不同的实例可以有不同的属性。 前提条件 需要具备AppStage服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。
如果创建Agent时,使用配置变量的方式实现了记忆能力,在Agent体验时会自动识别对话与变量匹配的内容,自动更新变量取值,选择页面右上角的“记忆 > 变量”,可以查看变量使用效果。 如果创建Agent时开启了“片段记忆”,在Agent体验时会自动识别并保留用户个性化信息,选择页面右上角的“记忆 > 片段记忆”,可以查看片段记忆使用效果。
义屏幕构建。 前提条件 需要具备AppStage指标开发者或运营管理员权限,权限申请的操作请参见权限管理。 已创建我的卡片,具体请参见使用在线构建方式新建卡片、使用模板构建方式新建卡片、使用离线构建方式新建卡片。 新建屏幕模板 登录AppStage业务控制台。 在快捷入口选择“运营中心”,进入运营中心。
计费项说明 适用的计费模式 计费公式 ChatGLM3-6B大模型服务API在线调用 根据实际输入和输出tokens总量计费,平台提供算力支持。 按需计费 千tokens * 每千tokens单价 大模型微调服务API在线调用-SFT局部调优 根据实际输入和输出tokens总量计费,平台提供算力支持。
选择左侧导航栏的“服务目录 > 一方服务”。 在一方服务页面,选择“微服务实例列表”页签。 单击微服务实例列表操作列的“上线”,将实例调整为上线状态。 下线实例 将在线的微服务调整为下线状态。下线实例将会让微服务实例不再接收流量,请确认后操作。 在微服务实例列表中,单击微服务实例列表操作列的“下线”。 在
选择左侧导航栏的“服务目录 > 一方服务”。 在一方服务页面,选择“微服务实例列表”页签。 单击微服务实例列表操作列的“上线”,将实例调整为上线状态。 下线实例 将在线的微服务调整为下线状态。下线实例将会让微服务实例不再接收流量,请确认后操作。 在微服务实例列表中,单击微服务实例列表操作列的“下线”。 在
营中心指标增量包-100个指标 预置模型服务调用 API SaaS:ChatGLM3-6B大模型服务API在线调用 自定义模型训练 API SaaS:大模型微调服务API在线调用-SFT局部调优 说明: 按需仅适用于AppStage的AI原生应用引擎。 变更计费模式 不支持。 不支持。
ignore) { } } API Key认证 API Key全称为应用程序接口密钥,是一种用于验证和授权API请求的代码。它通常是一串字符,用于识别调用API的应用程序和开发者。 获取API Key 以管理员身份登录AI原生应用引擎工作台,参考创建API Key获取。 使用API Key鉴权
购买AppStage运营中心 首次使用需要先购买运营中心专业版,具体操作请参见购买AppStage。 配置服务授权 购买运营中心后,系统将自动识别并弹框提示进行服务授权,同意服务授权后,AppStage将在统一身份认证服务IAM中为账号创建名称为appstage_admin_agency的委托。
华北-北京四 创建需求 代码仓管理 代码仓管理是遵循Git的基本运行模式的分布式版本管理平台,其具备安全管控、成员/权限管理、分支保护/合并、在线编辑、统计服务等功能,旨在解决软件开发者在跨地域协同、多分支并发、代码版本管理、安全性等方面的问题。 支持区域: 华北-北京四 创建代码仓
检索规划包含“Query拆解”、“Query改写”、“意图识别”三个执行动作,执行动作参数配置说明如表2所示。 Query拆解:配置适当的模型将原始查询内容拆解为更简单、易理解的请求。 Query改写:配置适当的模型对原始查询内容进行改写、优化,使得原始请求更准确。 意图识别:配置适当的模型对原始内容进行意图判断。
负载均衡”。 选择左侧导航栏的“监听管理”。 在监听管理页面,单击监听名称。 在监听详情页面选择“后端服务器”页签,检查该后端服务器集群中的节点是否都在线,如果都下线会报此错误。 父主题: SLB同步异常相关问题
开发中心/运维中心/运营中心计费项 计费说明 开发中心/运维中心/运营中心的计费项如表1所示。 表1 开发中心/运维中心/运营中心的计费项说明 套餐包类型 说明 计费项 适用的计费模式 计费公式 开发中心专业版 支持统一应用架构建模、产品/版本/个人级协作管理、一站式开发工具链、研发效能洞察、海量资产模板。
基于NUWA微服务开发框架,预集成构建云服务业务分布式架构所需的各个组件及高可用能力,实现开箱即用。 提供业务运行时管理,支持业务优雅启停、启动加速、在线诊断等能力。 提供流量控制、资源动态伸缩、容错容灾等能力,使能业务具备韧性。 提供云原生中间件与数据库管理,结合华为面向10亿+移动用户应用治理经验,兼具高并发与高可靠能力。
在SLB中进行降级配置 降级配置是在业务高峰期时,需要临时减少对于目标服务的访问,达到降低目标服务负载;或者屏蔽对于非关键服务的访问,保持本服务的核心处理能力的治理措施。降级执行流程如图1所示。 图1 降级执行流程 前提条件 需要具备AppStage服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。