检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
的微调量取决于任务的复杂性和数据集的大小。在深度学习中,微调用于改进预训练模型的性能。操作本步骤前请确保以下两点: 已订购大模型微调服务API在线调用-SFT局部调优,订购方法请参见购买AI原生应用引擎按需计费资源。 已创建格式为“对话文本”的微调数据集。 在AI原生应用引擎的左侧导航栏选择“模型中心
配置完成后单击“确定”。 接口集成:通过接口集成配置,可以将第三方系统的数据集成到开发平台。 配置接口地址。 发布通知类型工具接口在“同步集成”页面配置,测试及其他类型工具无需配置接口集成,其余不同类型工具显示不同的配置接口。 配置的接口需要参考工具链同步信息接口规格说明实现。 支持I
structure as Code,简称IaC)来描述。NUWA Runtime根据IaC描述,对接相关的配置服务器,通过弹性伸缩管理平台接口,完成部署。应用托管到NUWA Runtime以后,Runtime提供IaC和管理台两种方式对集群进行变更。业务通过发布IaC版本,在运维
structure as Code,简称IaC)来描述。NUWA Runtime根据IaC描述,对接相关的配置服务器,通过弹性伸缩管理平台接口,完成部署。应用托管到NUWA Runtime以后,Runtime提供IaC和管理台两种方式对集群进行变更。业务通过发布IaC版本,在运维
快捷构建屏幕 本章节介绍如何快捷构建屏幕。 前提条件 需要具备AppStage指标开发者或运营管理员权限,权限申请的操作请参见权限管理。 快捷构建屏幕 登录AppStage业务控制台。 在快捷入口选择“运营中心”,进入运营中心。 在左侧导航栏选择“看板管理 > 我的屏幕”。 选择屏幕分组,单击“新建屏幕”。
体验Agent Agent体验是指以对话的形式,对我创建的Agent或平台资产中心预置的AI应用进行体验调测,以发现并解决Agent接口上的问题和错误。 体验Agent 在AI原生应用引擎的左侧导航栏选择“Agent编排中心 > 我的Agent”。 选择“我创建的”页签,单击Agent列表“操作”列的“体验”。
图5 授权设置 自行选择授权范围。 图6 选择授权范围 查看创建好的Demo应用配置密钥。 在应用管理页面,选择“通用配置”,复制接口认证凭证。 接口认证凭证为OrgID侧生成的应用密钥,请开发者妥善保管。 图7 查看应用密钥 修改Demo工程的应用配置信息。 将application
个筛选条件: 事件名称:输入事件的名称。 事件ID:输入事件ID。 资源名称:输入资源的名称,当该事件所涉及的云资源无资源名称或对应的API接口操作不涉及资源名称参数时,该字段为空。 资源ID:输入资源ID,当该资源类型无资源ID或资源创建失败时,该字段为空。 云服务:在下拉框中选择对应的云服务名称。
提供AI原生应用开发引擎,包括RAG、Agent等应用框架,零码态和全码态的开发形态,降低AI原生应用开发门槛、提升开发效率。支持客户打通自己的业务能力API,将大模型的能力结合进入自己的业务链路。 提供支撑AI原生应用运行的整套模型工具链,包括数据管理、模型接入、模型调优、知识工程等能力,帮助
个筛选条件: 事件名称:输入事件的名称。 事件ID:输入事件ID。 资源名称:输入资源的名称,当该事件所涉及的云资源无资源名称或对应的API接口操作不涉及资源名称参数时,该字段为空。 资源ID:输入资源ID,当该资源类型无资源ID或资源创建失败时,该字段为空。 云服务:在下拉框中选择对应的云服务名称。
将已有模型部署为模型服务 模型需要部署成功后才可正式提供模型服务。部署成功后,可以对模型服务进行模型调测,并支持在创建Agent时使用或通过模型调用接口调用。 本文介绍如何将微调后的模型或部分平台资产中心的模型部署为模型服务。 前提条件 已购买推理单元资源,具体购买方法请参见购买AI原生应用引擎包年包月资源。
换为另一个可用的模型提供服务,从而提高模型服务的稳定性和可用性。 路由策略创建完成后,可以进行模型调测,并支持在创建Agent时使用或通过接口调用。 前提条件 需要具备AI原生应用引擎管理员或开发者权限,权限申请操作请参见AppStage组织成员申请权限。 创建路由策略 在AI原生应用引擎的左侧导航栏选择“模型中心
10的突发量,如用到则触发保护,下个1/10s不得再用。 (可选)如果需要对特定接口uri进行特别的流控策略,则单击“新建子项”。 表7 特定接口uri流控参数说明 参数 说明 接口URL 流控的接口URL。 匹配条件 equal pettern 限流门限值 单个子项的限流门限值。
基于屏幕模板构建屏幕 通过选择运营中心公共模板新建屏幕,完成卡片交互功能的配置,还可二次定义相关属性配置。保存后通过预览可以看大屏上卡片间弹出、联动、卡片全屏、区域切换、下钻等交互效果。 前提条件 需要具备AppStage指标开发者或运营管理员权限,权限申请的操作请参见权限管理。
10的突发量,如用到则触发保护,下个1/10s不得再用。 (可选)如果需要对特定接口uri进行特别的流控策略,则单击“新建子项”。 表7 特定接口uri流控参数说明 参数 说明 接口URL 流控的接口URL。 匹配条件 equal pettern 限流门限值 单个子项的限流门限值。
CPU利用率超过该值时,接口的放通比例开始降低,直到降低至最低放通比例;CPU利用率越高,接口放通比例下降越快。该阈值要求为小数,范围为0~1,支持精度为小数点后四位。 CPU恢复阈值 CPU利用率小于该值时,接口的放通比例开始恢复,直到恢复至100%;CPU利用率越低,接口放通比例恢复越
CPU利用率超过该值时,接口的放通比例开始降低,直到降低至最低放通比例;CPU利用率越高,接口放通比例下降越快。该阈值要求为小数,范围为0~1,支持精度为小数点后四位。 CPU恢复阈值 CPU利用率小于该值时,接口的放通比例开始恢复,直到恢复至100%;CPU利用率越低,接口放通比例恢复越
String 否 是否聚合,0不聚合 1 聚合,默认不聚合 limit int 否 limit大小 接口级流控,ip流控,服务级流控,单参数流控必填,其他类型流控无效 burst int 否 突发量 接口级流控,ip流控,服务级流控,单参数流控必填,其他类型流控无效 limitTag String
概述 系统架构 图1 SLB系统架构 系统架构说明: 调用部署服务接口获取业务微服务列表,以及发布的微服务版本信息,用于配置不同微服务版本的灰度策略。 运维在灰度发布管理台配置微服务灰度策略,支持配置同一个微服务不同版本的灰度规则,以及不同微服务相同的灰度规则。 微服务的灰度策略同步到灰度配置中心。
无模型时配置的阈值上限(固定阈值线)。 对于新增的接口,因为没有历史数据,无法训练出该接口的模型,此时可以配置合适的值用来监控此类接口。 no_model_threshold_lower 无模型阈值下限 0-100000000 默认值0 无模型时配置的阈值下限(固定阈值线)。 对于新增的接口,因为没有历史数据,