检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
虚拟机日志接入 本章节介绍如何通过filebeat采集虚拟机日志。 监控服务安装filebeat是使用子用户sudo权限进行安装,SUSE15系统没有自带sudo命令。
AI原生应用引擎中预置了哪些提示语? AI原生应用引擎预置了多款提示语模板,包含智能问答,智能写作,生活助手,智能分析,智能文档,生活助手等提示语类型,每个提示语类型下面都有对应类型相关提示语,如指标计算方法,问答场景选择,总结大纲,买家评价生成器等提示语。 父主题: AI原生应用引擎
AI原生应用引擎使用前准备 使用AI原生应用引擎前,需要先准备如表1所示内容。 表1 准备事项 准备事项 说明 购买AI原生应用引擎 首次使用需要先购买AI原生应用引擎,具体操作请参见购买AppStage。 为AppStage关联组织 首次购买AppStage后,其账号需创建并关联使用
请求头(Header):HTTP请求消息的组成部分之一,请求头负责通知服务器有关于客户端请求的信息。 单击参数列表“操作”列的可以新增参数,参数配置说明请参见表4。 请求体(Body):HTTP请求消息的组成部分之一,请求体呈现发送给服务器的数据。
CCE/EVS/ECS/ELB/IAM/IMS/NAT/EIP/OBS/SFS/SMN/SWR/DCS/VPC/VPCEP/WAF/HSS/Anti-DDoS/DWS/CES/DRS/DEW/DDS/APIG/MRS/CSS/DMS/TaurusDB/GeminiDB Cassandra
AI原生应用引擎计费项 计费说明 AI原生应用引擎根据购买的套餐包计费或按需计费。具体内容如表1所示。 表1 AI原生应用引擎计费项说明 计费项 计费项说明 适用的计费模式 计费公式 ChatGLM3-6B大模型服务API在线调用 根据实际输入和输出tokens总量计费,平台提供算力支持
后端服务器集群 绑定后端服务器集群。 关联灰度服务 不启用灰度。 选择关联的灰度服务。 灰度服务依赖转发策略,一个转发策略可以对应多个灰度服务,一个灰度服务只能对应一个转发策略。
AI原生应用引擎训练好后的模型如何获取? 使用模型微调训练好模型后的新模型只能通过模型部署(创建模型服务)上线,无法下载至本地使用。 父主题: AI原生应用引擎
后端服务器集群 绑定后端服务器集群。 关联灰度服务 不启用灰度。 选择关联的灰度服务。 灰度服务依赖转发策略,一个转发策略可以对应多个灰度服务,一个灰度服务只能对应一个转发策略。
将已有模型部署为模型服务 模型需要部署成功后才可正式提供模型服务。部署成功后,可以对模型服务进行模型调测,并支持在创建Agent时使用或通过模型调用接口调用。 本文介绍如何将微调后的模型或部分平台预置的模型部署为模型服务。 前提条件 已购买推理单元资源,具体购买方法请参见购买AI原生应用引擎包年包月资源
创建路由策略用于提供模型服务 通过配置路由策略,可以实现模型故障自动切换能力,当模型A因故障等原因无法正常工作时,可以自动切换为另一个可用的模型提供服务,从而提高模型服务的稳定性和可用性。 路由策略创建完成后,可以进行模型调测,并支持在创建Agent时使用或通过模型调用接口调用。
查看模型调用统计 模型调用统计页面展示当前租户所在的根部门以及租户下二级子部门的模型调用情况。 前提条件 需要具备AI原生应用引擎租户运营管理员权限,权限申请操作请参见AppStage组织成员申请权限。 查看模型调用统计 在AI原生应用引擎的左侧导航栏选择“运营看板 > 模型调用统计
删除告警任务失败 告警后触发知识编排任务提示alert_type不存在 创建CES指标采集报错 如何卸载虚拟机上安装的filebeat? 异常检测Judge定时任务失败 保存异常检测告警配置时报错
使用Rainbow SDK(Spring Cloud框架) 引入Rainbow SDK Rainbow SDK依赖Cloud Map的注册和发现能力,在引入Rainbow SDK之前,要先引入STS SDK和Cloud Map SDK,并完成STS和Cloud Map的初始化,具体请参见使用
使用Rainbow SDK(NUWA框架) 引入Rainbow SDK Rainbow SDK依赖Cloud Map的注册和发现能力,在引入Rainbow SDK之前,要先引入STS SDK和Cloud Map SDK,并完成STS和Cloud Map的初始化,具体请参见使用STS
AI原生应用引擎SDK API 快速开始 modules模块
通过运营看板查看AI原生应用引擎资产总览 查看资产总览 查看模型调用统计 查看Agent调用统计
虚拟机:适用于虚拟机部署DCS、DMQ、SLB、GaussDB等。 访问控制 选择访问控制类型。 安全组:使用安全组来控制网络互通策略,一般容器场景下使用。 ACL:使用网络ACL来控制网络互通策略,仅支持虚拟机场景下使用。
容错策略 Failover:尝试新的服务器次数:1,尝试同一个服务器次数:0。 Failfast:尝试新的服务器次数:0,尝试同一个服务器次数:0。 Failback:尝试新的服务器次数:0,尝试同一个服务器次数:1。
容错策略 Failover:尝试新的服务器次数:1,尝试同一个服务器次数:0。 Failfast:尝试新的服务器次数:0,尝试同一个服务器次数:0。 Failback:尝试新的服务器次数:0,尝试同一个服务器次数:1。