检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
什么是AI原生应用引擎 AI原生应用引擎是企业专属的一站式大模型开发及应用构建平台。无论是研发技术人员还是业务人员,都可通过简易的界面化操作,快速开发大模型应用或训练专属模型。 AI原生应用引擎提供企业专属大模型开发和应用开发的整套工具链,包括数据准备、模型选择/调优、知识工程、模型编排
模型API接入接口规范 当前模型网关支持文本对话(Chat)、文本向量化(Embeddings)、文本排序(Rerank)三种类型的API接入。模型API接入之前,请确保符合相对应的接口规范,其中Chat接口和Embeddings接口需要符合OpenAI接口规范,Rerank接口需要符合
知识数据集请求参数说明 CreateKnowledgeDataSetReq 创建知识数据集的data_set参数具有特定结构,需要按照以下实体进行构造后转成json。 表1 请求Body参数 参数 是否必选 参数类型 描述 name 是 String 参数解释: 数据集名称。 约束限制
方案概述 背景信息 应用平台以“应用”为中心,基于云原生技术,打造了覆盖应用开发、托管、运维全生命周期支持的应用平台,面向企业IT应用、移动应用等提供一站式、集成式的云原生应用服务能力,支持开箱即用,全流程规范可视,高效异地协作,是沉淀行业通用能力,结合华为优秀实践,为产业上云及行业
发布版本 待版本开发及编译构建完成,且发布准入检查项均通过后,可由开发人员、测试人员或项目经理提交标准发布申请,待项目经理审批通过后,将软件发布到对应的部署平台。 前提条件 需要具备项目经理、开发人员或测试人员角色权限,权限申请方法请参见申请权限。具体角色权限说明请参考用户角色和权限说明
管理已纳管的ELB ENS支持对纳管的ELB创建监听器,监听器负责监听负载均衡器上的请求,根据配置流量分配策略,分发流量到后端服务器处理。同时支持对ELB进行锁定和解锁,锁定后该ELB不能使用IaC更新。 前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限
创建知识检索流 知识检索流是一种特殊的工作流,除工作流基础节点外,还具备检索规划、召回、重排序三个节点。通常,使用检索规划节点对原始查询内容进行意图识别、拆解或改写,以提升查询的准确性,然后使用召回节点从知识库中检索并召回所有与查询相关的信息,最后通过重排序节点对召回结果进行重排序
常见问题 常见问题 SDK初始化失败 SDK初始化失败,graysdk的run和debug日志会打印初始化失败原因,一般原因有如下几种: ETCD服务器配置错误(检查conf/graysdk.properties文件中server配置是否正确)。 ETCD未启动或者网络原因不可用(
配置告警通知 告警的通知在所有的告警处理的链路结束以后才会发生。告警处理模块会根据上报告警的上下文获取告警的值班配置,值班配置由业务预置。配置对应的责任人,当告警生成时,通过WeLink、短信或电话形式,快速通知责任人。 新建语音值班配置前需要先新增模板。模板是产品级共享,模板列表展示所选服务所属产品下的所有模板配置
创建工具 工具是一组相关的API集合,一个工具通常包含多个执行动作,每个执行动作用于实现特定功能。在创建Agent时调用工具,可以有效提高Agent开发的效率。 平台在资产中心预置了部分工具,同时也支持用户根据需求自定义创建工具。在创建工具时,需要先将选定的API服务注册为一个工具
在IaC代码中定义流水线 IaC代码中的流水线可以由用户定义,用户可以根据自己的需求定义整个环境在变更时的执行过程,在变更执行过程中,系统只会变更被流水线引用的资源,本章介绍如何定义流水线。 在哪里定义流水线 component间的编排在spec包中的meta.yaml文件中描述,
使用工作流规划旅游行程 场景介绍 工作流体现的是一个具体的业务场景,通过一系列不同功能节点中的触发事件和执行动作编排而成,AI原生应用引擎通过将传统工具API和大模型编排在一起实现复杂的工作流。工作流可在用户创建Agent时调用,Agent使用过程中,当起始节点触发,后续动作即可自动执行
配置微服务治理 微服务部署完后,您可以根据微服务的运行情况进行微服务的治理。 治理策略说明 支持负载均衡、限流、故障隔离、容错、降级、熔断、错误注入、超时时间和OLC流控等策略的配置。各治理项说明如表1所示。 表1 治理策略说明 名称 说明 负载均衡 微服务一般会部署多个实例,负载均衡控制微服务消费者访问微服务提供者的多个实例的策略
配置微服务治理 微服务部署完后,您可以根据微服务的运行情况进行微服务的治理。 治理策略说明 支持负载均衡、限流、故障隔离、容错、降级、熔断、错误注入、超时时间和OLC流控等策略的配置。各治理项说明如表1所示。 表1 治理策略说明 名称 说明 负载均衡 微服务一般会部署多个实例,负载均衡控制微服务消费者访问微服务提供者的多个实例的策略
为容器集群安装插件 ERS提供通过插件模板为集群安装插件的功能,本章节介绍如何为集群安装插件。 前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 为集群安装插件 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 弹性资源服务
在AppStage开发中心调测发布版本 在版本标准发布(即正式发布)前,可先执行调测发布进行环境调测。 前提条件 已创建版本。 已获取项目经理、开发人员或测试人员角色权限,权限申请方法请参见申请权限。 发布软件包到运维中心前,需要在运维中心录入并绑定镜像仓,否则会发布失败,具体操作请参见管理
使用部署包部署虚拟机 支持对虚拟机变更步骤进行编排,通过配置变更任务,使用模板完成虚拟机部署。 前提条件 已设置执行机用来部署虚拟机,具体操作请参见设置执行机。 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 创建部署模板 进入AppStage运维中心。 在顶部导航栏选择服务
开发业务代码 准备工作 已下载并安装Maven,根据以下步骤配置Maven。 在<localRepository>标签内添加自己的本地仓库位置路径,这个本地仓库位置是自己创建的。 D:\apache-maven-3.8.6-bin\repository <localRepository
纳管Linux主机 本章节介绍如何将华为云Linux主机纳管至VMS进行统一管理,当前支持纳管的Linux主机类型包括弹性云服务器ECS、裸金属服务器BMS。 如果已纳管了CBH堡垒机,在纳管Linux主机时需要确保纳管的主机与CBH堡垒机网络互通。弹性云服务器主机被纳管时,该主机会同时被纳管到对应服务环境的
构建Spring Cloud工程 创建父工程 创建Maven工程。 图1 创建Maven工程 父pom添加依赖。 <dependencyManagement> <dependencies> <dependency> <groupId>