检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
提供AI原生应用开发引擎,包括RAG、Agent等应用框架,零码态和全码态的开发形态,降低AI原生应用开发门槛、提升开发效率。支持客户打通自己的业务能力API,将大模型的能力结合进入自己的业务链路。 提供支撑AI原生应用运行的整套模型工具链,包括数据管理、模型接入、模型调优、知识工程等能力
返回一个资源特征与地址的列表用于用户终端(例如:浏览器)选择。 301 Moved Permanently 永久移动,请求的资源已被永久的移动到新的URI,返回信息会包括新的URI。 302 Found 资源被临时移动。 303 See Other 查看其它地址。 使用GET和POST请求查看。
检查到后端服务器状态正常时,返回的状态码。 默认为200、302,可以自定义。 响应超时时间 检查的超时时间,即超过该时间后结束检查。 健康检查周期 每次健康检查的间隔时间。 不健康阈值 选择2~10,当未收到正常状态码的次数大于不健康阈值时,即认定后端服务异常,将该集群中的这台服务器做下线处理。
如果需要将云监控服务CES对各种云服务资源进行监控产生的告警接入AppStage,需要为资源添加AppStage中的服务ID作为标签。 标签键为wc_service-id,标签值为AppStage中的服务ID,即要将告警接入AppStage中录入服务的服务ID,可以在运维中心,将鼠标悬停在右上角的用户名,选择下拉列
环境准备 操作步骤 在华为云控制台,完成如表1所示的资源购买。 表1 资源列表 资源名称 说明 参考文档 CCE集群 购买1个CCE集群。 根据业务需要选择规模,本实践中选择集群规模为50节点。 购买集群 ECS服务器 购买1个ECS服务器,容灾场景下购买2个ECS服务器。 根据
附加请求头字段,如指定的URI和HTTP方法所要求的字段。例如定义消息体类型的请求头“Content-Type”,请求鉴权信息等。 详细的公共请求消息头字段请参见表3和表4。 表3 AK/SK认证公共请求消息头 名称 描述 是否必选 示例 Content-Type 消息体的类型(格式),
----demo应用的静态页面(登录后的首页欢迎页) │ login.html ----demo应用的静态页面(登录页,单击按钮跳转登录) lib目录为工程依赖的jar包。 ├─lib │
数。 说明: OBS终端节点的获取方法如下: 获取已授予OBS桶读写权限的账号。对账号授予桶的读写权限的方法,请参见对其他账号授予桶的读写权限。 登录控制台,选择“存储 > 对象存储服务 OBS”,进入OBS控制台。 鼠标移动到指定桶所在行,在弹出的基本信息中,“Endpoint”参数值即为OBS终端节点。
务器上的资源,通常使用URL参数指定要删除的资源。 put:put请求,用于更新服务器上的资源,通常将更新的数据放在请求体中。 patch:请求服务器更新资源的部分内容。当资源不存在的时候,patch可能会去创建一个新的资源。 API请求体架构 请求头 HTTP请求消息的组成部分
工作流基础节点说明 调用子工作流 数据连接器 LLM 知识库 变量V2 控制 JSON构造器 Code代码 结束 父主题: 管理工作流
创建采集指标模板:根据模板选择的实例和指标采集对应的CES数据。 创建自定义采集指标:支持创建自定义采集指标,可以指定账号区域下具体的监控指标。 补数据:如果发现实例的指标数据出现漏采的情况,可以使用补数据功能将漏采的指标数据重新采集。因为CES的指标只能保留2天,所以支持采集近2天内的数据。 查看
创建采集指标模板:根据模板选择的实例和指标采集对应的CES数据。 创建自定义采集指标:支持创建自定义采集指标,可以指定账号区域下具体的监控指标。 补数据:如果发现实例的指标数据出现漏采的情况,可以使用补数据功能将漏采的指标数据重新采集。因为CES的指标只能保留2天,所以支持采集近2天内的数据。 查看
基本概念 说明 产品 产品是服务的合集,开发中心基于服务进行版本管理。 服务 服务是实现一系列功能的软件模块单元,是产品的组成要素,一个产品一般由一个或多个服务组成。将一个大型的应用程序可以拆分成一组小型、独立的服务。每个服务都运行在自己的进程中,并通过轻量级的通信机制(如HTTP或消息
请求头(Header):HTTP请求消息的组成部分之一,请求头负责通知服务器有关于客户端请求的信息。 单击参数列表“操作”列的可以新增参数,参数配置说明请参见表4。 请求体(Body):HTTP请求消息的组成部分之一,请求体呈现发送给服务器的数据。 JSON/XML:JSON、XML格式的数据。 导入:可
delete:用于删除服务器上的资源,通常使用URL参数指定要删除的资源。 put:用于更新服务器上的资源,通常将更新的数据放在请求体中。 patch:请求服务器更新资源的部分内容。当资源不存在的时候,patch可能会去创建一个新的资源。 API请求体架构 请求头 HTTP请求消息的组成部分之一,
在SLB中创建和管理监听 (可选)录入HTTPS监听所需的服务器证书 在SLB中创建监听 将监听配置同步到SLB节点 在SLB中配置监听共享 父主题: 配置运维中心负载均衡
在SLB中创建和管理监听 (可选)录入HTTPS监听所需的服务器证书 在SLB中创建监听 将监听配置同步到SLB节点 在SLB中配置监听共享 父主题: 配置运行时引擎负载均衡
自定义卡片的名称。由1~64个字符组成,包含中文、字母、数字及下划线。 版本 卡片的版本信息,不可修改。 样式分类 卡片的分类,不可修改。 卡片分类 必选项。 在下拉框中选择卡片的分类名称。默认显示第一个分类名称。 描述 必填项。 自定义卡片的描述信息。 封面图 卡片的封面图。
查看Agent调用统计 Agent调用统计页面展示当前租户所在的根部门以及租户下二级子部门的Agent调用情况。 前提条件 需要具备AI原生应用引擎租户运营管理员权限,权限申请操作请参见AppStage组织成员申请权限。 查看模型调用统计 在AI原生应用引擎的左侧导航栏选择“运营看板 > Agent调用统计”。
查看模型调用统计 模型调用统计页面展示当前租户所在的根部门以及租户下二级子部门的模型调用情况。 前提条件 需要具备AI原生应用引擎租户运营管理员权限,权限申请操作请参见AppStage组织成员申请权限。 查看模型调用统计 在AI原生应用引擎的左侧导航栏选择“运营看板 > 模型调用统计”。