检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
调用文本对话模型服务 功能介绍 调用大语言模型推理服务,根据用户问题,获取大语言模型的回答。 调用方法 请参见如何调用API。 URI POST https://aiae.appstage.myhuaweicloud.com/v1/chat/completions 请求参数 表1
变量V2 变量定义,变量V2连接器包含“追加到数组变量”、“追加到字符串变量”、“数值递减”、“数值递增”、“变量定义 ”、“变量赋值”六个执行动作。 连接参数 变量连接器无需认证,无连接参数。 追加到数组变量 需要先定义一个数组变量,可将“值”内填写的数据,以字符串的形式追加到
查询知识数据集详情 功能介绍 该接口用于查询知识数据集详情。 调用方法 请参见如何调用API。 URI GET https://aiae.appstage.myhuaweicloud.com/v1/knowledge-datasets/{data_set_id} 表1 路径参数 参数
创建知识检索流 知识检索流是一种特殊的工作流,除工作流基础节点外,还具备检索规划、召回、重排序三个节点。 通常可以使用检索规划节点对原始查询内容进行意图识别、拆解或改写,提升查询的准确性,然后使用召回节点从知识库中检索并召回所有与查询相关的信息,最后通过重排序节点对召回结果进行重
配置微服务治理 微服务部署完后,您可以根据微服务的运行情况进行微服务的治理。 治理策略说明 支持负载均衡、限流、故障隔离、容错、降级、熔断、错误注入、超时时间和OLC流控等策略的配置。各治理项说明如表1所示。 表1 治理策略说明 名称 说明 负载均衡 微服务一般会部署多个实例,负
为容器集群安装插件 ERS提供通过插件模板为集群安装插件的功能,本章节介绍如何为集群安装插件。 前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 为集群安装插件 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 弹性资源服务(ERS)”。
检索知识库数据 功能介绍 检索知识库数据,根据用户提供的检索信息,返回命中的信息数据。 调用方法 请参见如何调用API。 URI POST https://aiae.appstage.myhuaweicloud.com/v1/knowledge-bases/{knowledge_
通过调整模型参数对异常告警调优 由于超参设置或是数据特征发生变化,导致预测的数据不够准确,出现误告警,可以通过调整模型参数,对生成的异常告警进行调优。本章节介绍不同类型异常告警及调优方法。 调优配置方法 在“异常检测”页面,单击异常检测任务所在行“操作”列的“模型”,默认显示“算法配置”页签,参考表1配置参数。
模型API接入接口规范 当前模型网关支持文本对话(Chat)、文本向量化(Embeddings)、文本排序(Rerank)三种类型的API接入。模型API接入之前,请确保符合相对应的接口规范,其中Chat接口和Embeddings接口需要符合OpenAI接口规范,Rerank接口需要符合AI引擎标准协议。
配置负载均衡OLC服务 前提条件 需要具备AppStage服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 新增资源 资源用于定义规则中要匹配的微服务名称和接口名称。如果需要对微服务下所有接口的请求总数进行限制,需要配置微服务资源;如果需要对某一个特定的接口的请求总数进行限制,则需要配置接口级资源。
知识数据集请求参数说明 CreateKnowledgeDataSetReq 创建知识数据集的data_set参数具有特定结构,需要按照以下实体进行构造后转成json。 表1 请求Body参数 参数 是否必选 参数类型 描述 name 是 String 参数解释: 数据集名称。 约束限制: