检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
ase_id} 表1 路径参数 参数 是否必选 参数类型 描述 knowledge_base_id 是 String 知识库id 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 Authorization 是 String AI原生应用引擎鉴权API Key。
ata_set_id} 表1 路径参数 参数 是否必选 参数类型 描述 data_set_id 是 String 知识数据集id 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 Authorization 是 String AI原生应用引擎鉴权API Key。
QPS:每秒速率流控。 配额:特定时间的请求阈值。 限流阈值 流控阈值,整个微服务/接口调用总量的阈值,如果请求总量超过该阈值,后续请求会被流控;0表示不流控。 禁用时间 当限流控制类型为QPS时,显示该参数。 流控后禁用时间内的所有请求不再判断请求量,直接全部流控。 允许的突增量 当限流控制类型为QPS时,显示该参数。
ata_set_id} 表1 路径参数 参数 是否必选 参数类型 描述 data_set_id 是 String 知识数据集id 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 Authorization 是 String AI原生应用引擎鉴权API Key。
-record 表1 路径参数 参数 是否必选 参数类型 描述 knowledge_base_id 是 String 知识库id 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 Authorization 是 String AI原生应用引擎鉴权API Key。
tion-record 表1 路径参数 参数 是否必选 参数类型 描述 data_set_id 是 String 知识数据集id 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 Authorization 是 String AI原生应用引擎鉴权API Key。
between instances of 'str' and 'float'提示。 解决方法 检查告警原始表指标字段的类型配置是否正确。 例如请求量指标错误配置为varchar类型,应该是数值类型,需要在MPPDB表管理中,将对应表字段类型调整正确。 父主题: 异常检测Judge定时任务失败
周期值,每个周期清零,重新计数。 匹配超时次数 M 周期值,每个周期清零,重新计数。 请求平均时延 M 周期内请求的平均时延,单位:微秒。 请求最大时延 M 周期内请求的最大时延,单位:微秒。 请求最小时延 M 周期内请求的最小时延,单位:微秒。 表3 服务级日志 字段名称 必选(M)/可选(O)
交互,订购AI原生应用引擎、运维中心、运营中心之后,为保证服务正常使用,需要进行服务授权。同意服务授权后,AppStage将在统一身份认证服务为您创建名为appstage_admin_agency的委托,为保证服务正常使用,在使用AppStage服务期间,请不要删除或者修改app
交互,订购AI原生应用引擎、运维中心、运营中心之后,为保证服务正常使用,需要进行服务授权。同意服务授权后,AppStage将在统一身份认证服务为您创建名为appstage_admin_agency的委托,为保证服务正常使用,在使用AppStage服务期间,请不要删除或者修改app
Agent问答的时候没有回答 思考模型没有配置鉴权,或者鉴权失效了,可以通过模型调测功能测试思考模型是否正常,具体操作请参见调测/体验模型。 父主题: AI原生应用引擎
客户端向应用程序发出请求。 负载均衡实例中的监听接收与配置的协议和端口匹配的请求。 监听再根据配置将请求转发至相应的后端服务器集群。如果配置了转发策略,监听会根据配置的转发策略评估传入的请求,如果匹配,请求将被转发至相应的后端服务器组。 后端服务器集群中健康检查正常的后端服务器将根据
error timeout 转发头设置 转发http请求时,重新设置请求头中的Key对应的Value;对应配置文件中proxy_set_header key value。 重定向 将请求的url指定为另一个url,由客户端重新发起请求到目标url;对应配置文件中rewrite key
文本排序(Rerank)API规范 接口格式 类型:POST 协议:HTTP/HTTPS 请求体参数 表15 请求体参数 参数 是否必选 参数类型 描述 query 是 String 原始请求问题,基于该问题对候选文本进行排序。 top_n 是 Integer 返回排序靠前的n个结果。
low_count_threshold 小请求量 0- 100000000 默认值0 请求量低于此参数值时毛刺告警、波动性不生效;其他类型的告警依然生效。 如果毛刺告警较多,可以配置该参数。 count_threshold 请求量保护 0-100000000 默认值100000000 请求量低于此参数值时,完全不告警。
包含默认的WISEAGENT_USER_INPUT参数,如图1所示,表示在Agent调用工作流时,以用户在问答对话中输入的内容作为工作流的请求参数。不满足要求的工作流无法选用。 图1 引入用户对话输入 父主题: AI原生应用引擎
Service,简称ACMS,也称为Security Token Service,简称STS)为云服务业务提供了以下两个功能: 微服务之间请求认证 ACMS为每个接入的微服务,颁发了用于通信中进行认证的STS认证凭据,两个微服务之间通信时,可以使用该认证凭据,进行STS认证。 为
选择开启或关闭健康检查,默认关闭。 正常状态码 检查到后端服务器状态正常时,返回的状态码。 默认为200、302,可以自定义。 响应超时时间 检查的超时时间,即超过该时间后结束检查。 健康检查周期 每次健康检查的间隔时间。 不健康阈值 选择2~10,当未收到正常状态码的次数大于不健康阈值时
日志中提示加载模型失败,可能是因为容器在启动时加载模型失败。 解决方法 依次单击“初始化Daemon”、“注册任务”和“启动任务”,重启judge,重新启动容器后观察是否恢复正常。 父主题: 异常检测Judge定时任务失败
前提条件 已购买推理单元资源,具体购买方法请参见购买AI原生应用引擎包年包月资源。 由于在线运行需消耗资源,请确保账户有可用资源,且用户费用状态正常。 需要具备AI原生应用引擎管理员或开发者权限,权限申请操作请参见AppStage组织成员申请权限。 部署模型服务 在AI原生应用引擎的左侧导航栏选择“模型中心