检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
周期值,每个周期清零,重新计数。 匹配超时次数 M 周期值,每个周期清零,重新计数。 请求平均时延 M 周期内请求的平均时延,单位:微秒。 请求最大时延 M 周期内请求的最大时延,单位:微秒。 请求最小时延 M 周期内请求的最小时延,单位:微秒。 表3 服务级日志 字段名称 必选(M)/可选(O)
交互,订购AI原生应用引擎、运维中心、运营中心之后,为保证服务正常使用,需要进行服务授权。同意服务授权后,AppStage将在统一身份认证服务为您创建名为appstage_admin_agency的委托,为保证服务正常使用,在使用AppStage服务期间,请不要删除或者修改app
Agent问答的时候没有回答 思考模型没有配置鉴权,或者鉴权失效了,可以通过模型调测功能测试思考模型是否正常,具体操作请参见调测/体验模型。 父主题: AI原生应用引擎
取数据集id。 约束限制: 不涉及。 取值范围: 只能由英文字母、数字以及“-”组成,且长度为36个字符。 默认取值: 不涉及。 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 Authorization 是 String 参数解释: 鉴权信息。获取平台API
取数据集id。 约束限制: 不涉及。 取值范围: 只能由英文字母、数字以及“-”组成,且长度为36个字符。 默认取值: 不涉及。 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 Authorization 是 String 参数解释: 鉴权信息。获取平台API
error timeout 转发头设置 转发http请求时,重新设置请求头中的Key对应的Value;对应配置文件中proxy_set_header key value。 重定向 将请求的url指定为另一个url,由客户端重新发起请求到目标url;对应配置文件中rewrite key
error timeout 转发头设置 转发http请求时,重新设置请求头中的Key对应的Value;对应配置文件中proxy_set_header key value。 重定向 将请求的url指定为另一个url,由客户端重新发起请求到目标url;对应配置文件中rewrite key
客户端向应用程序发出请求。 负载均衡实例中的监听接收与配置的协议和端口匹配的请求。 监听再根据配置将请求转发至相应的后端服务器集群。如果配置了转发策略,监听会根据配置的转发策略评估传入的请求,如果匹配,请求将被转发至相应的后端服务器组。 后端服务器集群中健康检查正常的后端服务器将根据
客户端向应用程序发出请求。 负载均衡实例中的监听接收与配置的协议和端口匹配的请求。 监听再根据配置将请求转发至相应的后端服务器集群。如果配置了转发策略,监听会根据配置的转发策略评估传入的请求,如果匹配,请求将被转发至相应的后端服务器组。 后端服务器集群中健康检查正常的后端服务器将根据
文本排序(Rerank)API规范 接口格式 类型:POST 协议:HTTP/HTTPS 请求体参数 表15 请求体参数 参数 是否必选 参数类型 描述 query 是 String 原始请求问题,基于该问题对候选文本进行排序。 top_n 是 Integer 返回排序靠前的n个结果。
包含默认的WISEAGENT_USER_INPUT参数,如图1所示,表示在Agent调用工作流时,以用户在问答对话中输入的内容作为工作流的请求参数。不满足要求的工作流无法选用。 图1 引入用户对话输入 父主题: AI原生应用引擎
low_count_threshold 小请求量 0- 100000000 默认值0 请求量低于此参数值时毛刺告警、波动性不生效;其他类型的告警依然生效。 如果毛刺告警较多,可以配置该参数。 count_threshold 请求量保护 0-100000000 默认值100000000 请求量低于此参数值时,完全不告警。
Service,简称ACMS,也称为Security Token Service,简称STS)为云服务业务提供了以下两个功能: 微服务之间请求认证 ACMS为每个接入的微服务,颁发了用于通信中进行认证的STS认证凭据,两个微服务之间通信时,可以使用该认证凭据,进行STS认证。 为
Service,简称ACMS,也称为Security Token Service,简称STS)为云服务业务提供了以下两个功能: 微服务之间请求认证 ACMS为每个接入的微服务,颁发了用于通信中进行认证的STS认证凭据,两个微服务之间通信时,可以使用该认证凭据,进行STS认证。 为
进入AI原生应用引擎,在左侧导航栏选择“知识中心 > 知识库”,可从页面知识库id栏获取。 约束限制: 不涉及。 取值范围: 不涉及。 默认取值: 不涉及。 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 Authorization 是 String 参数解释: 鉴权信息。获取平台API
进入AI原生应用引擎,在左侧导航栏选择“知识中心 > 知识库”,可从页面知识库id栏获取。 约束限制: 不涉及。 取值范围: 不涉及。 默认取值: 不涉及。 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 Authorization 是 String 参数解释: 鉴权信息。获取平台API
取数据集id。 约束限制: 不涉及。 取值范围: 只能由英文字母、数字以及“-”组成,且长度为36个字符。 默认取值: 不涉及。 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 Authorization 是 String 参数解释: 鉴权信息。获取平台API
日志中提示加载模型失败,可能是因为容器在启动时加载模型失败。 解决方法 依次单击“初始化Daemon”、“注册任务”和“启动任务”,重启judge,重新启动容器后观察是否恢复正常。 父主题: 异常检测Judge定时任务失败
选择开启或关闭健康检查,默认关闭。 正常状态码 检查到后端服务器状态正常时,返回的状态码。 默认为200、302,可以自定义。 响应超时时间 检查的超时时间,即超过该时间后结束检查。 健康检查周期 每次健康检查的间隔时间。 不健康阈值 选择2~10,当未收到正常状态码的次数大于不健康阈值时
参数 说明 降级url 当一个请求被降级时,默认会返回403。 如果业务想定制自己的响应,请先在SLB监听管理中定义好对应的转发策略,url以@olc_degrade开头,在此处填写进行关联。 当前降级等级 当前降级等级规定了降级程度。低于或等于该等级的请求将被降级。包括以下几种: 普通接口(一级)