检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
像-1和1这样的适度值将以较小的程度改变选择标记的概率。 使用logit_bias参数时,偏差被添加到模型生成的logits之前进行抽样。 max_tokens 否 Integer 返回体允许的最大token数。 n 否 Integer 返回体中包含的chatCompletio
对部署资源的配置漂移进行修复 部署服务通过IaC代码将资源部署到服务器后,服务器上资源的配置文件被人为修改,导致服务器上的资源配置与部署服务中的资源配置出现不一致,则认为发生了配置漂移。可以在“环境详情”页面查看资源是否存在配置漂移,如图1所示。 图1 配置漂移 用户对环境进行一
500 服务器内部错误或三方服务器内部错误。 { "error_code" : "AIAE.00001500", "error_msg" : "Internal Server Error." } 状态码 状态码 描述 200 成功。 500 服务器内部错误或三方服务器内部错误。
String 按照用户配置的工作流请求头参数配置,如果用户配置的工作流输入存在请求头输入,则应该配置对应的参数并在调用时输入特定的值。 表4 请求Body参数 参数 是否必选 参数类型 描述 body 否 Object 调用流请求体,与工作流起始节点配置相关,按照工作流的配置格式填写即可。
在“平台租户鉴权”页面,选择“平台API Key”页签,单击“新增平台API Key”。 3.在“新增平台API Key”对话框中的输入框设置API Key名称,用以区分API Key。 4.在弹出的下载窗口中单击“立即下载”,将API Key下载到本地查看。 5.使用时,需在sk前加上Bearer ,如Bearer
参数 是否必选 参数类型 描述 query_example 否 String 按照用户配置的知识检索流请求参数配置,如果用户配置的知识检索流输入存在查询参数,则应该配置对应的参数并在调用时输入特定的值。 请求参数 表3 请求Header参数 参数 是否必选 参数类型 描述 authorization
登录AI原生应用引擎,在左侧导航栏选择“模型中心 > 我的模型服务 > 我部署的”,model填写为对应模型服务的模型服务调用ID。 租户接入模型服务 登录AI原生应用引擎,在左侧导航栏选择“模型中心 > 我的模型服务 > 我接入的”,model填写为对应模型服务的模型服务调用ID。 响应参数 状态码:
标记)的关联偏差值。 像-1和1这样的适度值将以较小的程度改变选择标记的概率。 使用logit_bias参数时,偏差被添加到模型生成的logits之前进行抽样。 max_tokens 否 Integer 返回体允许的最大token数。 n 否 Integer 返回体中包含的cho
为隔离域关联ACL 网络ACL是一个子网级别的可选安全层,通过与子网关联的出方向/入方向规则控制出入子网的网络流量。ENS支持为已创建的虚拟机类型资源的隔离域关联ACL,本章节介绍如何为隔离域关联ACL。 前提条件 已获取服务运维岗位权限、基础运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。
本节介绍如何部署自管理主机节点。 实例节点所在的归属服务需要和实例所在的所属服务一致。在主机管理服务中,选择“主机列表 > 弹性云服务器”,单击主机名称,查看实例节点所在的归属服务。 部署前主机配置。 本例中的“appstage”是在VMS中主机绑定的业务账号,具体账号请以实际为准。业务账号详细介绍请参见为服务规划业务账号。
本节介绍如何部署自管理主机节点。 实例节点所在的归属服务需要和实例所在的所属服务一致。在主机管理服务中,选择“主机列表 > 弹性云服务器”,单击主机名称,查看实例节点所在的归属服务。 部署前主机配置。 本例中的“appstage”是在VMS中主机绑定的业务账号,具体账号请以实际为准。业务账号详细介绍请参见为服务规划业务账号。
Failed 未满足前提条件,服务器未满足请求者在请求中设置的其中一个前提条件。 413 Request Entity Too Large 由于请求的实体过大,服务器无法处理,因此拒绝请求。为防止客户端的连续请求,服务器可能会关闭连接。如果只是服务器暂时无法处理,则会包含一个Retry-After的响应信息。
待纳管主机的服务已规划业务账号。 约束限制 当前仅部分区域的主机支持接入AppStage运维中心,包括华北-北京四、华南-广州、华东-上海一、华东-上海二和华北-乌兰察布一 ,如需接入其他区域的主机,请联系技术支持工程师。 支持接入的主机操作系统如表1所示,其余类型的主机无法接入AppStage运维中心。
待纳管主机的服务已规划业务账号。 约束限制 当前仅部分区域的主机支持接入AppStage运维中心,包括华北-北京四、华南-广州、华东-上海一、华东-上海二和华北-乌兰察布一 ,如需接入其他区域的主机,请联系技术支持工程师。 支持接入的主机操作系统如表1所示,其余类型的主机无法接入AppStage运维中心。
置,通过filebeat采集虚拟机上的业务日志。 容器日志接入:安装daemonset插件,通过daemonset实现容器日志接入。 日志接入场景 表1 日志接入场景说明 场景 说明 日志接入方式 虚拟机日志 日志存储在虚拟机下的文件路径中。 虚拟机日志接入 容器hostPath日志
} 状态码: 500 服务器内部错误或三方服务器内部错误。 { "error_code" : "AIAE.00001500", "error_msg" : "系统内部错误。" } 状态码 状态码 描述 200 OK。 500 服务器内部错误或三方服务器内部错误。 错误码 请参见错误码。
负载均衡实例可以接受来自客户端的传入流量并分配给后端服务器。本章介绍如何创建负载均衡实例。 前提条件 需要具备AppStage服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 创建自管理模式的SLB实例,指的是将公有云ECS作为SLB主机,需要先申请ECS并将ECS纳管至运维中心的VMS中。
负载均衡实例可以接受来自客户端的传入流量并分配给后端服务器。本章介绍如何创建负载均衡实例。 前提条件 需要具备AppStage服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 创建自管理模式的SLB实例,指的是将公有云ECS作为SLB主机,需要先申请ECS并将ECS纳管至运维中心的VMS中。
转发策略配置 本章介绍通过IaC进行转发策略配置的管理,包括监听下的转发策略、健康检查、后端服务器及动态路由管理。对应的资源类型为WiseCloud::LoadBalancer::SLB::RouteRule。 表1 转发策略配置字段说明 参数名 类型 是否必选 说明 listenerGroupName
输入监听器描述信息。 后端云服务器组配置 名称 自定义后端云服务器组名称。 分配策略类型 选择分配策略类型。 加权轮询算法:根据后端服务器的权重,按顺序依次将请求分发给不同的服务器,权重大的后端服务器被分配的概率高。 加权最少连接:加权最少连接是在最少连接数的基础上,根据服务器的不同处理能力,