检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
轮询:支持按照服务实例的位置信息顺序路由。 响应时间权值:提供最小活跃数(时延)的权重路由,支持业务处理慢的服务实例接收较少的请求,防止系统停止响应。这种负载均衡策略适合请求量少且稳定的应用。 会话粘滞:会话粘滞是负载均衡器上的一种机制,在设定的会话保持时间内,会保证同一用户相关联的访问请求会被分配到同一实例上。
并重新选择正确的资源包或保证账户中的余额充足。 未购买资源包,在按需计费模式下账户的余额不足。 欠费影响 包年/包月 对于包年/包月的服务资源,用户已经预先支付了资源费用,因此在账户出现欠费的情况下,已有的包年/包月资源仍可正常使用。然而,对于涉及费用的操作,如添加超出开发中心用
为隔离域关联ACL 网络ACL是一个子网级别的可选安全层,通过与子网关联的出方向/入方向规则控制出入子网的网络流量。ENS支持为已创建的虚拟机类型资源的隔离域关联ACL,本章节介绍如何为隔离域关联ACL。 前提条件 已获取服务运维岗位权限、基础运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。
我的工具类:包含AI原生应用引擎资产中心预置的三方工具以及自创建的工具。 资产中心预置的三方工具:在AI原生应用引擎的左侧导航栏选择“资产中心” ,选择“工具”页签,单击工具卡片,在工具详情页面可以查看工具描述、执行动作、参数配置等信息。 自创建的工具:工具是API的代理或容
同时,您可以体验平台预置的Agent,享受AI带来的便利和乐趣。 数据管理 除平台预置的数据集外,同时还支持创建知识数据集和微调数据集。丰富的知识数据集及强大的索引配置是构建专业化、结构化知识库的基础;微调数据集是模型微调的基础,通过在微调数据集上进行训练,您可以获得改进后的新模型以适应特定任务。
成一条数据标注。 对于单条标注,还可执行以下操作: 单击标注右侧“添加回答”可继续添加多条output。 单击标注右侧“删除”,可删除标注。 对于标注中的output,还可执行以下操作: 单击output所在行右侧的“自动生成”,由平台内置的模型自动生成当前行的output信息。
使小幅度下降的异常不告警,针对阈值线过紧的情况,图1的异常通过敏感度调节不了,因为阈值线相对是合理的 配置count_threshold参数,如果不关注请求量很少的异常,可以配置该参数,建议非必要情况下不要配置该参数,可能会出现遗漏告警的情况。 毛刺告警 两三个显著的毛刺点异常,如图2所示。
模型服务调用ID 是 需要调用的大模型。 对于资产中心预置的模型,在资产中心选择“大模型”页签,单击模型卡片进入模型详情页面,查看模型服务调用ID。 对于我的模型(我部署的、我接入的)和我的路由策略,需要填写模型服务调用ID,请单击“获取模型服务调用ID”,进入“我的模型服务”页面,在模型服务列表中单击复制。
模型服务调用ID 执行检索规划所调用的模型。 对于资产中心预置的模型,在资产中心选择“大模型”页签,单击模型卡片进入模型详情页面,查看模型服务调用ID。 对于我的模型(我部署的、我接入的)和我的路由策略,需要填写模型服务调用ID,请单击“获取模型服务调用ID”,进入“我的模型服务”页面,在模型服务列表中单击复制。
负载均衡实例中的监听接收与配置的协议和端口匹配的请求。 监听再根据配置将请求转发至相应的后端服务器集群。如果配置了转发策略,监听会根据配置的转发策略评估传入的请求,如果匹配,请求将被转发至相应的后端服务器组。 后端服务器集群中健康检查正常的后端服务器将根据分配策略和在监听中配置的转发策略
负载均衡实例中的监听接收与配置的协议和端口匹配的请求。 监听再根据配置将请求转发至相应的后端服务器集群。如果配置了转发策略,监听会根据配置的转发策略评估传入的请求,如果匹配,请求将被转发至相应的后端服务器组。 后端服务器集群中健康检查正常的后端服务器将根据分配策略和在监听中配置的转发策略
在“日志接入”页面,选择左侧导航栏的“集群插件管理”。 在集群列表中单击待安装插件的集群所在行“操作”列的“安装插件”。 在“插件安装”页面配置安装参数,具体内容如下所示,配置完成后,单击“确定”。 输入日志挂载路径:挂载到容器指定挂载点中的容器所在宿主机的文件目录,通常为宿主机上日志文件的hostpa
需要个性化定制模型或者在特定任务上追求更高性能表现的场景。这是通过在与任务相关的微调数据集上训练模型来实现的,所需的微调量取决于任务的复杂性和数据集的大小。在深度学习中,微调用于改进预训练模型的性能。 2 生成模型服务 将已有模型部署为模型服务 接入模型服务 支持通过API接入模
PostgreSQL、GeminiDB(for Cassandra)及GaussDB类型的实例,仅支持在包年/包月计费模式下进行扩容,按需计费的实例无需扩容,会自动扩容。 对于RDS for mySQL类型的数据库实例,在包年/包月和按需计费两种模式下都支持扩容。 前提条件 需要具备Ap
包年/包月是一种先付费再使用的计费模式,适用于对资源需求稳定且希望降低成本的用户。通过选择包年/包月的计费模式,您可以预先购买云服务资源并获得一定程度的价格优惠。本文将介绍包年/包月AppStage套餐包的计费规则。 适用场景 包年/包月计费模式需要用户预先支付一定时长的费用,适用于长期、稳定的业务需
金券和折扣券等条件返还一定金额到您的账户。详细的退订规则请参见云服务退订规则概览。 如果您已开启“自动续费”功能,为避免继续产生费用,请在自动续费扣款日(默认为到期前7日)之前关闭自动续费。 按需计费资源 对于按需计费模式的资源,例如按需计费的大模型微调服务API在线调用-SFT
PostgreSQL、GeminiDB(for Cassandra)及GaussDB类型的实例,仅支持在包年/包月计费模式下进行扩容,按需计费的实例无需扩容,会自动扩容。 对于RDS for mySQL类型的数据库实例,在包年/包月和按需计费两种模式下都支持扩容。 前提条件 需要具备Ap
表4 日志采集配置参数说明 参数名称 参数说明 日志项目 选择已创建的日志项目,相同服务的不同日志使用同一个日志项目。 日志空间 选择已创建的日志空间。选择日志空间时日志提取规则会展示日志空间定义的日志格式,采集的日志须满足对应格式。 配置名称 自定义日志采集配置名称。 配置类型
击使用Agent。 单击对话输入框中的,上传.wav、.mp4、.mp3格式的文件,可以对上传的音频文件提问。 如果创建Agent时开启了“支持语音输入”开关,您也可以单击对话输入框中的,通过语音输入问题。 如果创建Agent时,使用配置变量的方式实现了记忆能力,在使用Agent
灰度服务配置 本章介绍通过IaC进行灰度服务配置的管理,包括灰度规则的管理及灰度阶段切换。对应的资源类型为WiseCloud::LoadBalancer::GrayConfig。 灰度比例转换为pod个数是通过向下取整法,例如:共6个pod,如果灰度比例配置为10%,灰度pod个数则为6