检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
发策略的路由规则接收流量,处理流量并返回客户端。 应用场景 使用SLB为高访问量业务进行流量分发 对于业务量访问较大的业务,可以通过SLB设置相应的分配策略,将访问量均匀的分到多个后端服务器处理。例如大型门户网站,移动应用市场等。 使用SLB消除单点故障 对可靠性有较高要求的业务
输入节点备注信息,方便后续查阅节点功能。 添加其他节点,设置执行动作。 单击“添加执行动作”,选择节点和执行动作,根据知识检索流相关节点说明和工作流基础节点说明配置节点参数。 (可选)单击起始节点,在界面参数配置面板中单击“设置参数”,输入参数,用于调测知识检索流。 (可选)单击其
在AI原生应用引擎的左侧导航栏,选择“Agent编排中心 > 我的工作流”。 在“我的工作流”页面,单击“创建工作流”。 在“基本信息”对话框,设置工作流名称、描述,单击“确认”,进入工作流构建页面。 构建页面的画布中默认包含起始节点 ,起始节点用于启动工作流。 配置起始节点,具体配置说明请参见起始节点。
可以由字母、数字、空格、 $@+- 、冒号、逗号组成,长度不超过50位。 indexPage String 否 静态页面场景index页面设置,长度不超过255,非中文。 returnVal String 否 固定返回响应码,长度不超过255,非中文。 allowMethod String
工具链同步信息接口规格说明 本章节介绍开发中心工具链相关接口规格说明,可以参考对应的接口规格来实现具体的接口,并将接口配置在开发中心工具链集成页面,实现数据同步集成。 同步集成接口规格 参考如下接口规格实现接口并配置工具链同步集成,可以将开发中心中的数据(租户、产品、服务、微服务
住这些特征,使回复更加个性化。 约束限制: 变量包括一般变量和敏感变量,一般变量可用于对话和工作流,敏感变量只用于工作流。如果Agent中设置了敏感变量,敏感变量为必传,一般变量非必需。 取值范围: 一般变量common_variables和敏感变量sensitive_variables。
告警规则启动的时间间隔,即启动收敛的时间间隔,目前支持的范围是[5,30]分钟。 收敛条件 配置当前告警规则的收敛条件,满足条件的告警会按照设置的收敛维度进行收敛。当前支持通过告警类型、告警级别、告警详情筛选需要收敛的告警。其中告警详情可以填写告警中的关键字,数据库会根据like匹配关键字。
定制的url。 如需配置,建议配置为以@olc_degrade开头的字符串,并在服务里准备同名转发策略,配置好响应。 为空时默认使用SLB设置的状态码403。 根据需要开启白名单列表及黑名单列表开关,关闭时规则不生效。 单击“保存”。 父主题: 在SLB中创建和管理负载均衡实例
AppStage运维中心支持接入虚拟机日志和容器日志,您可以根据日志类型选择日志接入方式。 虚拟机日志接入:通过日志配置下发任务部署filebeat,并根据日志采集配置设置,通过filebeat采集虚拟机上的业务日志。 容器日志接入:安装daemonset插件,通过daemonset实现容器日志接入。 (可选
定制的url。 如需配置,建议配置为以@olc_degrade开头的字符串,并在服务里准备同名转发策略,配置好响应。 为空时默认使用SLB设置的状态码403。 根据需要开启白名单列表及黑名单列表开关,关闭时规则不生效。 单击“保存”。 父主题: 创建和管理负载均衡实例
资源的所有alias之间必须显式地在dependsOn字段中声明串行依赖。 component的resources属性中描述资源列表,通过设置资源的dependsOn属性描述对其他资源的依赖。 dependsOn是列表类型,每个元素使用type、name、alias等字段描述对其
介于1和4096之间。 默认取值: 4096。 n 否 Integer 参数解释: 返回体中包含的chatCompletionChoice数量,建议默认设置为1,最大限度地降低成本。 约束限制: 不涉及。 取值范围: 介于1和128之间。 默认取值: 1。 presence_penalty 否
Bash客户端克隆代码 本节内容指导如何使用Git Bash客户端克隆代码托管服务的仓库到本地环境中。 下载并安装Git Bash客户端。 设置SSH密钥。 获取仓库地址。 在仓库主页中,单击“克隆/下载”按钮,获取SSH地址,通过这个地址,可以在本地计算机连接代码托管仓库。 如果
(支持多选): 行业 适用领域 通用 配置部署模型参数,参数说明如表2所示。 表2 微调的模型部署参数说明 参数名称 参数说明 实例个数 设置模型服务部署的实例个数。 不同的模型部署1个实例需要的推理单元个数不同,比如,ChatGLM3-6B需要2个实例。 不同的模型因为模型参数
RetrievalConfig 参数 是否必选 参数类型 描述 retrieval_modes 是 Array of strings 参数解释: 检索模式,用于设置知识库检索召回时的检索方式。 约束限制: 不涉及。 取值范围: 可传多个值。枚举值:SEMANTIC_RETRIEVAL(使用向量进行文本
标准发布”。 在“标准发布检查结果”列表中,不同类型的版本显示相应的检查项的检查规则、检查结论和检查结果,检查项数据来源于组织管理员在版本活动页面设置的标准发布准入配置,具体操作请参见管理版本标准发布准入配置。 检查项均检查通过后,可以单击“下一步”,进入“标准发布”页面,继续申请标准发布。
标准发布”。 在“标准发布检查结果”列表中,不同类型的版本显示相应的检查项的检查规则、检查结论和检查结果,检查项数据来源于组织管理员在版本活动页面设置的标准发布准入配置。 检查项均检查通过后,可以单击“下一步”,进入“标准发布”页面,继续申请标准发布。 申请标准发布 可由开发人员、测试人员或项目经理提交版本标准发布申请。
其中<processor_name>指定某个算子操作,例如add_fields等。<condition>指定一个可选条件,如果条件存在,则只有在满足条件才执行算子,如果未设置任何条件,则始终执行算子。<parameters>是传递给算子的参数列表。 更复杂的条件处理可以通过使用if-then-else条件表达式
在版本详情页面的“版本持续交付”区域,选择“持续部署发布 > 调测发布”。 在“调测发布”页面单击“创建活动”,在“创建调测发布活动”页面,设置版本名称、备注(可选)。 调测发布的版本名称与标准发布的主版本名称前三段一致,仅需定义第四段编号,且第四段编号不能与标准发布的主版本名称第四段编号相同。
整数:最小值为0 百分比:0% ~ 100% maxSurge和maxUnavailable不能同时为0 maxUnavailable不能设置为100或者100%,避免升级时集群没有可用的pod。 rollingUpdateStrategy: maxSurge = "50%" maxUnavailable