检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建完成后,会根据所选实例及指标生成对应的模板数据,显示在模板列表中。同时采集的指标数据会保存在自动生成的Kafka Topic中。 如果生成的模板数量与勾选的指标数量不一致,请确认所选指标是否已购买对应云服务实例并完成相应配置,具体请参见对应的云服务。 一键生成指标。 单击“一键生成”,如图2所示。
igBean 否 通用及高级配置。 表2 PortConfig 参数名 类型 是否必选 说明 port String 是 监听端口,整型字符串,1-65535。 protocol String 是 协议,取值为:http、https、http2、http2(ssl)。 otherConfig
在工作流中添加LLM节点,可以使用大语言模型推理服务实现智能问答,在输入参数中引入前置节点的输出或自定义文本作为输入问题,大语言模型根据问题生成回答。 chat配置说明 输入 用户配置运行动作执行动作,相关参数说明如表1所示。 表1 输入参数说明 参数 是否必填项 说明 模型服务调用ID
不同的模型因为模型参数量不同,模型参数量越多,需要消耗的资源越多,因此需要的推理单元个数越多。 推理单元资源 在下拉列表可以查看已购买的推理单元的可用个数,根据实际情况选择。 如果推理单元个数不足以满足实例个数,则需减少实例个数以使推理单元资源满足需求。 说明: 在推理单元到期后,部署的模型将被下架,可通过购买推理单元资源恢复。
务安装和启动流程之前,如果业务先启动,之后才进行证书的申请,配置文件还未生成,也会出现找不到配置文件的问题。 若不存在,则要参考STS 2.0业务接入指南申请证书。如果配置的文件路径不是stsagent生成的默认路径,则需要手工将** /opt/huawei/certs/{Ser
配置作业参数,参数说明如表1所示,配置完成后,单击“保存”。 表1 创建日志清理作业参数说明 参数名称 参数说明 作业名称 作业名称为系统自动生成的名称,去勾选“自动命名”后可以自定义作业名称。 自定义作业名称的最大长度为128,可包含中文、字母、数字、下划线“_”、中划线“-”和中文括号()。
配置告警通知 告警的通知在所有的告警处理的链路结束以后才会发生。告警处理模块会根据上报告警的上下文获取告警的值班配置,值班配置由业务预置。配置对应的责任人,当告警生成时,通过WeLink、短信或电话形式,快速通知责任人。 新建语音值班配置前需要先新增模板。模板是产品级共享,模板列
约束限制: 不与memory同时生效,memory存在时memory优先生效。 取值范围: 不涉及。 默认取值: 随机生成的仅包含英文字母与数字的32位字符串。 variables 否 Object 参数解释: 变量用于用户个人信息,例如语言偏好等,并让Agent记住这些特征,使回复更加个性化。
维护告警。 告警收敛的对象是已经入库的告警,系统启动收敛任务,根据当前告警的状态将告警收敛成已解决的父告警和告警中的父告警,同时会写入告警的数据库中。 收敛告警:由多条维度相同的告警生成的一条父告警,父告警的状态根据子节点告警的状态变化。 原始告警:所有不是系统收敛而成的告警就是
请求唯一标识(UUID)。从AK/SK认证中获取。 是 - ak 为AK/SK凭证文件中的AK明文。从AK/SK认证中获取。 是 - sign 签名字符串。从AK/SK认证中获取。 是 - resource-code WiseAgent对外开放接口对应的唯一编码,每个接口唯一。请参考表5。 是
基础信息 参数 说明 名称 必填。在数据分析或监控系统中使用的指标标识符,通常是一个短字符串或缩写。 指标显示名 必填。在数据分析或监控系统中显示的指标名称,通常是一个更易于理解和识别的字符串。 描述 可选。对指标进行详细说明和解释的文字描述。 表2 指标配置 参数 说明 指标类型
至少正确部署过一次之后才能进行灰度升级。 配置了grayInstances即代表要进入多阶段灰度升级,且百分比只能配置为1%~100%(字符串);但是如果你第一阶段就直接配置为100%,则仍然执行普通升级模式。 灰度升级期间(包括进入灰度时),IaC配置中不允许修改grayStage
成后,单击“保存”。 定时作业创建完成后,会自动启动执行该作业。 表1 创建作业参数说明 参数名称 参数说明 作业名称 作业名称为系统自动生成的名称,去勾选“自动命名”后可以自定义作业名称。 自定义作业名称的最大长度为128,可包含中文、字母、数字、下划线“_”、中划线“-”和中文括号()。
配置任务参数说明 参数名称 参数说明 指标 选择指标仓库的指标。 任务名称 根据所选指标自动生成,可以自定义任务名称,只能包含字母、数字、下划线。 告警名 根据所选指标自动生成,可以自定义告警名。 异常检测生成的告警会展示在告警列表中,并展示告警名字段“AlertName”。 数据源类型
查看主机监控报表 如果在监控服务配置采集主机监控指标数据,会生成主机监控报表,可以从主机列表跳转查看主机监控报表。采集主机监控指标数据的操作请参见采集Linux主机监控指标操作流程。 查看主机监控报表 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 主机管理服务(VMS)”。
生成模型服务 将已有模型部署为模型服务 接入模型服务 创建路由策略用于提供模型服务 父主题: 管理模型
制造 公共事业 金融 互联网 政务 通用行业 适用任务类型 提示语适用的任务类型,包括: 对话问答 NL2SQL 多模生成 任务规划 文案生成 功能调用 代码生成 全功能 标签 为提示语选择标签分类。可从以下几个维度选择(支持多选): 行业 适用领域 通用 变量标识符 用户可选择以下符号标识提示语内容中的变量。
下一步”配置当前的分流规则。 当发布类型选择为“N阶段发布”时,需要确定风险等级及建议的发布阶段。 配置评估参数,单击“开始评估”,系统会根据不同的风险等级评估结果。 单击“下一步”。 在分流配置页面,输入分流规则名称,填写各个阶段的分流配置项,单击“下一步”。分流配置项的参数说明如表1所示。
下一步”配置当前的分流规则。 当发布类型选择为“N阶段发布”时,需要确定风险等级及建议的发布阶段。 配置评估参数,单击“开始评估”,系统会根据不同的风险等级评估结果。 单击“下一步”。 在分流配置页面,输入分流规则名称,填写各个阶段的分流配置项,单击“下一步”。分流配置项的参数说明如表1所示。
可选非流式、流式。二者区别如下: 非流式:调用大语言模型推理服务时,根据用户问题,获取大语言模型的回答,大语言模型完整生成回答后一次性返回。 流式:调用大语言模型推理服务时,根据用户问题,获取大语言模型的回答,逐个字词的快速返回模式,不需等待大语言模型生成完成。 输出最大token数 表示模型输出的最大token数。