检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
生成模型服务 将已有模型部署为模型服务 自建模型并发布为模型服务 创建路由策略用于提供模型服务 父主题: 管理模型
应用指标摸板库生成指标运行失败 问题描述 应用指标摸板库生成指标时,提示运行失败。 处理方法 检查选择的数据源和应用的模型是否匹配。模型对选择的数据是有要求的,数据源和模型之间不匹配,将导致指标运行失败。 父主题: 运营中心
启用模型服务 在“我部署的”页签服务列表中,单击“操作”列“启用”。 停用模型服务 在“我部署的”页签服务列表中,单击“操作”列“停用”。 父主题: 生成模型服务
创建完成后,会根据所选实例及指标生成对应的模板数据,显示在模板列表中。同时采集的指标数据会保存在自动生成的Kafka Topic中。 如果生成的模板数量与勾选的指标数量不一致,请确认所选指标是否已购买对应云服务实例并完成相应配置,具体请参见对应的云服务。 一键生成指标。 单击“一键生成”,如图2所示。
非流式:调用大语言模型推理服务时,根据用户问题,获取大语言模型的回答,大语言模型完整生成回答后一次性返回。 流式:调用大语言模型推理服务时,根据用户问题,获取大语言模型的回答,逐个字词的快速返回模式,不需等待大语言模型生成完成。 输出最大token数 表示模型输出的最大长度。 温度 较高的数值
非流式:调用大语言模型推理服务时,根据用户问题,获取大语言模型的回答,大语言模型完整生成回答后一次性返回。 流式:调用大语言模型推理服务时,根据用户问题,获取大语言模型的回答,逐个字词的快速返回模式,不需等待大语言模型生成完成。 输出最大token数 简称max_tokens,表示模型输出的最大长度。
的组件,可以全量或者部分进行变更。 等待1~2分钟(具体时间长短取决于资源的数量以及当前系统的负载),变更计划生成完毕后,可以在“任务流程图”中查看此次变更的“变更流程图”和“变更流水线”,确认无误后可以点击“提交”执行变更。 父主题: 应用部署
明的组件,可以全量或者部分进行变更。 等待1~2分钟,具体时间长短取决于资源的数量以及当前系统的负载,变更计划生成完毕后,可以在“任务流程图”中查看此次变更的“变更流程图”和“变更流水线”,确认无误后可以单击“提交”执行变更。 父主题: 部署上线
明的组件,可以全量或者部分进行变更。 等待1~2分钟,具体时间长短取决于资源的数量以及当前系统的负载,变更计划生成完毕后,可以在“任务流程图”中查看此次变更的“变更流程图”和“变更流水线”,确认无误后可以单击“提交”执行变更。 父主题: 使用部署服务进行自动化变更
明的组件,可以全量或者部分进行变更。 等待1~2分钟,具体时间长短取决于资源的数量以及当前系统的负载,变更计划生成完毕后,可以在“任务流程图”中查看此次变更的“变更流程图”和“变更流水线”,确认无误后可以单击“提交”执行变更。 创建虚拟机集群 进入AppStage运维中心。 在顶部导航栏选择服务。
查看主机监控报表 如果在监控服务配置采集主机监控指标数据,会生成主机监控报表,可以从主机列表跳转查看主机监控报表。采集主机监控指标数据的操作请参见监控服务采集Linux主机监控指标操作流程。 查看主机监控报表 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维
自动添加warehouse类型数据源。 图1 报表模板 业务报表开发流程 使用业务报表进行业务监控的流程如图2所示。 图2 业务报表开发流程图 服务运维岗位或运维管理员权限人员开发业务报表 新增业务报表数据源:首次使用数据源进行报表开发,需要先新增数据源后才能使用。 新增业务报表
接口详解 了解Oauth2.0协议登录流程(与OrgID的交互流程) 图1 Demo登录流程图 登录获取code:应用A首先需要在OrgID平台上进行注册,并进行相应的配置,比如,首页登录url,退出地址url等,然后用户通过浏览器在OrgID界面单击应用或者直接访问应用服务地址
视化画布流程编排进行业务集成。 细分领域如金融、电网场景,需要对推理结果进行定制调整,则可在AI原生应用引擎使用模型在线微调训练功能,快速生成行业场景定制模型服务,满足用户特定需求。 对话沟通 针对客户服务和销售团队,通过对话沟通,快速理解并响应客户的需求,以提供高效的解决方案或
创建或关闭告警进行模拟测试 监控服务支持手动创建或关闭告警,对告警的其他规则进行模拟测试。 创建告警:快速创建告警,创建的告警与生成上报的告警流程相同,可以用来测试创建的告警升级规则、告警修复规则、值班组等是否正确生效。 关闭告警:关闭已创建的告警,手动恢复该告警。 前提条件 已
功能说明 统计cpu信息,每次采集都为每个vcpu,以及总cpu维度分别生成消息。 原始数据来源:/proc/loadavg、/proc/stat等。 参数配置 插件默认为CPU0、CPU1、...、CPU-ALL分别生成消息。用户可根据需要配置_filter_cpu_id项,进行消息筛
优化后生效 根据使用的算法版本区分动态告警还是静态告警,比如正常使用的boxplot_ad动态阈值算法生成的就是动态告警,fixed_threshold固定阈值算法生成的就是静态告警。 动态告警:告警调优涉及修改参数包括metric_type、sensitivity、low_
制造 公共事业 金融 互联网 政务 通用行业 适用任务类型 提示语适用的任务类型,包括: 对话问答 NL2SQL 多模生成 任务规划 文案生成 功能调用 代码生成 全功能 标签 为提示语选择标签分类。可从以下几个维度选择(支持多选): 行业 适用领域 通用 变量标识符 用户可选择以下符号标识提示语内容中的变量。
配置任务参数说明 参数名称 参数说明 指标 选择指标仓库的指标。 任务名称 根据所选指标自动生成,可以自定义任务名称,只能包含字母、数字、下划线。 告警名 根据所选指标自动生成,可以自定义告警名。 异常检测生成的告警会展示在告警列表中,并展示告警名字段“AlertName”。 数据源类型 默
配置任务参数说明 参数名称 参数说明 指标 选择指标仓库的指标。 任务名称 根据所选指标自动生成,可以自定义任务名称,只能包含字母、数字、下划线。 告警名 根据所选指标自动生成,可以自定义告警名。 异常检测生成的告警会展示在告警列表中,并展示告警名字段“AlertName”。 数据源类型 默