检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建自动分发文件作业 监控服务支持配置文件分发作业,完成自动化文件分发。 目前此功能仅支持白名单用户通过提交工单申请使用。详细操作请参考提交工单。 前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 已设置执行机。 创建文件分发作业 进入AppStage运维中心。
创建定时作业执行脚本 监控服务支持配置定时作业,通过指定作业执行的时间、周期,分批次执行作业脚本。 目前此功能仅支持白名单用户通过提交工单申请使用。详细操作请参考提交工单。 前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 已设置执行机。 创建定时作业
前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 已创建类型为welink_trigger的流程,具体操作请参见创建流程。 使用限制 该功能当前只支持红版WeLink。 创建WeLink触发规则 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维
KeyError 问题现象 在judge日志中出现KeyError提示。 可能原因 KeyError后面的字段存在问题,字段不存在或者字段值为空。 解决方法 在MPPDB表管理中检索告警原始表,查看表字段名是否与告警指标字段一致。 在MPPDB汇聚中新建任务,查询对应指标字段数据是否为空。
日志接入场景介绍 AppStage运维中心提供统一的AIOps平台能力,将业务日志数据从业务服务器接入到AIOps平台。AIOps日志服务平台提供了数据接入配置界面化管理和采集器Agent自动化部署的能力。 日志接入方式 虚拟机日志接入:通过日志配置下发任务部署filebeat,
可以在告警任务“基础”中增加一个空白维度,并手动添加一个空白维度值,保存后,再将空维度删除并保存,此时告警结果表会更新,并带有alert_type字段。 父主题: 运维中心监控服务
动作是部署服务当前对各模块操作的封装,如部署任务,执行作业,确认告警等。可以查看当前EAP已经上架了哪些动作,包含哪些能力。 目前此功能仅支持白名单用户通过提交工单申请使用。详细操作请参考提交工单。 查看已上架的EAP动作 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维
使用。详细操作请参考提交工单。 前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 已创建流程。 步骤一:创建标签 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“EAP&JOB
目前此功能仅支持白名单用户通过提交工单申请使用。详细操作请参考提交工单。 前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 查看流程执行历史 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“EAP&JOB
request错误提示,如下图: 可能原因 原始表数据量过大(超过500万),查询本次judge数据的SQL在10秒内没有执行完,后台mpp监控程序取消了本次查询。 解决方法 减少原始表数据量。 减少原始数据量,比如ttl可以减半。 如果是多个维度,可以拆成两个告警,原始表拆成多张表。
异常检测的能力是基于指标仓库、MPPDB数据库及异常检测服务所构建的。指标仓库定义了数据的来源和数据的计算方式。MPPDB数据库用来检测过程中的数据进行存储。而异常检测服务提供了异常检测的计算调度及告警能力。所以异常检测的前提条件是配置了相关指标,并分配了MPPDB及异常检测集群(初始化监控服务会自动分配集群)。
目前此功能仅支持白名单用户通过提交工单申请使用。详细操作请参考提交工单。 前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 创建流程 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“EAP&JOB
创建业务工具并执行脚本 监控服务支持创建业务工具用来定义相关业务脚本,例如机器的巡检、配置检查等,用户可以选择资源(虚拟机、容器或者虚拟机集群)来执行作业脚本。 目前此功能仅支持白名单用户通过提交工单申请使用。详细操作请参考提交工单。 前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。
重启judge Daemon,调优的参数立即生效。 动态告警优化后生效 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“AI辅助诊断 > 异常检测”,进入“异常检测”页面。 单击已修改告
fail to load model json 问题现象 judge日志中显示trainModel is null或trainModel is {},并且提示fail to load model json,表示训练完成后judge未成功加载训练模型。 解决方法 依次单击“初始化D
judge_data_size(in):0 问题现象 judge历史的原始详情中出现judge_data_size(in):0提示。 可能原因 judge没有获取到数据。 解决方法 检查告警原始表汇聚任务配置的汇聚提前时间和judge任务的汇聚提前时间,保证对应时间点能够获取到数据即可。
too much null size 问题现象 动态阈值告警任务,judge历史的原始详情中出现too much null size报错。 可能原因 告警原始表中存在大量空值或者表无数据。 解决方法 在MPPDB汇聚中新建任务,查询告警原始表中数据是否正常。 检查汇聚任务及上游数
支持多种辅助线,便于编辑页面时对页面报表布局。 步骤二:查看监控数据 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“监控 > 业务报表”,进入所在服务监控大盘页面。 在监控大盘中查看具体的监控数据,也可在左侧切换页面查看不同的报表数据。
ERROR - fail to load 问题现象 judge日志中出现ERROR - fail to load错误提示,如下图 可能原因 日志中提示加载模型失败,可能是因为容器在启动时加载模型失败。 解决方法 依次单击“初始化Daemon”、“注册任务”和“启动任务”,重启ju
TypeError: not supported between instances of 'str' and 'float' 问题现象 在judge日志中出现TypeError: not supported between instances of 'str' and 'float'提示。