检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
限申请操作请参见申请权限。 已创建流程。 步骤一:创建预案 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“EAP&JOB > 流程 > 预案 > 预案管理”。 单击“创建”。 输入预案名称及预案描述,单击“确定”。
前提条件 已完成日志接入。 已完成创建导流任务。 操作步骤 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“日志 > 日志检索”。 在日志检索页面可以设置筛选条件,检索目标日志。 选择服
目前此功能仅支持白名单用户通过提交工单申请使用。详细操作请参考提交工单。 查看作业清单 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“EAP&JOB > 脚本执行 > 作业清单”。 默认进入“虚拟机作业清单”页签
进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“EAP&JOB > 脚本执行 > 文件分发”。 (可选)作业名称为系统自动生成的名称,可去勾选“自动命名”后自定义作业名称。 自定义作业名称的最大长度为12
间和业务中断,减轻可能出现的业务损失和客户流失。 提供实时监控和报告:AppStage运维中心集成了丰富的监控和报表功能,可以实时监控系统的性能指标、资源利用率和安全状态等。通过可视化的报表和图表,SRE可以随时了解系统的运行情况,进行及时的决策和调整。同时,这些信息也可以用于向上级管理层的汇报和运维成果展示。
已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 创建通知组 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“故障通报 > 通知组管理”,进入通知组管理页面。 单击“添加”。 填写通知组名
该功能当前只支持红版WeLink。 创建WeLink触发规则 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“EAP&JOB > 流程 > 规则”。 单击“创建规则”。 配置规则参数,参数
目前此功能仅支持白名单用户通过提交工单申请使用。详细操作请参考提交工单。 导出作业输出或日志 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“EAP&JOB > 脚本执行 > 作业清单”。 默认进入“虚拟机作业清单”页签
支持多种辅助线,便于编辑页面时对页面报表布局。 步骤二:查看监控数据 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“监控 > 业务报表”,进入所在服务监控大盘页面。 在监控大盘中查看具体的监控数据,也可在左侧切换页面查看不同的报表数据。
创建业务工具并执行脚本 监控服务支持创建业务工具用来定义相关业务脚本,例如机器的巡检、配置检查等,用户可以选择资源(虚拟机、容器或者虚拟机集群)来执行作业脚本。 目前此功能仅支持白名单用户通过提交工单申请使用。详细操作请参考提交工单。 前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。
KeyError 问题现象 在judge日志中出现KeyError提示。 可能原因 KeyError后面的字段存在问题,字段不存在或者字段值为空。 解决方法 在MPPDB表管理中检索告警原始表,查看表字段名是否与告警指标字段一致。 在MPPDB汇聚中新建任务,查询对应指标字段数据是否为空。
request错误提示,如下图: 可能原因 原始表数据量过大(超过500万),查询本次judge数据的SQL在10秒内没有执行完,后台mpp监控程序取消了本次查询。 解决方法 减少原始表数据量。 减少原始数据量,比如ttl可以减半。 如果是多个维度,可以拆成两个告警,原始表拆成多张表。
以配置合适的值用来监控此类接口。 no_model_threshold_lower 无模型阈值下限 0-100000000 默认值0 无模型时配置的阈值下限(固定阈值线)。 对于新增的接口,因为没有历史数据,无法训练出该接口的模型,此时可以配置合适的值用来监控此类接口。 alert_by_std
限申请操作请参见申请权限。 已创建流程。 步骤一:创建标签 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“EAP&JOB > 流程 > 标签 > 标签管理”。 单击“创建”。 配置标签
CES指标接入 云监控服务CES可以收集云服务内置监控指标的数据,可以通过监控这些指标来跟踪对应云服务状态。AppStage运维中心支持将CES收集的监控指标数据采集到运维中心监控服务中进行管理,可以参考支持监控的服务列表查看CES当前已支持的监控指标。 选择服务后首次使用监控服务,会初
已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 查看流程执行历史 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“EAP&JOB > 流程 > 历史”,进入“历史”页面。 在列表中查看流程的执行历史。
目前此功能仅支持白名单用户通过提交工单申请使用。详细操作请参考提交工单。 查看已上架的EAP动作 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“EAP&JOB > 流程 > EAP > 动作”,进入“动作”页面。 在列表中查看动作名称、类型、输入、输出,
too much null size 问题现象 动态阈值告警任务,judge历史的原始详情中出现too much null size报错。 可能原因 告警原始表中存在大量空值或者表无数据。 解决方法 在MPPDB汇聚中新建任务,查询告警原始表中数据是否正常。 检查汇聚任务及上游数
可以在告警任务“基础”中增加一个空白维度,并手动添加一个空白维度值,保存后,再将空维度删除并保存,此时告警结果表会更新,并带有alert_type字段。 父主题: 运维中心监控服务
ERROR - fail to load 问题现象 judge日志中出现ERROR - fail to load错误提示,如下图 可能原因 日志中提示加载模型失败,可能是因为容器在启动时加载模型失败。 解决方法 依次单击“初始化Daemon”、“注册任务”和“启动任务”,重启ju