检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
根据表或任务类型查看数据血缘 监控服务支持查看运维数据的数据血缘、关系及数量等信息。 前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 查看数据血缘 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。
Task”启动该任务,保证期望状态和实际状态都为“Running”。 单击“Create Daily Task”,会自动创建天级的MPPDB汇聚任务和表(TTL默认2年),自动将小时级别的数据roll up成天级的。再单击“Start Daily Task”启动该任务,保证期望状态和实际状态都为“Running”。
警”、“批量通知”,可以让它进入已确认状态和已通知状态,该字段不会影响告警的处理流程属于是打标记的字段。 级别 告警上报时level字段代表级别,有提示、一般、严重和紧急四个等级,分别对应了上报时的notice、minor、major和critical。 操作 处理:为这条告警添
汇聚任务的创建和执行符合公司的数据管理政策和安全要求,同时审批流程也确保了汇聚任务的合理性和安全性,有助于控制资源的使用,避免资源的浪费。 汇聚任务的数量、运行时长和权限都受到一定控制,避免潜在的安全风险和资源过度使用,确保系统的稳定性和高效性。 前提条件 已获取服务运维岗位权限
创建告警升级规则升级告警级别 当需要提升告警的级别时,可以通过配置告警升级规则完成。例如严重告警和紧急告警关联的值班模板不同,可以通过升级告警级别,为指定告警修改值班人员。 如果某个告警命中了升级规则,被升级后,会按照对应级别的流程处理,包括是否被抑制、是否自动恢复、是否通知、以
运维中心监控服务 如何查看EAP详细日志? 删除告警任务失败 告警后触发知识编排任务提示alert_type不存在 创建CES指标采集报错
查看主机监控报表 如果在监控服务配置采集主机监控指标数据,会生成主机监控报表,可以从主机列表跳转查看主机监控报表。采集主机监控指标数据的操作请参见监控服务采集Linux主机监控指标操作流程。 查看主机监控报表 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维
以下条件检查CPU使用率的百分比值是否介于 0.5 和 0.8 之间。 range: system.cpu.user.pct.gte: 0.5 system.cpu.user.pct.lt: 0.8 network 检查该字段是否在某个IP网络范围内,支持IPv4和IPv6地址。可以使用CIDR表示法指定网络范围,例如“192
创建告警屏蔽规则屏蔽告警 告警屏蔽为您提供短时间的屏蔽功能,可以通过设置告警屏蔽的规则,告警将在屏蔽的时间内不再触发任何通知,规则过期后,将会被再次唤醒,屏蔽期间告警被清除后,将不再触发任何通知,减少您的处理频度。 当告警经过告警接入处理后进入告警处理模块时,会先判断告警是否符合
24:00)进行分片处理,分为几个时间段再进行配置。 按周 按周的模板是按天的进阶版,在按天的基础上,按照自然周的形式增加了对于周工作日的判断。和一天的配置一样,周配置的每个周工作日也可以根据时间片进行配置且比较灵活。 按月 按月的模板跟周类似,将配置的周期改为按自然月划分。 配置值班信息,值班信息参数说明如下:
查看已创建作业清单 作业清单页面可以查看虚拟机作业清单、容器作业清单。 查看作业清单 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“EAP&JOB > 脚本执行 > 作业清单”。 默认
告警进入条件:局部看曲线波动变大,或者长期看相比历史数据持续降低或升高。 告警退出条件:数据恢复到历史同期水平,持续18分钟则告警退出。 调优方法: 对于小幅度的波动和下降(上升)告警可以通过调节sensitivity敏感度来减少部分告警。 如果不关注这类异常,可以通过配置alert_by_std参数来实现
将接入数据导流至数据表中 监控服务已接入的数据,会保存在已创建或者系统自动创建的Kafka的Topic中,需要创建导流任务,将数据导流至ClickHouse或Influxdb数据表中。 将数据导流至ClickHouse/Influxdb表 进入AppStage运维中心。 在顶部导航栏选择服务。
创建过滤器在告警接入时过滤告警 通过创建过滤器,在告警接入时过滤指定告警,过滤后,告警会进入Bypass的数据库,不会进入告警处理模块,即不会显示在告警列表。 前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 创建过滤器过滤告警 进入AppStage运维中心。
查看已上架的EAP动作 动作是部署服务当前对各模块操作的封装,如部署任务,执行作业,确认告警等。可以查看当前EAP已经上架了哪些动作,包含哪些能力。 查看已上架的EAP动作 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。
创建运维事件通知组 通知组通常包括运维代表、开发代表、相关领域专家等。 通知组在运维事件发送通知、WarRoom基于通知组方式发送通知时使用。 前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 创建通知组 进入AppStage运维中心。 在顶部导航栏选择服务。
创建或关闭告警进行模拟测试 监控服务支持手动创建或关闭告警,对告警的其他规则进行模拟测试。 创建告警:快速创建告警,创建的告警与生成上报的告警流程相同,可以用来测试创建的告警升级规则、告警修复规则、值班组等是否正确生效。 关闭告警:关闭已创建的告警,手动恢复该告警。 前提条件 已
重大故障的一种应急处置的协同机制,创建WarRoom,并选择相关人员进行通知。 在重大故障发生时,需要知会问题处理经验比较丰富的运维、开发和问题相关的外部专家,通过添加通知组功能提前预置。 前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 创建WarRoom事件通知
导出作业输出或作业日志 支持导出已执行作业的输出或日志,并在“我的导出”页面查看。 导出作业输出或日志 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“EAP&JOB > 脚本执行 > 作业清单”。
告警标记规则名称。 生效时间 标记规则生效时间。 过期时间 标记规则过期时间。 应用/服务 匹配命中的服务。 类型 告警标记的标签,当前只有变更和演练两个选择。 工单号 输入工单号,为告警标记规则关联的工单。 描述信息 输入告警标记描述信息。 更多操作 告警标记规则创建后,您还可以对规则进行以下操作。