检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
式会随着用户账号的退出而退出,无法实时进行监控。为满足您的多样化需求,AOM支持您自定义全屏模式在线时长。 注意事项 为提高安全性,请在不需要使用全屏模式进行监控时,及时退出全屏模式。 全屏模式在线时长与是否操作无关,只要满足已设时长,则退出到登录界面。 全屏模式在线时长以最后一次设置为准。
webhook。 topic 否 string 邮件主题。 sendType 否 string 当消息模板发送类型为“webhook”时需要指定消息模板格式,支持:HTML、JSON。 verison 是 string 默认为v2。 响应参数 无 请求示例 修改消息模板名称为test2的消息模板。
指标接入规则的名称。规则名称可以包含大小写字母,数字,特殊字符(_-),以字母开头,最大长度为50。 云服务指标配置 接入云服务指标:选择需要接入的云服务,将云服务指标接入到AOM的普罗实例中。 设置云服务指标接入: 在云服务列表中“是否接入”列下打开或关闭的开关,即可接入云服务指标到AOM或移除接入到AOM的指标。
webhook。 topic 否 string 邮件主题。 sendType 否 string 当消息模板发送类型为“webhook”时需要指定消息模板格式,支持:HTML、JSON。 verison 是 string 默认为v2。 source 否 String 消息通知模板类型:
员及时采取措施清除故障,避免造成业务损失。 监控 提供应用监控、组件监控、主机监控、容器监控、指标浏览等功能。 应用监控 应用是您根据业务需要,对相同或者相近业务的一组组件进行逻辑划分,AOM提供以应用维度整体进行监控。 组件监控 组件即您部署的服务,包括容器和普通进程。 组件列
周期时间:根据设置的时间周期循环执行屏蔽告警通知的操作。 时区/语言 告警通知被屏蔽的时区/语言,默认为用户首选项配置的时区/语言,可根据需要修改。 设置完成后,单击“立即创建”。 更多静默规则操作 静默规则创建完成后,您还可以执行表2中操作。 表2 相关操作 操作 说明 修改静默规则
webhook。 topic 否 string 邮件主题。 sendType 否 string 当消息模板发送类型为“webhook”时需要指定消息模板格式,支持:HTML、JSON。 verison 是 string 默认为v2。 type Array of strings 消息通知方式。
取值范围:0s-10min,推荐设置为 15s。 变化等待 合并集合内的告警数据发生变化后,等待多久发送告警通知。通常设置为分钟级别的时间。如果您需要尽快收到告警通知,也可设置为秒级时间。 此处的变化是指新增告警或告警状态改变。 取值范围:5s-30min,推荐设置为60s。 重复等待
container_cpu_usage_seconds_total 容器在所有CPU内核上的累积占用时间 container_file_descriptors 容器打开的文件描述符数量 container_fs_inodes_free 文件系统的可用inode数量 container_fs_inodes_total
时,所有检查项同时满足,AOM才能发现进程。 添加检查项完成后,单击“开始探测”,查找符合的进程。 如果20s后未探测到符合条件的进程,您需要修改发现规则后继续探测;如果探测到符合的进程,将可进入下一步的操作,否则不能进入后续操作。 设置应用名称及组件名称。 设置应用名称。 设置应用名称。
设置插值方式 单击“插值方式”,将指标数据按照所设置的插值方式进行聚合。当指标图表出现断点时,AOM默认使用null(即空值)表示断点。当您需要使用指标图表做汇报或展示时,出现断点的指标图表不太美观,您可通过切换插值为0或null的方式,对缺失的指标数据进行断点插值,进而规避掉断点。
用户对资源进行分析和管理。 环境标签 为已创建的应用环境添加标签,便于用户快速过滤和查找相同属性的应用环境。 资源监控 接入中心 快速接入需要监控的业务层、应用层、中间件层、基础设施层指标。 不支持 支持 仪表盘 将不同图表展示到同一个屏幕上,通过多种图表形式展示资源的指标、日志和性能数据。
webhook。 topic 否 string 邮件主题。 sendType 否 string 当消息模板发送类型为“webhook”时需要指定消息模板格式,支持:HTML、JSON。 verison 是 string 默认为v2。 type Array of strings 消息通知方式。
取值范围:0s-10min,推荐设置为 15s。 变化等待 合并集合内的告警数据发生变化后,等待多久发送告警通知。通常设置为分钟级别的时间。如果您需要尽快收到告警通知,也可设置为秒级时间。 此处的变化是指新增告警或告警状态改变。 取值范围:5s-30min,推荐设置为60s。 重复等待
每个主机的容器个数缩减到1000个以内时,ICAgent将恢复该主机应用指标采集,并清除“ICAgent停止采集应用指标”告警 。 由于JOB在完成任务之后,会自动退出。如果您需要监控JOB指标,要保证存活时间大于90秒才能采集到指标数据。 采集器资源消耗 采集器在采集基础指标时的资源消耗情况和容器、进程数等因素有关
趋势图上方的值为所选集群下监控的最新时间点CPU&内存使用率的值。 更多监控概览界面操作 您还可以执行表1中的操作。 表1 相关操作 操作 说明 将卡片移至收藏夹 如果不需要关注某个卡片时,可单击卡片右上角的并选择“移至收藏夹”。卡片移至收藏夹后将在“监控概览”界面隐藏。若后续又需使用时,您可从收藏夹中快速获取。
每个主机的容器个数缩减到1000个以内时,ICAgent将恢复该主机应用指标采集,并清除“ICAgent停止采集应用指标”告警 。 由于JOB在完成任务之后,会自动退出。如果您需要监控JOB指标,要保证存活时间大于90秒才能采集到指标数据。 采集器资源消耗 采集器在采集基础指标时的资源消耗情况和容器、进程数等因素有关
每个主机的容器个数缩减到1000个以内时,ICAgent将恢复该主机应用指标采集,并清除“ICAgent停止采集应用指标”告警 。 由于JOB在完成任务之后,会自动退出。如果您需要监控JOB指标,要保证存活时间大于90秒才能采集到指标数据。 采集器资源消耗 采集器在采集基础指标时的资源消耗情况和容器、进程数等因素有关
图8 作业执行方案任务执行详情 发布成服务 作业的执行方案可以发布生成服务卡片,执行方案发布后在服务场景中可以查看。作业的执行方案发布成服务,需要有cms:publish:update权限或cms:toolmarket:update权限。服务卡片的相关操作参见服务场景。 在左侧导航栏