正在生成
详细信息:
检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
请您关闭系统的历史纪录收集,以免泄露隐私。安装后ICAgent会加密存储您的AK/SK,有效保护敏感信息。 容器监控 在CCE容器监控场景下,AOM的采集器(ICAgent)必须以特权容器的方式运行,请合理的评估特权容器的安全风险,谨慎识别您的容器业务场景。如:节点对外提供的业务
单击列表右上角,在“表格设置”弹框中通过选中或取消选中可选列前的单选框,自定义可选列的展示与隐藏。 启停Agent,单击主机列表Agent启停列下的按钮,即可停止Agent。 批量操作Agent:选中多个主机前的复选框,单击“批量操作Agent”,即可批量开启、停止、删除Agent。 Agent状态说明详见下表。
设置规则说明: 分组条件最多可设置10个并行条件,每个并行条件下最多可设置10个串行条件,每个并行条件下可设置一个或多个告警行动规则。 多个串行条件之间是“和”的关系,多个并行条件之间是“或”的关系,告警需满足其中一个并行条件下的所有的串行条件。 例如,一个并行条件下设置了两个串行条件
新增一条事件类告警规则。 调用方法 请参见如何调用API。 URI POST /v2/{project_id}/event2alarm-rule 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 租户从IAM申请到的projectid,一般为32位字符串。
您可参考表1执行如下操作: 表1 操作说明 操作 方法 说明 查看事件统计数据 单击“事件分布图”,可通过柱状图查看在指定时间范围内和搜索条件下事件的统计数据。 - 父主题: 告警管理
在“Grafana 数据源配置信息”区域,可以获取当前Prometheus实例下内网或公网的Grafana 数据源配置代码,在右侧单击可复制该代码到对应文件。 在“服务地址”区域,可以获取当前Prometheus实例下内网或公网的Prometheus 配置代码,在右侧单击可复制该代码到对
警。当资源的指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。 告警规则分为阈值规则和事件类告警规则两种。通常情况下,通过阈值规则,实时监控环境中主机、组件等资源使用情况。当资源使用告警过多,告警通知过于频繁时,通过事件类告警规则,简化告警通知,快速识别服务的某一类资源使用问题并及时解决。
最近1小时内的所选组件的CPU使用率、内存使用率的趋势图,趋势图的每一个点分别表示1分钟内组件CPU&内存使用率的值。 趋势图上方的值为所选组件下监控的最新时间点CPU&内存使用率的值。 在卡片左下角通过勾选“隐藏系统组件”可隐藏系统组件。 集群监控(磁盘)卡片 图5 集群监控(磁盘)
更新事件类告警规则。 调用方法 请参见如何调用API。 URI PUT /v2/{project_id}/event2alarm-rule 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 租户从IAM申请到的projectid,一般为32位字符串。
您可参考表1执行如下操作: 表1 操作说明 操作 方法 说明 查看告警统计数据 单击“告警分布图”,可通过柱状图查看在指定时间范围内和搜索条件下告警的统计数据。 - 清除告警 在当前告警列表中单击目标告警所在“操作”列中的。 告警故障已经解除时可进行清除操作。 被清除的告警后续可在“历史告警”页签下查询。
件。当资源的日志数据满足设置的告警条件,产生日志告警。 告警规则分为指标告警规则、事件告警规则、日志告警规则以及应用性能监控告警。通常情况下,通过指标、日志和应用性能监控告警规则,实时监控环境中主机、组件等资源使用情况。当资源使用告警过多,告警通知过于频繁时,通过事件告警规则,简
st字样的告警。 设置规则说明: 静默条件最多可设置10个并行条件,每个并行条件下最多可设置10个串行条件。多个串行条件之间是“和”的关系,多个并行条件之间是“或”的关系,告警需满足其中一个并行条件下的所有的串行条件。 例如,串行条件设置为“告警级别等于提示”,则符合告警级别为提示的告警通知会被屏蔽。
可根据需要选择是否在组件列表对组件执行如下操作: 增加别名 当组件名称比较复杂,不便于识别时,可为该组件增加一个便于识别的别名。 在组件列表中,单击组件所在行“操作”列下的,输入别名,再单击“确定”,别名添加成功。添加的别名只允许修改,不允许删除。 添加标签 标签是组件的标识,通过标签您可区分系统组件和非系统
在Prometheus实例列表中,单击default类型Prometheus实例的名称,进入实例的详情界面。 在左侧导航栏中单击“仪表盘”,即可查看当前Prometheus实例下系统预置的所有仪表盘模板。 根据需要,单击对应仪表盘模板名称,即可监控当前Prometheus实例的指标数据。 例如,需要监控主机的磁盘分区
st字样的告警。 设置规则说明: 根源告警最多可设置10个并行条件,每个并行条件下最多可设置10个串行条件。多个串行条件之间是“和”的关系,多个并行条件之间是“或”的关系,告警需满足其中一个并行条件下的所有的串行条件。 例如,若串行条件设置为“告警级别等于紧急”,则符合告警级别为紧急的告警会被筛选出来,作为根源告警。
升级ICAgent。如果在步骤2中下拉列表框中选择的是“集群:xxx”,则单击“升级ICAgent”。可实现整个集群的升级操作,即在ICAgent列表下的所有主机一次性完成升级。如果在步骤2中下拉列表框中选择的是“其他:用户自定义接入主机”,则先选择主机后单击“升级ICAgent”。 (当前
图4 主机状态图表 组件状态图表:实时监控组件的状态。 图5 组件状态图表 资源TopN图表 资源TopN图表的统计单位为集群,统计对象为集群下的资源(这里的资源指主机、组件和实例)。资源TopN图表可视化地展示了集群中资源占用最高的N个资源,支持资源Top5、Top15数据的汇报展
据源。 全栈一体化监控 覆盖用户端、服务端及云产品所有监控数据,提供从数据发现、数据展示到数据异常告警的全方位、可视化监控服务,实现从上到下、从前端到后端的全栈一体化监控。 关联分析 应用和资源层层自动关联,通过应用、组件、实例、主机和事务等多视角下钻分析指标、日志、告警数据,直击异常。
etheus实例中,实现远程存储。 预聚合 通过配置预聚合规则将计算过程提前到写入端,可减少查询端资源占用,尤其在大规模集群和复杂业务场景下可以有效的降低PromQL的复杂度,从而提高查询性能,解决用户配置以及查询慢的问题。 当前仅Prometheus for CCE 实例支持。
在线程分析页面的右上角,单击“查询阻塞源线程”按钮,展示阻塞源线程的具体信息。 单击“重新执行”,重新执行查询操作。 在搜索栏中,输入搜索条件。单击,查看在该站点下满足搜索条件的线程信息。 线程分析展示:线程名称,CPU使用率以及线程数量。 支持按照NEW、BLOCKED、WAITING、TIMED_W