检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
容器的标准输出日志支持多行采集。 5.12.130 支持将CCE日志直接接入LTS。 5.12.120 增加进程的最大句柄数指标。 支持LTS的podlb域名的切换能力。 5.12.111 新增线程指标、修复“获取lvs磁盘分区指标失败”问题。 5.12.100 上报内存指标增加内存workin
insecure_skip_verify: true bearer_token: 'SE**iH' 检查内网域名配置。 由于上述配置中的数据上报是通过内网进行数据传输,因此需要确保您的Prometheus所在的主机能够解析内网域名,请参考配置内网DNS。 重新启动Prometheus。 可通过Grafana查
是“和”的关系,多个并行条件之间是“或”的关系,告警需满足其中一个并行条件下的所有的串行条件。 若串行条件设置为“告警级别等于紧急”,则符合告警级别为紧急的告警通知会被屏蔽。 静默时间 告警通知被屏蔽的时间,包含以下两种: 固定时间:仅在指定的时间段执行屏蔽告警通知的操作。 周期
随着AOM 1.0相关功能逐步被AOM 2.0全面取代,AOM 1.0后续会逐步下线,建议用户将AOM 1.0升级到AOM 2.0版本,升级的相关操作请参见升级AOM。
统一数据采集Agent,完成统一插件生命周期管理,并为AOM提供指令下发,如脚本下发和执行。它自身不提供数据采集能力,运维由不同的插件分工采集,插件按需安装、升级和卸载。后续逐步上线其它插件(如云监控和主机安全),统一规范管理。 AK/SK 访问密钥。通过提供租户级别的AK/SK来安装ICAgent,以便于采集日志数据。
event2alarm_rule deleteEvent2AlarmRule 安装采集器 icmgr icagentInstall 升级采集器 icmgr icagentUpgrade 升级探针 icmgr pinPointUpgrade 卸载采集器 icmgr IcagentUninstall 指标和日志采集开关
待静默的告警通知需符合的条件,即满足该条件的告警通知均会被屏蔽。 取值范围说明: 告警级别:指标或事件告警的级别,可以设置为:紧急、重要、次要、提示。例如设置为:告警级别+等于+紧急。 资源类型:创建告警规则或自定义上报告警时选定的资源类型。可以设置为:host、container、proce
代理机创建完成后,可根据需要查看理区域下的代理机。具体操作如下: 在左侧导航栏中,选择“采集设置 > 代理区域管理”,进入代理区域管理页面。 单击代理区域名称,可查看该代理区域下的代理机。 删除代理机 用户可根据需要删除不再使用的代理机,具体操作如下: 在左侧导航栏中,选择“采集设置 > 代理区域管理”,进入代理区域管理页面。
当所选主机未安装UniAgent,但是安装了低版本的ICAgent时,界面弹出升级提示框,为了后续能自动安装UniAgent,您需要单击“升级”,先升级ICAgent到新版本(即确保ICAgent升级到5.12.218或以上版本)。 当所选主机未同时安装UniAgent和ICAg
上报APM(调用链、JVM)指标使用 30200: ICAgent的控制端口 30201: ICAgent的控制端口 如果界面上点击升级操作失败,该怎么办? 自定义集群场景下,如果界面上点击升级操作失败,您可以登录到vm节点上,直接执行安装命令再次安装即可。 ICAgent的安装是覆盖式安装,无需先卸载,直接安装即可。
连续周期:连续多少个周期满足阈值条件后,发送阈值告警。 统计周期:指标数据按照所设置的统计周期进行聚合。 告警级别:阈值告警的级别,包括:紧急、重要、次要、提示。 图1 自定义静态阈值模板 单击“立即创建”。 更多静态阈值模板操作 静态阈值模板创建完成后,您还可以执行表1中的操作。
删除主机 当主机的UniAgent状态为异常、未安装或安装失败时,可删除主机。 单击主机名称及IP地址右侧对应的“删除”。 说明: 安装中/升级中/卸载中的机器不能直接删除,请刷新页面等待状态更新后,再执行删除操作。 运行中的机器需要先卸载UniAgent才能删除。 安装机/代理机不能直接删除,请先取消相关设置。
配置相关API,包括查询aom2.0相关云服务授权信息和查询集群主机安装的ICAgent信息接口。 UniAgent管理 UniAgent相关API,包括下发批量安装,升级UniAgent任务,以及查询UniAgent主机列表接口。 应用资源管理(仅适用AOM 2.0) 应用资源管理相关API,包括新增、修改、查询、删除应用等接口。
统计周期指高级设置的统计周期;满足条件指设置的条件表达式。配置的统计周期次数须大于等于满足触发条件次数。 触发告警级别包括“紧急”、“重要”、“次要”、“提示”,默认“紧急”。 统计周期次数最小值为1,最大值为10。 高级设置 统计周期 条件表达式查询的频率可以设置为: 每小时:表示整点小时查询。
Agent客户端 当连续两分钟平均CPU使用率大于50%或者内存大于100M时,Agent客户端将自动重启。 Agent安装、升级或卸载 一次最多可对100台主机安装、升级或卸载Agent。 主机删除 一次最多可删除50台卸载了Agent的主机记录。
数如下: 此功能需要采集器ICAgent版本升级到5.10.79或以上版本。 表2 添加日志策略-容器路径 参数 参数说明 存储类型 设置为“容器路径”。 日志仅输出到容器路径,无需挂载主机路径。此功能需要采集器ICAgent版本升级到5.10.79或以上版本。 添加容器挂载 挂载路径
t状态。 安装失败,请参考卸载ICAgent章节的登录服务器卸载后重新安装,如果还未安装成功,请联系技术工程师。 后续操作 更多安装方式及升级、卸载ICAgent请参考ICAgent管理(华为云主机)。 父主题: 资源接入AOM
值组成。例如,统计周期为“1分钟”,检测规则设置为“平均值>1”,触发条件为连续周期“3”,告警级别为“紧急”,表示连续三个统计周期,指标的平均值大于已设置的阈值1时,生成紧急告警。 图9 设置告警规则 单击“高级设置”,设置检查频率、告警恢复等信息。 设置告警通知策略。告警通知
<td><div>账号:kaifatest;<br>通知类型:告警;<br>CAS应用名称: app-1;<br>告警类型:NA;<br>事件级别:紧急;<br>事件名称:lhy_test_001;<br>发生时间:2022-11-22 18:51:05 GMT+08:00;<br>事件源
、资源类型、事件源等条件进行过滤,默认按照事件级别过滤。 表1 搜索条件说明 搜索条件 搜索条件说明 设置样例 事件级别 支持选择如下事件级别进行搜索: 紧急 重要 次要 提示 事件级别:重要,即可查询出指定时间范围内事件级别为“重要”的事件。 资源类型 支持选择资源类型别进行搜索。 资源类型: