检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
件)的日志文件。 AOM能监控其他云服务商的服务器吗? 可以,您需要先购买一台华为云创建弹性云服务ECS作为跳板机用于监控数据的转发,同时需要在其他云服务商的服务器上安装ICAgent。详细的操作步骤参考安装ICAgent(非华为云主机)。 采集器ICAgent对资源的占用大吗?例如内存、CPU。
将数据上传到ECS服务器。 下载mysqld_exporter-0.14.0.linux-amd64.tar.gz软件包,下载地址:https://prometheus.io/download/。 以root用户登录ECS服务器,将下载的Exporter软件包上传到ECS服务器并解压。
版本说明列表 发行时间 更新说明 2022-04-16 告警降噪功能优化。 2022-01-25 支持创建告警规则。通过告警规则可对服务设置事件条件或者对资源的指标设置阈值条件。当服务的资源数据满足事件条件时产生事件类告警。当资源的指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。
单击“告警”页签,查看告警信息。 设置时间范围,查看已设时间范围内产生的告警。可通过如下两种方式设置时间范围: 方式一:使用AOM预定义好的时间标签,例如,近1小时、近6小时等,您可根据实际需要选择不同的时间粒度。 方式二:通过开始时间和结束时间,自定义时间范围,您最长可设置为31天。 设置告警信息的刷
template.metadata.annotations代码段。 图3 编辑yaml文件 在代码段中按照实际需要依次设置相关参数,具体的参数说明请参见表1,设置完成后如图4所示。 表1 设置参数信息 参数名称 参数说明 是否必选 默认值 aom.application.name 应用名称。 是
当前实例比对值较小、蓝色表示该方法、类或线程,仅在当前实例侧存在、白色表示对比值相同。 鼠标放在火焰图上,展示某一个方法、类和线程的详细信息。 单击火焰图中某个方法条,该方法条横向放大。单击“Total”列标题行,火焰图还原。 table 展示方法路径、Baseline(基线总性
自定义静态阈值模板。 输入模板名称,选择资源类型,设置指标名称、统计方式、阈值条件等参数。 统计方式:指标数据按照所设置的统计方式进行聚合。 阈值条件:阈值告警的触发条件,由判断条件(≥、≤、>、<)和阈值组成。例如,阈值条件设置为“>85”,表示指标的实际值大于已设置的阈值85时,生成阈值告警。
关闭ECS实例 使用关闭ECS实例卡片可以创建任务,用来关闭一个或多个ECS实例。 创建关闭ECS实例任务 登录AOM 2.0控制台。 在左侧导航栏单击“自动化运维(日落)”,即可进入“自动化运维”界面。 在左侧导航栏中选择“服务场景”,在服务场景页面单击“关闭ECS实例”卡片,
络信息,以更加安全、可靠的方式将监控数据上报到自建Prometheus中。 前提条件 服务已接入ECS类型Prometheus监控,具体请参见Prometheus实例 for ECS。 服务已接入云服务类型Prometheus监控,具体请参见Prometheus实例 for 云服务。
容器监控和组件监控的区别在于所监控的对象不同。 组件监控是全量监控,监控对象为通过CCE部署的工作负载、通过ServiceStage创建的应用,或直接在ECS或BMS上部署的组件。 容器监控的对象仅为通过CCE部署的工作负载、通过ServiceStage创建的应用。 组件监控详细操作请参见:组件监控。
该指标用于统计主机本地时间与NTP服务器时间的偏移量,NTP偏移量越接近于0,主机本地时间与NTP服务器时间越接近。 - 毫秒(ms) aom_node_ntp_server_status NTP服务器状态 该指标用于统计主机是否成功连接上NTP服务器。 0、1 0表示已连接 1表示未连接
应用管理的使用说明 应用管理用于管理云服务对象与应用之间的关系,遵循“应用 + 子应用(可选)+ 组件 + 环境”的应用管理模型,主要用于管理ECS、RDS和ELB等云服务资源。 创建应用 添加节点 添加环境 关联资源 图1 应用管理模型 父主题: 应用管理
规则的描述信息,最多可输入1024个字符。 设置告警规则的详细信息。 设置“规则类型”为“事件告警规则”。 设置事件类型及对应事件来源。 事件类型设置为“系统事件”,此时事件来源只能选择“CCE”和“ModelArts”服务。 事件类型设置为“自定义事件”,事件来源请从现有的服务列表中选择。 设置告警规则详情。
在资源列表上方设置过滤条件,可实现资源列表过滤显示。 单击右上角的,可实时获取到所有资源实例的最新信息。 单击右上角的,通过选中/取消选中各展示项前的复选框,自定义其展示/隐藏。 资源列表仅展示与应用企业项目相同的资源。 设置完成后,单击“关联”。 如果关联的资源为云服务器ECS资源,需
定运行。弹性云服务器创建成功后,您就可以像使用自己的本地PC或物理服务器一样,在云上使用弹性云服务器。 您购买了弹性云服务器(弹性云服务器操作系统需满足表1中的使用限制,且购买后需要给弹性云服务器安装ICAgent,否则无法使用AOM监控)后,在AOM界面可对弹性云服务器的基础资
告警规则”,单击右上角的“添加告警”。 设置事件类告警规则。 设置告警基本信息:在“规则名称”文本框中输入告警规则名称,并根据需要填写规则的描述信息。 图1 设置告警基本信息 设置告警规则的详细信息。 设置“规则类型”为“事件类告警”。 设置告警来源、触发对象和触发策略。 表1 告警规则填写说明
统计周期指高级设置的统计周期;满足条件指设置的条件表达式。配置的统计周期次数须大于等于满足触发条件次数。 触发告警级别包括“紧急”、“重要”、“次要”、“提示”,默认“紧急”。 统计周期次数最小值为1,最大值为10。 高级设置 统计周期 条件表达式查询的频率可以设置为: 每小时:表示整点小时查询。
标,可以按如下方案设置: 告警条件a的指标设置为“aom_node_cpu_used_core”,其余参数采用默认设置。该指标用于统计测量对象已经使用的CPU核个数。 告警条件b的指标设置为“aom_node_cpu_limit_core”,其余参数采用默认设置。该指标用于统计测量对象申请的CPU核总量。
统计周期为“1分钟”,检测规则设置为“平均值>1”,触发条件为连续周期“3”,告警级别为“紧急”,表示连续三个统计周期,指标的平均值大于已设置的阈值1时,生成紧急告警。 图9 设置告警规则 单击“高级设置”,设置检查频率、告警恢复等信息。 设置告警通知策略。告警通知策略有两种方
静态IP:可选中指定CMDB应用下的ECS实例。 动态节点:选择CMDB应用中的节点,从而动态获取节点下的ECS实例。该方式对节点下未来新增的实例也生效。 如需设置审批配置、执行策略,可展开“更多设置”进行配置,配置参数如表3。 表3 更多设置 参数类别 参数名称 说明 审批配置