检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
上行错包率(aom_node_network_transmit_error_packets) 每秒网卡发送的错误包个数。 ≥0 个/秒(Count/s) 上行Pps(aom_node_network_transmit_packets) 每秒网卡发送的数据包个数。 ≥0 个/秒(Packet/s) 总Bps(aom_
级别的告警。或当节点故障发生时,抑制节点上的进程或者容器的所有其他告警。 注意事项 若在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,抑制对象(被源告警抑制的告警)将正常发送告警通知。 用户最多可创建100条抑制规则。 创建抑制规则 在左侧导航栏中选择“告警 >
监控”界面和“监控概览”界面查看发现的应用和应用对应的指标数据。 应用和组件的对应关系如下: 组件: 完成某项业务的最小工作单元(可以是微服务、容器进程或者普通进程)。 应用: 一个完整的业务模块,由多个组件组成。 在配置完应用发现之后,可以使用AOM监控应用的各项指标,关联应用对应的资源告警等,主要特性与场景如下:
s_dropped_total 发送队列Block丢弃数量 vm_persistentqueue_blocks_read_total 发送队列Block读取数量 vm_persistentqueue_blocks_written_total 发送队列Block写入数量 vm_pe
合并在一组的告警会被汇聚在一起发送一条通知。 合并方式包括: 按告警源:由相同告警源触发的告警,合并为一组发送告警通知。 按告警源 + 严重度:由相同告警源触发的告警,且其严重度相同时,合并为一组发送告警通知。 按告警源 + 所有标签:由相同告警源触发的告警,且其标签相同时,合并为一组发送告警通知。
查询事件类告警规则列表 新增一条事件类告警规则 更新事件类告警规则 删除事件类告警规则 查询事件告警信息 统计事件告警信息 上报事件告警信息 获取告警发送结果 删除静默规则 新增静默规则 修改静默规则 获取静默规则列表 通过规则名称获取告警行动规则 新增告警行动规则 删除告警行动规则 修改告警行动规则
V”将3中已复制的ICAgent安装命令粘贴至窗口中并单击“发送”,将复制的ICAgent安装命令发送至命令行窗口,如下图所示。然后在命令行窗口输入回车,执行ICAgent安装命令。 图2 复制粘贴按钮 图3 粘贴并发送安装命令 当显示“ICAgent install succe
9.0.0 64bit Kylin Kylin V10 SP1 64bit 对于Linux x86_64服务器,AOM支持上表中所有的操作系统及版本。 对于Linux ARM服务器,CentOS操作系统仅支持7.4 及其以上版本,上表所列的其他操作系统对应版本均支持。 资源使用限制
9.0.0 64bit Kylin Kylin V10 SP1 64bit 对于Linux x86_64服务器,AOM支持上表中所有的操作系统及版本。 对于Linux ARM服务器,CentOS操作系统仅支持7.4 及其以上版本,上表所列的其他操作系统对应版本均支持。 资源使用限制
日志分析(新版) AOM作为华为云服务可观测性分析统一入口,自身并不具有日志服务功能,AOM 2.0控制台中日志管理、日志接入、日志转储、日志加工相关功能由云日志服务LTS提供。用户可在AOM 2.0控制台界面操作,也可登录LTS控制台界面操作。 需要先购买云日志服务的相关功能,才可以使用AOM
安装ICAgent(非华为云主机) 前提条件 已购买弹性云服务器ECS作为跳板机。 满足AOM支持的操作系统及版本,支持amd64处理器架构。 弹性云服务器已绑定弹性IP地址。 确保本地浏览器的时间与弹性云服务器的时区、时间一致。 注意事项 非华为云上的服务器安装ICAgent时,系统自动生成的跳
rk_transmit_error_packets) 每秒网卡发送的错误包个数。 ≥0 个/秒(Count/s) 上行Pps(aom_container_network_transmit_packets) 每秒网卡发送的数据包个数。 ≥0 个/秒(Packet/s) 状态(aom_process_status)
安装ICAgent 前提条件 已购买弹性云服务器ECS作为跳板机。 满足AOM支持的操作系统及版本,支持amd64处理器架构。 弹性云服务器已绑定弹性IP地址。 确保本地浏览器的时间与弹性云服务器的时区、时间一致。 注意事项 非华为云上的服务器安装ICAgent时,系统自动生成的跳
例行运维需要查看的指标,可添加到仪表盘中,以便再次打开AOM时无需重新选择指标就可进行例行检查任务。 告警管理 告警列表是告警和事件的管理平台。 对于重点资源的指标您可以创建阈值规则,当指标数据满足阈值条件时,AOM会产生阈值告警。 日志管理 AOM提供强大的日志管理能力。日志检
根据指定字段对分组后的告警合并,合并在一组的告警会被汇聚在一起发送一条通知。 合并方式包括: 按告警源 按告警源 + 严重度 按告警源 + 所有标签 首次等待 首次创建告警合并集合后,等待多久发送第一次告警通知。通常设置为秒级别的时间,便于告警合并后再发送,避免告警风暴。 取值范围:0s-10min,推荐设置为
_service_total 微服务版本数 微服务版本数。 ≥0 个 servicecomb_service_center_db_instance_total 微服务实例数 微服务实例数。 ≥0 个 servicecomb_service_center_http_request_total
说明: 服务下架时,需确认服务是否被定时运维场景引用,如果已被引用,需先删除被引用场景,才能下架服务,具体见警告提示框的“引用详情”。 下架后服务场景页面将不展示该卡片,并且在工具市场页面系统默认的卡片会同步下架,作业方案卡片对应的执行方案发布状态更新为未发布。 下架服务卡片后
统计最新时间前1分钟内的主机的网络发送/接收速率在TOP5的主机信息。 最近1小时内的所选主机的网络发送/接收速率的趋势图,趋势图的每一个点分别表示1分钟内所选主机的网络发送/接收速率的值。 趋势图上方的值为所选主机的网络监控的最新时间点主机的网络发送/接收速率的值。 主机监控(CPU&内存)卡片
服务韧性 AOM服务提供了多种可靠性容灾能力,可以通过AZ内实例容灾、多AZ容灾、多集群容灾、数据多副本等技术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。
服务场景 服务场景概述 启动ECS实例 关闭ECS实例 重启RDS实例 修改ECS非管理员密码 重启CCE工作负载 清理磁盘空间 父主题: 运维管理(日落)