检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
发应用,业务实现更多使用云上服务,运维也转向云上的运维服务。对于云上应用的运维也提出了新的挑战。 图1 运维现有问题 运维人员技能要求高,配置繁杂,同时需要维护多套系统。对于分布式追踪系统,学习和使用成本高,并且稳定性差。 云化场景下的分布式应用问题分析困难主要表现在如何可视化微
当资源使用告警过多,告警通知过于频繁时,通过事件告警规则,简化告警通知,快速识别服务的某一类资源使用问题并及时解决。 告警通知 告警通知有2种方式: 直接告警:在配置告警规则的时候,可以配置告警通知规则,将告警信息通知相关人,以便提醒相关人员及时采取措施清除故障。告警方式包括邮件、短信、钉钉、企业微信、语音等方式。
ICAgent安装成功后,AOM中无法监控到CPU内存使用率等信息 问题描述 ICAgent安装成功后,AOM无法监控到CPU内存使用率等信息。 原因分析 8149端口未连通。 用户侧节点时间与所在时区当前时间不一致。 解决方法 以root用户登录安装ICAgent的服务器。 执
批量管理ICAgent插件 登录AOM 2.0控制台。 在左侧栏选择“设置”,进入全局配置界面。当前仅华南-广州区域的菜单路径为:在左侧导航栏选择“全局设置”,进入全局设置页面。 在左侧导航栏中,选择“采集设置 > UniAgent 安装与配置”。当前仅华南-广州区域的菜单路径为“采集设置 > UniAgent管理”。
您可以对已接入的CCE集群中的主机进行ICAgent插件的安装、升级和卸载操作: 安装ICAgent插件:当集群中的主机未安装ICAgent时,可以对所有主机安装ICAgent。 选择待执行安装操作的集群,单击“安装ICAgent”。 在弹出的页面中,单击“确认”,可对该集群所有主机安装ICAgent。 升级IC
您可以对已接入的CCE集群中的主机进行ICAgent插件的安装、升级和卸载操作: 安装ICAgent插件:当集群中的主机未安装ICAgent时,可以对所有主机安装ICAgent。 选择待执行安装操作的集群,单击“安装ICAgent”。 在弹出的页面中,单击“确认”,可对该集群所有主机安装ICAgent。 升级IC
在“仪表盘”页面右上角单击,保存修改结果。 新版仪表盘功能的图表配置与旧版仪表盘功能的图表配置不相同: 使用旧版仪表盘编辑新版仪表盘中创建的图表时,旧版仪表盘的图表配置无法兼容新版仪表盘的图表配置。 使用新版仪表盘编辑旧版仪表盘中创建的图表时,新版仪表盘的图表配置可以兼容旧版仪表盘的图表配置。 新增告警规则 添加图表时,新增告警规则
批量管理ICAgent插件 登录AOM 2.0控制台。 在左侧栏选择“设置”,进入全局配置界面。当前仅华南-广州区域的菜单路径为:在左侧导航栏选择“全局设置”,进入全局设置页面。 在左侧导航栏中,选择“采集设置 > UniAgent 安装与配置”。当前仅华南-广州区域的菜单路径为“采集设置 > UniAgent管理”。
组件监控 组件即您部署的服务,包括容器和普通进程。例如,云容器引擎(CCE)服务中的工作负载(workload)可以是一个组件,同时直接在虚机上运行的tomcat也可以是一个组件。 组件列表展示了每个组件的类型、CPU占用、内存占用和告警状态等信息,您可直观了解每个组件的运行状态
使用Prometheus监控CCE集群指标 配置多账号聚合实现指标统一监控 配置CCE集群监控采集指标规则 配置预聚合规则提升指标查询效率 配置数据多写实现监控指标转储到自建Prometheus 配置指标存储时长 通过仪表盘监控Prometheus实例指标数据 配置Remote Read地址实现
auth和Skip TLS Verify的开关必须开启。 图4 配置参数 配置完成后,单击“Save&Test”,验证是否配置成功。 配置成功即可使用Grafana配置Dashboards,查看指标数据。 图5 配置完成 父主题: Prometheus监控
后希望暂停日志收集,可以在配置中心进行设置。 登录AOM 2.0控制台。 在左侧导航栏选择“设置”,进入全局配置界面。 在左侧导航栏选择“日志设置”,单击“配额设置”页签。 登录LTS控制台。 在左侧导航栏选择“配置中心”。 配额设置 分词配置 通过配置分词可将日志内容按照分词符
是否需要安装ICAgent插件: true:安装ICAgent插件。默认安装最新版本的ICAgent插件。 false:不安装ICAgent插件。 plugin_install_base_param 否 PluginInstallBasicParam object 插件安装基础信息:
标上报的Prometheus实例,会产生一个新账单并开始按新配置的价格计费,旧账单停止计费。 如果您在一天内多次变更指标上报的Prometheus实例,将会产生多条计费信息。每条计费信息的开始时间和结束时间对应不同配置在该小时内的生效时间。 例如,您在9:00:00设置指标上报的
告警监控 AOM告警监控概述 配置AOM告警通知 配置AOM告警规则 查看AOM告警或事件 配置AOM告警降噪
确认stub_status模块启用之后,在nginx.conf配置文件中添加如下配置(nginx.conf配置文件一般在/usr/local/nginx/conf目录下)。示例如下: 执行如下命令在vi编辑器中打开nginx.conf配置文件: vi /usr/local/nginx/conf/nginx
含KafkaProducer等类型。 相关配置请参见查看组件消息队列监控项。 远程过程调用 远程过程调用监控项可以对组件的远程过程调用进行监控。 相关配置请参见查看组件远程过程调用监控项。 日志 设置关键字和时间范围进行日志搜索,相关配置请参见查看组件日志监控项。 基础设施 基础
固定时间:仅在指定的时间段执行屏蔽告警通知的操作。 周期时间:根据设置的时间周期循环执行屏蔽告警通知的操作。 时区/语言 告警通知被屏蔽的时区/语言,默认为用户首选项配置的时区/语言,可根据需要修改。 设置完成后,单击“立即创建”。 更多静默规则操作 静默规则创建完成后,您还可以执行表2中操作。 表2 相关操作
UniAgent和ICAgent安装类常见问题 UniAgent安装机和目标机器网络不通,报错提示“[warn] ssh connect failed, 1.2.1.2:22”如何解决? 答:安装之前先在安装页面单击连接测试,选择网络能通的安装机。 UniAgent安装成功后,后续的心跳和注册都失败,代理机网络不通,如何解决?
也生效。 如需设置审批配置、执行策略,可展开“更多设置”进行配置,配置参数如表3。 表3 更多设置 参数类别 参数名称 说明 审批配置 人工审核 选择是否开启人工审核开关,默认不打开。 审批配置不允许更改,如需更改,需在工具市场中对该原子服务卡片进行审批配置。 审批人设置 开启人工审核后,需要选择审批人。