检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
安装ICAgent(华为云主机) ICAgent用于采集指标、日志和应用性能数据。对于在ECS、BMS控制台直接购买的主机,您需手动安装ICAgent。对于通过CCE间接购买的主机,ICAgent会自动安装,您不用安装ICAgent。 安装前提 在进行ICAgent安装前,需要先
ICAgent管理(华为云主机) 安装ICAgent 升级ICAgent 卸载ICAgent 父主题: 配置管理
安装ICAgent(非华为云主机) 前提条件 已购买弹性云服务器ECS作为跳板机。 满足AOM支持的操作系统及版本,支持amd64处理器架构。 弹性云服务器已绑定弹性IP地址。 确保本地浏览器的时间与弹性云服务器的时区、时间一致。 注意事项 非华为云上的服务器安装ICAgent时
ICAgent管理(非华为云主机) 安装ICAgent 升级ICAgent 卸载ICAgent 父主题: 配置管理
执行以下命令,查看IP地址对应的网卡,如图2所示。 ifconfig | grep IP地址 -B1 图2 查看IP地址对应的网卡 进入“/sys/devices/virtual/net/”目录下,查看是否存在该网卡的名称。 存在该网卡名称,则表示该网卡为虚拟网卡 => 5。 不存在该网卡名称,则表示该网卡不为虚拟网卡
登录AOM 2.0控制台。 在左侧导航栏选择“智能洞察(BETA)”。 在“智能洞察(BETA)”页面顶部的下拉列表中选择需要开通智能洞察的应用。 图1 选择应用 单击“立即开通”即可为当前应用开通智能洞察服务。 图2 开通智能洞察功能 父主题: 智能洞察(BETA)
确保本地浏览器的时间与弹性云服务器的时区、时间一致。 注意事项 非华为云上的服务器安装ICAgent时,系统自动生成的跳板机转发命令不包含域名信息,即不支持通过域名方式安装ICAgent。 操作步骤 非华为云上的服务器安装ICAgent,请先在华为云上购买一台弹性云服务器作为跳板机,然后执行如下操作:
若您未获取过AK/SK,请获取AK/SK。 在左侧导航栏中选择“配置管理 > Agent管理”。 单击“安装ICAgent”,主机类型选择“华为云主机”,安装方式选择“获取AK/SK凭证”。 单击“复制命令”复制安装命令。 使用PuTTY等远程登录工具,以root用户登录待安装ICA
通过华为云标签(Tag)分发告警 通过配合使用Prometheus监控和告警管理功能,可以按照华为云标签对资源进行告警。本文演示如何通过标签对DCS实例的CPU利用率指标进行告警。 实践场景 某电商平台运维人员在监控指标时,想要通过标签维度管理云上各种资源并分发告警。 解决方案
智能洞察(BETA) 开通智能洞察 通过AOM查看事件巡检数据 通过AOM查看事件根因分析结果 通过AOM查看故障传播链
或者其它升级失败场景,请直接登录节点使用安装命令重新安装ICAgent即可(覆盖式安装,无需卸载操作)。 父主题: ICAgent管理(华为云主机)
ICAgent开始升级,升级ICAgent预计需要1分钟左右,请耐心等待。待ICAgent的状态由“升级中”变为“运行”时,表示升级成功。 父主题: ICAgent管理(非华为云主机)
下行Pps(aom_node_network_receive_packets) 每秒网卡接收的数据包个数。 ≥0 个/秒(Packet/s) 下行错包率(aom_node_network_receive_error_packets) 每秒网卡接收的错误包个数。 ≥0 个/秒(Count/s) 上行Bps
卸载完成后,在应用运维管理左侧导航栏中选择“配置管理 > Agent管理”,查看该服务器ICAgent状态。 父主题: ICAgent管理(华为云主机)
install.sh; 当显示“ICAgent uninstall success”时,表示卸载成功。 父主题: ICAgent管理(非华为云主机)
下行Pps(aom_container_network_receive_packets) 每秒网卡接收的数据包个数。 ≥0 个/秒(Packet/s) 下行错包率(aom_container_network_receive_error_packets) 每秒网卡接收的错误包个数。 ≥0 个/秒(Count/s) 容器
IP是如何获取的? AOM会默认遍历虚机上的所有网卡设备,按照以太网卡、Bond网卡、无线网卡等优先级顺序获取IP,如果获取到的不是期望的地址,可以在启动ICAgent时设置进程的环境变量IC_NET_CARD=网卡名,获取指定网卡IP。 举例: 在/etc/profile中增加export
通过AOM查看事件巡检数据 事件巡检服务会定时巡检已开通智能洞察的应用服务,基于应用历史数据的平均RT、错误率等关键指标看护服务质量,全局分析问题。 功能说明 事件巡检基于应用的历史数据,形成动态上界,以比对服务近期时间的数据是否有异常。 获取基础数据时间范围如下: 基于应用3小
指标维度 说明 网络指标 clusterId 集群ID。 hostID 主机ID。 nameSpace 集群的命名空间。 netDevice 网卡名称。 nodeIP 主机IP。 nodeName 主机名称。 磁盘指标 clusterId 集群ID。 diskDevice 磁盘名称。
的传播关系,并展示服务及其关联服务的关键指标数据,可以更有效地定位根因。 查看故障传播链图谱 登录AOM 2.0控制台。 左侧导航栏单击“智能洞察(BETA)”。 在页面右上角设置应用的时间范围,您可以使用AOM预定义的时间标签,例如近1小时、近6小时等,也可以自定义时间范围。