检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如何处理界面“ICAgent状态”为“离线”的问题? ICAgent安装完成后,界面“ICAgent状态”为“离线”。 问题分析 原因:AK/SK配置不正确或30200、30201端口未连通。 影响:ICAgent无法正常使用。 解决办法 以root用户登录安装ICAgent的服务器。
主机监控 主机包括弹性云服务器(ECS)、裸金属服务器(BMS)。AOM既可监控通过创建CCE、ServiceStage集群时购买的主机,也可监控非CCE、ServiceStage集群环境下购买的主机(购买的主机操作系统需满足操作系统及版本,且购买后需要给主机安装ICAgent,
等常用系统设备信息。 在ECS主机的“进程列表”页签下,可查看该主机的进程状态、IP地址等信息。 在进程列表右上角的搜索框可按进程名称等设置搜索条件,实现进程过滤显示。 单击右上角的,可获取到设置的时间范围内进程的最新信息。 在CCE主机的“Pod实例”页签下,可查看实例状态、节点IP等信息。
将云服务或CCE集群接入Prometheus实例后,即可通过Grafana查看AOM中相关集群或云服务的指标数据。 前提条件 已购买弹性云服务器ECS。 已购买弹性公网IP,并绑定到购买的弹性云服务器ECS上,具体操作请参见《弹性公网IP快速入门》。 服务已接入可观测Prometheus 监控
资源监控使用限制 表2 资源监控使用限制 分类 限制项 说明 仪表盘 仪表盘数量 1个区域中最多可创建1000个仪表盘。 仪表盘中的图表数量 1个仪表盘中最多可添加50个图表。 仪表盘中图表可选资源、阈值规则、组件或主机数量 1个数字图最多可添加12个资源,只能展示1个资源,默认展示第一个资源。
在弹框中选择操作类型,配置对应的插件信息,并单击“确认”,即可执行对应的操作。 表1 插件操作参数说明 参数 说明 操作类型 插件批量操作有六种操作类型:安装、升级、卸载、启动、停止和重启。 服务器上的ICAgent被卸载后,会影响该服务器的运维能力,导致AOM无法采集到客户相关的指标信息,请谨慎操作。
资源分组支持用户从业务角度集中管理其业务涉及到的弹性云服务器、云硬盘、弹性IP、带宽、数据库等资源。从而按业务来管理不同类型的资源、告警规则、告警记录,可以迅速提升运维效率。 创建资源分组 针对使用多种云产品的用户,通过资源分组功能将同一业务相关的弹性云服务器、裸金属服务器、云硬盘、弹性IP、带宽、
通过grafana查看AOM中的指标数据 前提条件 已购买弹性云服务器ECS。 已购买弹性公网IP,并绑定到购买的弹性云服务器ECS上,具体操作请参见《弹性公网IP快速入门》。 操作步骤 安装并启动Grafana,具体操作请参见Grafana官方文档。 添加AccessCode。
在弹框中选择操作类型,配置对应的插件信息,并单击“确认”,即可执行对应的操作。 表1 插件操作参数说明 参数 说明 操作类型 插件批量操作有六种操作类型:安装、升级、卸载、启动、停止和重启。 服务器上的ICAgent被卸载后,会影响该服务器的运维能力,导致AOM无法采集到客户相关的指标信息,请谨慎操作。
监控IoTDA服务某一实例: 单击任一实例名称,然后单击“仪表盘”页签,可查看当前实例下需要重点关注的关键资源或指标。 单击任一实例名称,然后单击“指标”页签,可查看当前实例下IOTDA上报的全量指标数据曲线。 单击任一实例名称,然后单击“资源空间”页签,可查看当前实例下的资源空间。 父主题: 资源监控
日志路径”的虚机列表中查看到您的虚机。 注意事项 AOM日志采集路径配置的虚拟机列表,只展示操作系统为Linux的弹性云服务器或裸金属服务器。 若日志采集路径配置的是目录,则默认采集目录下的日志(只采集*.log、*.trace和*.out类型的文本日志文件);若配置的为具体某个
Failed 未满足前提条件,服务器未满足请求者在请求中设置的其中一个前提条件。 413 Request Entity Too Large 由于请求的实体过大,服务器无法处理,因此拒绝请求。为防止客户端的连续请求,服务器可能会关闭连接。如果只是服务器暂时无法处理,则会包含一个Retry-After的响应信息。
在进行ICAgent安装前,需要先确保本地浏览器时间与服务器时区、时间都一致。若有多个服务器,则要保证本地浏览器、多个服务器的时区、时间都一致。否则,可能会导致安装后不能在界面上准确查看应用、服务器的指标数据。 安装方式说明 ICAgent有两种安装方式,您可以按照您的场景进行选择。您需要注意的是,下述两种安装方式
监控云容器引擎 CCE的指标 云容器引擎 CCE是一个企业级的集群托管服务,基于云服务器快速构建高可靠的容器集群,帮助您轻松创建和管理多样化的容器工作负载。应用运维管理(Application Operations Management,简称AOM)是云上应用的一站式立体化运维管理
AK/SK签名认证方式仅支持消息体大小12MB以内,12MB以上的请求请使用Token认证。 AK/SK既可以使用永久访问密钥中的AK/SK,也可以使用临时访问密钥中的AK/SK,但使用临时访问密钥的AK/SK时需要额外携带“X-Security-Token”字段,字段值为临时访问密钥的security_token。
示“接口调用”详细信息。 单击“远程过程调用”,切换至消息队列页签。默认展示“全部实例”的“GRPCServer监控”信息。 图1 查看远程过程调用 在下拉列表中选择您想要查看的“实例名称”和“监控项”,可以查看该实例在对应采集器下的不同指标集下的应用监控数据。 您还可以根据需要执行以下操作:
多写功能的Prometheus实例的名称,进入该实例的详情页面。 在左侧导航栏单击“数据多写”。 设置内网连通配置。 选择终端节点服务。请从下拉列表选择合适的终端节点服务。 选择的终端节点服务需要和自建Prometheus是同一个VPC。目前仅支持后端资源类型为云服务器、弹性负载均衡类型的终端节点服务。
新版“UniAgent 安装与配置”页面:在“ECS云服务”或“其他服务器”页签中单击“重装”,然后在弹出的页面中,按照界面提示重新安装UniAgent。 升级UniAgent 为了更好的提供采集功能使用,提供更可靠稳定的UniAgent版本。当主机的UniAgent状态为运行中且低版本时
适合需要对容器服务集群及其上面运行的应用进行一体化监控场景。 Prometheus实例 for ECS ECS 通过在VPC内的某台虚机上安装uniagent(Exporter)插件提供针对此VPC内ECS应用和组件(如数据库,中间件等)的一体化监控。 适合需要对运行在华为云的虚拟私有云VPC内
新版“UniAgent 安装与配置”页面:在“ECS云服务”或“其他服务器”页签中单击“重装”,然后在弹出的页面中,按照界面提示重新安装UniAgent。 升级UniAgent 为了更好的提供采集功能使用,提供更可靠稳定的UniAgent版本。当主机的UniAgent状态为运行中且低版本时