检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
本文档介绍如何建设完整的指标体系和统一监控大盘,实现资源和应用的全方位、立体化、可视化监控。 实践场景 用户体验至上的互联网时代,页面的响应速度、访问时延和页面的访问成功率常常会影响用户的体验,如果无法及时获知,就会导致流失大量用户,某商城的运维人员使用开源的监控软件,虽然能采集很多指标,但却分散在各处,无法统一展示。
输入过滤属性和对应的过滤值,指定过滤条件来选择实例。 支持设置多个过滤条件,搜索时多个过滤属性之间为“与”的关系。 该方式对未来新增的实例也生效。 标签 设置标签键和对应的标签值,指定一个或多个标签来选取实例。 选择多个标签时,按照“与”的关系搜索。 该方式对未来新增的实例也生效。
通过cmdb树选择云服务资源执行任意任务时,会校验已选择的资源是否在当前用户所选择的子项目下,若资源不属于当前子项目下,将不会操作这些资源。 解决方法 检查需要操作的资源是否在当前用户所选择的子项目下,若资源不属于当前子项目下,重新选择子项目或将需要操作的资源添加到该子项目下。查看资源信息的详细操作请参考资源管理。
工具市场 工具市场会按照场景分类展现各功能的工具卡片,目前支持以下类型: 通用场景:脚本管理、文件管理。 云服务场景:启动ECS实例、关闭ECS实例、重启RDS实例、修改ECS非管理员密码、重启CCE工作负载。 软件部署:暂时为空。 日常巡检:暂时为空。 故障处理:清理磁盘空间。
超时时间必须小于等于采集周期。 执行用户:执行采集任务的用户,即所选主机的用户,默认为root,并且当前只支持root账号采集。 单击“立即创建”,完成自定义Exporter插件接入。 已接入的插件会显示在采集任务页面。单击对应的采集任务名称,在弹出的面板中可以查看采集任务的配置信息。 父主题: 虚机场景Exporter接入
Service,CTS),是华为云安全解决方案中专业的日志审计服务,提供对各种云资源操作记录的收集、存储和查询功能,可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。 用户开通云审计服务并创建和配置追踪器后,CTS可记录AOM的管理事件用于审计。 CTS的详细介绍和开通配置方法,请参见CTS快速入门。
Service,CTS),是华为云安全解决方案中专业的日志审计服务,提供对各种云资源操作记录的收集、存储和查询功能,可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。 用户开通云审计服务并创建和配置追踪器后,CTS可记录AOM的管理事件用于审计。 CTS的详细介绍和开通配置方法,请参见CTS快速入门。
查询时间序列 场景描述 本章以查询一个节点的CPU使用率时间序列为例。 涉及的基本信息 查询时间序列前,需要确定节点的ID和集群ID的值,节点ID值可以在ECS的dimensions中查看,集群ID值可以在CCE的“集群管理”页面,基本信息的dimensions中查看。 CPU使用
卸载”,然后在弹出页面中,单击“确认”即可卸载主机的UniAgent。 新版“UniAgent 安装与配置”页面:在“ECS云服务”或“其他服务器”页签中单击“卸载”,然后在弹出页面中,单击“确认”即可卸载主机的UniAgent。 您还可以以root用户登录需卸载UniAgent的服务器,执行如下命令手动卸载UniAgent。
任务执行日志中的执行机与任务配置的不一致 可能原因 该任务中配置的执行机已被删除或无权限,则执行时会忽略这些执行机,不显示在执行日志中。 解决方法 自动化运维在执行任务时会校验任务参数中的有效的执行机,请检查当前任务中配置的执行机是否都有效。 父主题: 运维管理(即将下线)
实例、ECS类型的Prometheus实例支持指标查看、新增和废弃功能。 在指标管理页面仅支持查询近3个小时内上报的指标。 default类型的Prometheus实例下,指标名以“aom_”、“apm_”开头以及资源类型为ICAgent的指标暂不支持废弃。 ECS类型的Prom
found 问题现象 在ECS执行脚本任务时失败,系统提示“agent not found”。 可能原因 没有正确安装UniAgent。 UniAgent为非“运行中”状态。 解决方法 检查UniAgent的状态,UniAgent状态有运行中、异常、安装中、安装失败和未安装,若UniA
ometheus for 云服务”和“Prometheus for 多账号聚合”的实例上报的基础指标和自定义指标数量。 指标上报量统计周期为1小时,如果设置的查询时间范围小于1小时,可能会导致指标累计上报量查询结果为0。 “资源消耗”页面展示的指标上报量可能与实际指标上报量存在一定误差。
概述 接入管理提供监控数据上报的网络通道建立和解除,以及监控数据上报使用的认证凭据生成和吊销等功能,帮助您快速的将监控数据接入到AOM。 本功能当前开放区域为:华北-北京一、华北-北京二、华东-上海一、华南-广州、中国-香港、亚太-新加坡,华东-上海二,华北-北京四,西南-贵阳一
设置采集普罗指标的目标端IP地址和端口号,例如:10.0.0.1:3306。 指标采集间隔(秒) 指标采集的周期,单位为秒(s),默认为60s,可选择10、30和60。 指标采集超时时间(秒) 执行指标采集任务的超时时间,单位为秒(s),默认为60s,可选择10、30和60。 说明: 超时时间必须小于或等于采集周期。
若回显信息不为“404”,则说明端口未连通 => 请联系网络管理开放端口后,重新安装ICAgent。如果仍未安装成功,请联系技术支持工程师。 执行以下命令,检查用户侧节点时间。 date 若查询到的用户侧节点时间和所在时区当前时间一致 => 请联系技术支持工程师。 若查询到的用户侧节点时间和所在时区当前时间不一致
设备信息。 在ECS主机的“进程列表”页签下,可查看该主机的进程状态、IP地址等信息。 在进程列表右上角的搜索框可按进程名称等设置搜索条件,实现进程过滤显示。 单击右上角的,可获取到设置的时间范围内进程的最新信息。 在CCE主机的“Pod实例”页签下,可查看实例状态、节点IP等信息。
单击右上角的,通过选中/取消选中各展示项前的复选框,自定义其展示/隐藏。 资源列表仅展示与应用企业项目相同的资源。 设置完成后,单击“关联”。 如果关联的资源为云服务器ECS资源,需要单击“关联资源&安装Agent”,在关联资源后继续完成Agent安装。安装Agent的详情操作请参见“安装UniAgent”。
是为AOM服务提供中间件指标采集和自定义指标采集的能力。 UniAgent本身不提供数据采集能力,运维数据由不同的插件分工采集。 ICAgent:ICAgent插件主要是作为AOM和LTS的采集端,用于指标采集和日志采集。 图1 ICAgent和UniAgent概述图 父主题: 采集管理
监控 “√”表示支持,“x”表示暂不支持。 表1 监控 权限 对应API接口 授权项 IAM项目(Project) 企业项目(Enterprise Project) 查询时间序列 POST /v2/{project_id}/series aom:metric:list √ × 查询时序数据