检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如何获取AK/SK? 每个用户最多可创建2个访问密钥(AK/SK),且一旦生成永久有效。 AK(Access Key ID):访问密钥ID,是与私有访问密钥关联的唯一标识符。访问密钥ID和私有访问密钥一起使用,对请求进行加密签名。 SK(Secret Access Key):与访
日志分析 Prometheus监控 基础设施监控 应用监控 常见问题 了解更多常见问题、案例和解决方案 常见使用问题 如何区分告警和事件? 怎样查看AOM中的日志是通过哪个应用产生的? 如何区分Prometheus监控功能采集的基础指标和自定义指标数据? ICAgent和UniAgent是同一个插件吗?
如何处理界面“ICAgent状态”为“离线”的问题? ICAgent安装完成后,界面“ICAgent状态”为“离线”。 问题分析 原因:AK/SK配置不正确或30200、30201端口未连通。 影响:ICAgent无法正常使用。 解决办法 以root用户登录安装ICAgent的服务器。
体系,将1000+种指标数据全方位呈现,数据丰富全面。 表1 AOM支持的四层指标体系 类型 来源 指标举例 如何接入 业务层指标 通常来源于端侧日志SDK、提取的ELB日志。 访问UV、访问PV、访问延时、访问失败率、访问流量情况等 接入业务层指标 通常来源于事务监控或上报的自定义指标。
全合规和运营分析等应用场景需求。 应用性能&用户体验监控:支持从Web端、App端到应用微服务、数据库、中间件的全链路时延、异常等分析能力,帮助运维人员快速定位链路故障根源,快速发现应用的性能瓶颈,为用户体验保驾护航。 云服务监控:为用户提供针对弹性云服务器、带宽等云服务资源的监
层资源是否健康。健康时该资源层显示为绿色,当出现告警信息时,该资源层显示为红色。当出现告警信息时,单击告警信息,可查看当前告警的详细信息和处理建议信息。 仪表盘相关操作详见仪表盘监控。 选择某一组件,在右侧区域查看当前组件的告警分析信息。 单击告警名,查看当前告警的详细信息,详情请参见查看AOM告警或事件。
名称/ID、实例类型、企业项目、区域、应用环境、操作。 云数据库 GaussDB - 名称/ID、资源状态、类型、企业项目、区域、应用环境、操作。 网络 弹性负载均衡器ELB - 名称/ID、资源状态、服务地址与所属网络、监听器、区域、企业项目、应用环境、操作。 应用中间件 分布式缓存DCS - 名称/
如何为执行方案配置审批? 无法单独为执行方案配置审批,执行方案会继承作业的审批配置。 解决方法 在创建作业时,对该作业设置“审批配置”(默认关闭),则由该作业创建的执行方案执行时就需要审批。创建作业的详细操作请参考作业管理。 父主题: 运维管理(即将下线)
多AZ容灾 AOM支持跨AZ容灾,当一个AZ异常时,不影响其他AZ下的实例持续提供服务。 多集群容灾 AOM支持多集群方案,当一个集群异常时,可以继续提供服务。 数据容灾 AOM的配置、指标、告警等数据均是多副本存储,保证了数据可靠性。 父主题: 安全
多AZ容灾 AOM支持跨AZ容灾,当一个AZ异常时,不影响其他AZ下的实例持续提供服务。 多集群容灾 AOM支持多集群方案,当一个集群异常时,可以继续提供服务。 数据容灾 AOM的配置、指标、告警等数据均是多副本存储,保证了数据可靠性。 父主题: 安全
在右侧“业务层”类型中单击需要接入的卡片,参考下表执行相关接入操作。 表1 业务层接入AOM 卡片 相关操作 基于ELB日志 在“日志指标规则”页面接入相关的ELB日志指标,具体操作请参见配置ELB日志指标接入AOM。 基于APM事务 在“接入应用”页面接入相关的APM事务指标,具体操作请参见快速接入Agent。
如何区分告警和事件? 告警和事件的相同点 在AOM中告警和事件都是指AOM自身,或ServiceStage、CCE等外部服务在某种状态发生变化后上报给AOM的信息。 告警和事件的区别 告警是AOM自身,或ServiceStage、CCE等外部服务在异常情况或在可能导致异常情况下上
如何区分告警和事件? 告警和事件的相同点 在AOM中告警和事件都是指AOM自身,或AOS、ServiceStage、CCE等外部服务在某种状态发生变化后上报给AOM的信息。 告警和事件的区别 告警是AOM自身,或AOS、ServiceStage、CCE等外部服务在异常情况或在可能
FunctionGraph、云硬盘 EVS、云备份 CBR、对象存储服务 OBS、弹性文件服务 SFS、弹性文件服务SFS TURBO、虚拟私有云 VPC、弹性负载均衡 ELB、云专线 DC、虚拟专用网络 VPN、NAT网关 NAT、企业路由器 ER、分布式消息服务 DMS、分布式缓存 DCS、专享版API网关
使用AOM。 表1 AOM 最佳实践一览表 最佳实践 说明 通过AOM告警分组规则清除ELB告警风暴 本文档介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。 通过多账号聚合Prometheus实例实现指标数据统一监控
String 链路id。 状态码: 401 表10 响应Body参数 参数 参数类型 描述 error_code String 错误码。 error_msg String 错误信息。 error_type String 错误类型。 trace_id String 链路id。 状态码:
{跳板机ip}:8149:{elbip}:8149 -L {跳板机ip}:8102:{elbip}:8102 -L {跳板机ip}:8923:{elbip}:8923 -L {跳板机ip}:30200:{elbip}:30200 -L {跳板机ip}:30201:{elbip}:30201
采集组件优化,提升单副本采集能力,降低资源消耗。 通过多副本横向扩展均衡分解采集任务,实现动态扩缩,解决开源水平扩展问题。 高可用性 双副本:数据采集、处理和存储组件支持多副本横向扩展,核心数据链路高可用。 水平扩展:基于集群规模可直接进行弹性扩容。 基本概念 本文汇总使用Prometheus监控过程中涉及的基本概念,方便您查询和了解相关概念。
{跳板机ip}:8149:{elbip}:8149 -L {跳板机ip}:8102:{elbip}:8102 -L {跳板机ip}:8923:{elbip}:8923 -L {跳板机ip}:30200:{elbip}:30200 -L {跳板机ip}:30201:{elbip}:30201
通过配合使用Prometheus监控和告警管理功能,可以按照华为云标签对资源进行告警。本文演示如何通过标签对DCS实例的CPU利用率指标进行告警。 实践场景 某电商平台运维人员在监控指标时,想要通过标签维度管理云上各种资源并分发告警。 解决方案 AOM通过Prometheus监控功能,创建云服务类型Prome