检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
故障监控能力。 物理机硬件监控插件只针对BMS实例生效,其他云服务器不受其影响。 BMS实例缺失硬件监控插件会导致华为云无法第一时间感知实例的硬件故障,可能影响业务可用性时长,且故障需要用户主动联系技术支持处理。 当安装硬件监控插件后,硬件故障风险会以事件的方式主动通知到用户,需要用户及时授权对风险硬件的维修或更换。
电商平台业务监控 云监控在视频直播中的应用 云监控在众包平台中的应用 事件监控最佳实践 使用资源分组和告警功能上报指定资源的监控指标 配置云服务器全部挂载点磁盘使用率告警规则
监控维度名称,例如弹性云服务器的维度为instance_id。各服务维度请参考支持监控的服务列表,可参考维度中key字段。 必须以字母开头,只能包含0-9/a-z/A-Z/_/-,长度最短为1,最大为32。 value 是 String 维度取值,例如弹性云服务器的ID。可通过调用
告警通知系统模板更新记录 云监控服务930版本将短信告警通知系统模板中的告警信息进行了修改,具体变更信息如表1 短信-指标系统通知模板、表2 短信-系统事件系统通知模板和表3 短信-自定义事件系统通知模板所示: 表1 短信-指标系统通知模板 信息 变更操作 告警恢复状态 新增 跳转连接 新增 资源ID
云监控服务相关概念 使用云监控服务之前,请先了解以下相关概念,从而可以更好的使用云监控服务。 监控指标 聚合 监控面板 主题 告警规则 告警模板 项目 企业项目 监控指标 监控指标是云监控服务的核心概念,通常是指云平台上某个资源的某个维度状态的量化值,如云服务器的CPU使用率、内
我的配额”。 系统进入“服务配额”页面。 图1 我的配额 您可以在“服务配额”页面,查看各项资源的总配额及使用情况。 如果当前配额不能满足业务要求,请参考后续操作,申请扩大配额。 如何申请扩大配额? 登录管理控制台。 在页面右上角,选择“资源 > 我的配额”。 系统进入“服务配额”页面。 图2
Agent安装成功后管理控制台没有操作系统监控数据或者显示数据滞后 安装配置Agent成功,需要等待2分钟,管理控制台上才会有操作系统监控数据。 若“插件状态”为“运行中”,等待5分钟后仍没有操作系统监控数据,则需要排查ECS或BMS时间和管理控制台所在客户端时间是否一致。 Ag
新建一个“视图”,在添加监控视图页面右侧配置图表。 图表配置选择多指标一个视图,图表类型选择折线图。 图例位置选择底部,图例值选择当前值、最大值、最小值和平均值。 设置阈值及标注线。 在添加监控视图页面下方配置指标。 监控指标:左侧下拉菜单选择“弹性云服务器 - 云服务器”,右侧下拉菜单选择“云服务器 > 带外网络流出速率”。
修订记录 发布日期 修改记录 2021-06-16 配置云服务器全部挂载点磁盘使用率告警规则上线。 2020-03-09 使用资源分组和告警功能最佳实践上线。 2019-03-06 事件监控最佳实践上线。 2019-01-22 云监控在众包平台中的应用上线。 2018-09-30
发告警通知的条件。 根据界面提示,配置归属企业项目。 图2 高级配置 表2 配置归属企业项目 参数 参数说明 归属企业项目 告警规则所属的企业项目。只有拥有该企业项目权限的用户才可以查看和管理该告警规则。创建企业项目请参考:创建企业项目。 配置完成后,单击“确定”,完成资源分组关联告警模板。
net_tcp_sys_sent (Agent) TCP SYS_SENT状态的连接数量。 该指标用于统计测量对象处于请求连接状态的TCP连接数量。 采集方式(Linux):通过/proc/net/tcp文件获取到所有状态的TCP连接,再统计每个状态的连接数量。 采集方式(Windows):通过WindowsAPI
概述 欢迎使用云监控服务(Cloud Eye)。云监控为用户提供一个针对弹性云服务器、带宽等资源的立体化监控平台。使您全面了解云上的资源使用情况、业务的运行状况,并及时收到异常告警做出反应,保证业务顺畅运行。 您可以使用本文档提供的API对指标、告警规则、监控数据进行相关操作,如
用于指定资源、资源分组的事件告警场景中,支持按维度配置告警规则。 详细参数说明请参见表5。 表5 dimensions字段数据结构说明 名称 类型 是否必选 描述 name String 是 监控维度名称,例如弹性云服务器的维度为instance_id。各服务维度请参考支持监控的服务列表,可参考维度中key字段。
所有支持监控的服务。 主机监控 云服务监控 自定义监控 站点监控 日志监控 累计触发 当事件发生时,立即触发或者累计触发告警通知。 优势:灵活配置,仅支持事件告警。 支持的事件请参考事件监控支持的事件说明。 事件监控 立即触发或累计触发(可配置) 约束和限制 一键告警的所有告警规则均为立即触发,即按照阈值直接触发。
添加数据转储到其他账号 数据转储可以实时将云服务监控数据转储到分布式消息服务Kafka中。当您需要通过分布式消息服务Kafka的控制台或使用开源Kafka客户端查询云服务的监控指标时,可以使用云监控服务提供的数据转储功能。 在CES上配置转储监控数据时,选择的“转储目标”资源类型支持转储到其他租户账号购买的kafka。
查看云服务监控看板 云服务监控看板为您提供查看云服务监控数据的功能,一个云服务的相关数据集中在一个监控看板。云服务看板无需用户配置,系统自动生成。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 选择页面左侧的“云服务监控”,进入“云服务监控”页面。 单击需要查看
目前云监控服务支持创建10个监控看板,满足您对云服务运行情况不同的监控需求。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 选择“监控看板 > Dashboards”,单击“创建Dashboard”。 系统弹出“创建Dashboard”窗口。 配置参数。 名称
请求页面被禁止访问。 408 Request Timeout 请求超出了服务器的等待时间。 429 Too Many Requests 当前请求过多。 500 Internal Server Error 请求未完成,服务异常。 503 Service Unavailable 系统暂时不可用,请求受限。
请求页面被禁止访问。 408 Request Timeout 请求超出了服务器的等待时间。 429 Too Many Requests 当前请求过多。 500 Internal Server Error 请求未完成,服务异常。 503 Service Unavailable 系统暂时不可用,请求受限。
键指标进行配置推荐。 图4 云服务概览 图5 关键指标 配置云服务告警规则 各类云服务需要给哪些指标配置告警,可参考最佳监控实践推荐的指标及告警策略。最佳实践如:华为云监控配置最佳实践 v5.3.1.xlsx。 步骤: 登录管理控制台。 单击“服务列表 > 云监控服务”。 选择“云服务监控