检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
分布式缓存服务的监控指标说明 应用与数据集成平台 SYS.ROMA 请参考右侧相关文档链接页面。 应用与数据集成平台的监控指标说明 数据库 关系型数据库 SYS.RDS 请参考右侧相关文档链接页面。 MySQL的监控指标说明 MariaDB的监控指标说明 PostgreSQL的监控指标说明
单击“服务列表 > 云监控服务”。 单击“告警 > 告警记录”,进入“告警记录”界面。 在告警记录页面,可查看近7天触发的告警的信息。 单击操作列的“手动恢复”。 弹出确定手动恢复的对话框。 图1 手动恢复 单击“确定”,确定手动恢复。 父主题: 告警记录
资源分组支持的云服务 由于智能创建资源分组的能力依赖云服务对接config资源管理服务,可能存在部分云服务在某些region未对接config的情况,具体支持情况可在页面配置资源分组时查看确认。 云服务 英文简称 产品 手动添加 企业项目 标签 实例名称 组合匹配 弹性云服务器 ECS
约束与限制 您能创建的告警规则的数量与配额有关系,如果您想查看服务配额、扩大配额,具体请参见“配额调整”。 更详细的限制请参见具体API的说明。 父主题: 使用前必读
区域ID以及auth_url可单击下面链接查看。 地区和终端节点(中国站) global: port: "{private IP}:8087" # 监听端口 :出于安全考虑,建议不将expoter服务端口暴露到公网,建议配置为127.0.0.1:{port},或{内网ip}:{port},例如:192
修改prometheus中的prometheus.yml文件配置。如下配置所示在scrape_configs下新增job_name名为“huaweicloud”的节点。其中targets中配置的是访问cloudeye-exporter服务的ip地址和端口号,services配置的是你想要监控的服务,比如SYS
探测点 选择探测点。 目前广域网质量监控支持的探测点有:中国电信(北京)、中国移动(上海)、中国联通(广州)、阿里云(深圳)、长城宽带(北京)等等。 - 归属企业项目 广域网质量监控所属的企业项目。只有拥有该企业项目权限的用户才可以查看和管理该广域网质量监控。创建企业项目请参考:创建企业项目。
目前仅支持“全部资源”,表示选择的服务的指定监控对象的全部指标都会转储到分布式消息服务Kafka中。 资源类型 目前仅支持“分布式消息服务Kafka”。 目标位置 数据转储的目标位置,选择“当前账号” 项目名称 资源对应的项目。 Kafka名称 指标发送到的Kafka实例名。 如果没有合适的Kafka实例,请参考购买Kafka实例。
分别单击弹性公网IP和带宽与NAT网关所在行的“创建告警规则”。 这里以平时的SNAT连接数为10000为例,高峰期为平时的2-3倍,因此配置SNAT连接数为30000的告警规则。 出网带宽使用率建议配置为80%。 “告警通知”功能触发产生的告警消息由消息通知服务SMN发送,可能产生少量费用,具体费用请参考产品价格说明。
在总览页面的左侧展示了全部资源的健康评分、资源总数和正在告警的资源数,正在告警的资源数按照告警级别展开。 健康评分的计算公式为:健康评分=无告警资源个数/总资源个数 用户可以选某个资源分组,查看资源分组中对应的服务资源,单击服务资源,可参看服务资源中具体资源名称,维度和告警级别。 图1 查看服务资源详情
Trace Service,简称CTS)为您提供云监控服务的操作记录,记录内容包括您从公有云管理控制台或者开放API发起的云监控服务操作请求以及每次请求的结果,供您查询、审计和回溯使用。 云审计服务支持的Cloud Eye操作列表 查看云监控服务日志 父主题: 配额与审计
理控制台或API接口查看云服务运行状态并设置告警规则。 实时可靠 原始采样数据实时上报,提供对云服务的实时监控,实时触发产生告警并通知用户。 监控可视化 云监控服务通过监控面板为用户提供丰富的图表展现形式,支持数据自动刷新以及指标对比查看,满足用户多场景下的监控数据可视化需求。 多种通知方式
日志监控提供了针对日志内容的实时监控能力。通过云监控服务和云日志服务的结合,用户可以针对日志内容进行监控统计、设置告警规则等,降低用户监控日志的运维成本,简化用户使用监控日志的流程。 事件监控 事件监控提供了事件类型数据上报、查询和告警的功能。方便您将业务中的各类重要事件或对云资源的操作事件收集到云监控服务,并在事件发生时进行告警。
终端节点 终端节点(Endpoint)即调用API的请求地址,不同服务不同区域的终端节点不同,您可以从地区和终端节点中查询所有服务的终端节点。 父主题: 使用前必读
主机监控 Agent状态切换或监控面板有断点该如何处理? 业务端口被Agent占用该如何处理? Agent一键修复失败问题排查 Agent一键修复后无监控数据问题排查 上报的指标被丢弃问题排查 Agent插件状态显示“故障”该如何处理? Agent插件状态显示“已停止”该如何处理?
主机监控 Agent状态切换或监控面板有断点该如何处理? 业务端口被Agent占用该如何处理? Agent一键修复失败问题排查 Agent一键修复后无监控数据问题排查 上报的指标被丢弃问题排查 Agent插件状态显示“故障”该如何处理? Agent插件状态显示“已停止”该如何处理?
当主机挂载磁盘数量较多时,Agent占用的CPU或内存可能较高。您可以根据实际观测主机的资源占用率,参考操作步骤配置Agent熔断机制中的第一阈值和第二阈值。 操作步骤 使用root账号,登录Agent不上报数据的ECS或BMS。 可选:执行以下命令,切换至Agent安装路径的bin下。 Windo
ostname[:port]。端口缺省时使用默认的端口,https的默认端口为443。 否 使用AK/SK认证时该字段必选。 code.test.com or code.test.com:443 Content-Type 消息体的类型(格式)。推荐用户使用默认值applicati
namespace 否 资源命名空间,例如弹性云服务器的资源命名空间为:SYS.ECS,各服务命名空间可查看支持监控的服务列表。 dname 否 资源维度,例如弹性云服务器维度为:instance_id,各资源的维度可查看支持监控的服务列表。 start 否 分页起始值,类型为integer,默认值为0。
4命令采集。 内存的设备信息 内存条的SN、厂商、PN、位宽、容量、频率等。 使用dmidecode -t 17命令采集。 CPU的设备信息 CPU的ID、名称、频率、架构、型号等。 使用dmidecode -t 4和lscpu命令采集。 内存的错误记录 内存的CE/UCE错误记