检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
安装GPU指标集成插件 操作场景 通过在GPU加速型Linux实例上安装GPU监控插件,可以为用户提供系统级、主动式、细颗粒度的GPU监控,包含GPU指标收集和GPU系统事件上报。GPU支持监控的指标,参见GPU指标。 本章节介绍如何通过CES监控Agent安装脚本为GPU加速型实例安装新版GPU监控插件:
主机监控 如何配置DNS和安全组? 如何配置委托? CES Agent如何通过授权获取临时AK/SK? Agent支持的系统有哪些? Agent插件资源占用和熔断说明 主机监控Agent对主机的性能会有影响吗? Agent不同插件状态说明及处理方式 Agent支持的指标列表 支持GPU监控的环境约束
监控概览 监控概览由资源监控和站点监控两部分组成。通过查看监控概览,让用户实时了解各云服务的资源告警情况和站点响应情况。 资源监控 资源监控是以资源分组维度横向展示和各个服务资源维度纵向分布,将各个资源的实时告警情况进行展示,用户可按照不同维度对资源告警进行关注,方便高效管理您的资源。
构造请求 本节介绍REST API请求的组成,并以调用IAM服务的获取用户Token来说明如何调用API,该API获取用户的Token,Token可以用于调用其他API时鉴权。 您还可以通过这个视频教程了解如何构造请求调用API:https://bbs.huaweicloud.com/videos/102987。
查看主机监控的监控指标 操作场景 本章节指导用户查看主机监控指标,监控指标分为Agent插件采集的细颗粒度的操作系统级别监控指标和ECS自带的监控指标。 操作系统监控指标和基础监控指标请参见云产品监控指标。 前提条件 已完成Agent插件的安装。安装请参考安装配置Agent进行安装。
创建自定义告警模板 功能介绍 创建自定义告警模板来添加一个或者多个指标的告警规则。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI POST /V1.0/{proje
添加数据转储 操作场景 数据转储可以实时将云服务监控数据转储到分布式消息服务Kafka中。当您需要通过分布式消息服务Kafka的控制台或使用开源Kafka客户端查询云服务的监控指标时,可以使用云监控服务提供的数据转储功能。 一个账户最多创建20个数据转储任务。 添加“数据转储”功能按照客户白名单开放。
查询指标列表 功能介绍 查询系统当前可监控指标列表,可以指定指标命名空间、指标名称、维度、排序方式,起始记录和最大记录条数过滤查询结果。 云服务资源删除后,会保留3个小时的数据缓存,在3小时之内还能查到资源对应的监控指标,属于正常现象。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API
更新自定义告警模板 功能介绍 更新自定义告警模板。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI PUT /V1.0/{project_id}/alarm-template/{template_id}
数据保护技术 出于数据保护目的,我们建议您保护华为云帐户凭据,并使用华为云统一身份认证服务(IAM)设置单个用户帐户。这样每个用户只获得履行其工作职责所需的权限。我们还建议您通过以下方式保护数据安全: 对每个帐户使用多因素身份验证(MFA)。 使用SSL/TLS与华为云资源通信。我们建议使用TLS
查询自定义告警模板列表 功能介绍 查询自定义告警模板列表。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI GET /V1.0/{project_id}/alarm-template
告警 告警简介 告警规则 告警记录 告警模板 告警通知 应用示例:用户自定义创建弹性云服务器CPU利用率告警 一键告警 告警屏蔽
事件监控最佳实践 弹性云服务器事件 关系型数据库事件 弹性公网IP事件 父主题: 场景化实践案例
创建资源分组(V1) 功能介绍 创建资源分组。资源分组支持将各类资源按照业务集中进行分组管理,可以从分组角度查看监控与告警信息以提升运维效率。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。
认证鉴权 调用接口有如下两种认证方式,您可以选择其中一种进行认证鉴权。 Token认证:通过Token认证调用请求。 AK/SK认证:通过AK(Access Key ID)/SK(Secret Access Key)加密调用请求。推荐使用AK/SK认证,其安全性比Token认证要高。
场景化实践案例 电商平台业务监控 云监控在视频直播中的应用 云监控在众包平台中的应用 事件监控最佳实践 使用资源分组和告警功能上报指定资源的监控指标 配置云服务器全部挂载点磁盘使用率告警规则
查询主机配置数据 功能介绍 查询指定时间范围指定事件类型的主机配置数据,可以通过参数指定需要查询的数据维度。 该接口提供给HANA场景下SAP Monitor查询主机配置数据,其他场景下查不到主机配置数据。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API
查询Agent任务列表 功能介绍 查询Agent任务列表 接口约束 目前拉美-布宜诺斯艾利斯一、拉美-利马一2个局点不支持该接口 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。
管理广域网质量监控告警规则 前提条件 已创建广域网质量监控告警规则。 操作场景 当业务变化或者当之前配置的广域网质量监控的告警规则不符合您的业务需求时,您可参考本章节导出告警记录,或修改、停用、启用、删除、复制、屏蔽、取消屏蔽广域网质量监控的告警规则。 告警记录导出 登录管理控制台。
修订记录 发布日期 修改记录 2021-06-16 配置云服务器全部挂载点磁盘使用率告警规则上线。 2020-03-09 使用资源分组和告警功能最佳实践上线。 2019-03-06 事件监控最佳实践上线。 2019-01-22 云监控在众包平台中的应用上线。 2018-09-30