检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在“创建告警规则”界面,根据界面提示配置参数。 根据界面提示,配置告警规则的基本信息。 表1 配置规则信息 参数 参数说明 名称 系统会随机产生一个名称,用户也可以进行修改。 取值样例:alarm-b6al 描述 告警规则描述(此参数非必填项)。 选择监控对象,配置告警内容参数。 表2 配置告警内容 参数
关联到分组”。 在“关联到资源分组”页面,选择资源分组。 图1 关联到资源分组 根据界面提示,配置告警通知参数。 图2 配置告警通知 表1 配置告警通知 参数 参数说明 发送通知 配置是否发送邮件、短信、HTTP和HTTPS通知用户。 通知方式 根据需要可选择通知组或主题订阅两种方式。
云监控插件(Agent) Agent安装配置方式说明 Agent版本特性 Agent安装说明 安装配置Agent 管理Agent 其他插件安装说明 升级Agent 父主题: 主机监控
i1、P1系列的ECS,P、Pi、G、KP系列的BMS。 已安装lspci工具,未安装lspci工具的云服务器不支持采集GPU指标数据及上报事件。 安装lspci工具的方法如下 登录弹性云服务器。 更新镜像源,获取安装依赖。 wget http://mirrors.myhuaweicloud
其他插件安装说明 BMS硬件监控插件说明 安装GPU指标集成插件 安装云专线指标采集插件 父主题: 云监控插件(Agent)
主机监控 如何配置DNS和安全组? 如何配置委托? CES Agent如何通过授权获取临时AK/SK? Agent支持的系统有哪些? Agent插件资源占用和熔断说明 主机监控Agent对主机的性能会有影响吗? Agent不同插件状态说明及处理方式 Agent支持的指标列表 支持GPU监控的环境约束
告警 告警规则在何种情况下会触发“数据不足”? 带宽的监控数据没有超限记录但是收到了告警通知 为什么配置了5分钟聚合指标告警规则,实际却无法触发告警? 为什么配置了磁盘读和磁盘写指标同时达到阈值时则告警,实际并没有同时达到阈值却触发了告警? 父主题: 故障排查
ces:metricData:list √ × 查询指定时间范围指定事件类型的主机配置数据,可以通过参数指定需要查询的数据维度(该接口提供给HANA场景下SAP Monitor查询主机配置数据,其他场景下查不到主机配置数据)。 GET /V1.0/{project_id}/event-data
部分云服务的资源查询权限,如在使用中遇到权限问题,需要配置涉及服务的细粒度授权特性,才可以正常使用,支持细粒度授权的云服务列表请参考: 使用IAM授权的云服务。 告警通知:依赖SMN服务的SMN FullAccess。 配置数据转储:依赖OBS服务的OBS OperateAccess。
告警 告警规则在何种情况下会触发“数据不足”? 带宽的监控数据没有超限记录但是收到了告警通知 为什么配置了5分钟聚合指标告警规则,实际却无法触发告警? 为什么配置了磁盘读和磁盘写指标同时达到阈值时则告警,实际并没有同时达到阈值却触发了告警? 父主题: 故障排查
优势:配置简单,一键式打开开关。 弹性云服务器、弹性公网IP和关系型数据库的重要事件。 事件监控 指标监控 立即触发 普通告警 根据设置的告警策略触发告警。例如:CPU利用率在5分钟内的平均值连续5次>=80%时发送告警通知。 优势:告警策略更加灵活,可根据业务情况灵活配置。 所有支持监控的服务。
Agent插件上线墨西哥城一、圣保罗一和圣地亚哥区域。 商用 Agent安装配置方式说明 2 上线Agent插件的一键安装能力,支持上海一和北京一区域。 您能够通过以下方式,非常方便地安装云服务器监控Agent插件: 1、在云服务器购买流程页面,选择云服务器创建后自动安装监控插件。 2、在云监控服务->主机监控
在“通知对象”页签,单击“创建通知对象”或单击已有通知对象的“编辑”操作进入配置页面。 单击“选择渠道”,勾选“钉钉”选项。 将钉钉机器人的Webhook填入相应的输入框中,确认无误后单击“确定”保存配置。 创建告警通知组并添加告警通知对象 创建告警通知组,并将通知对象加入到通知组中。
这里以平时的SNAT连接数为10000为例,高峰期为平时的2-3倍,因此配置SNAT连接数为30000的告警规则。 出网带宽使用率建议配置为80%。 “告警通知”功能触发产生的告警消息由消息通知服务SMN发送,可能产生少量费用,具体费用请参考产品价格说明。 配置完成后,单击“立即创建”,完成创建告警规则。
Dashboards”,切换到需要添加监控视图的监控看板,然后单击“添加监控视图”。 系统弹出“添加监控视图”窗口。 在“添加监控视图”界面,参照表1完成参数配置。 表1 配置参数 参数 参数说明 标题 自定义关注指标组件的标题名称,该名称只能由中文、英文字母、数字、下划线、中划线组成,长度限制为128字节。
测远端服务器的可用性、连通性等问题。 服务可用性监控 通过使用广域网功能配置定时HTTP(S)拨测任务,选择分布在全球的探测点对域名进行HTTP(S)拨测,并根据协议拨测结果状态码识别服务的可用性,通过配置监控告警条件,可在出现异常状态时立马告警,并收到服务故障信息。此外,您还能
如图2所示。旧版导出数据任务不会在“任务中心”展示,直接会在当前页面下载。 图2 旧版界面 在“导出监控数据”界面,根据界面提示配置参数。 表1 配置导出监控数据参数 参数 参数说明 任务名称 导出任务名称。 长度范围为1~32个字符。 统计方式 分为聚合值和原始值两种方式。 聚
”页面。 选择要安装Agent的ECS或BMS,安装Agent插件。 修改待安装Agent的ECS或BMS的DNS并添加安全组,具体步骤请参见修改DNS与添加安全组(Linux)或修改DNS与添加安全组(Windows)。 安装Agent,具体安装步骤请参见安装Agent(Lin
GPU:Ant系列机器动态路由配置错误 GpuRouteConfigError 重要 Ant系列机器网卡%s动态路由未配置或配置错误,CMD [ip route]: %s | CMD [ip route show table all]: %s。 请正确配置RoCE网卡路由 NPU网络通信异常
在“通知对象”页签,单击“创建通知对象”或单击已有通知对象的“编辑”操作进入配置页面。 单击“选择渠道”,勾选“企业微信”选项。 将企业微信机器人的Webhook填入相应的输入框中,确认无误后单击“确定”保存配置。 创建告警通知组并添加告警通知对象 创建告警通知组,并将通知对象加入到通知组中。