检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
修改站点监控”,或者则勾选多个监控站点,单击列表上方的“修改”。 进入“修改监控站点”界面。 根据界面提示配置参数,参数如表1所示。 站点类型与站点地址不能修改,因不同站点类型高级配置信息不同,切换后可能会丢失数据。 单击“确定”,完成修改。 停用站点监控 在“站点监控”界面,单击站点所在行的“更多 > 停用站点
ficientdata_actions(该参数已废弃,建议无需配置)、ok_actions至少有一个不能为空。 若alarm_actions、insufficientdata_actions(该参数已废弃,建议无需配置)、ok_actions同时存在时,notificationList值保持一致。
管理,例如用于测试和用于生产的资源相比,需要配置的监控与告警、通知渠道与接收用户也可能不一样。云监控支持根据实例名称、实例标签、企业项目进行分组管理告警规则、监控视图,极大的降低运维复杂度,提高运维效率。 前提条件 在进行资源分组配置前,如需使用资源标签匹配能力,请确保您的资源打
企业项目的子用户无法看到一键告警功能 云监控服务的一键告警功能只有主账号或配置了Tenant Administrator权限的子用户才有权访问和使用。 如何为子账号设置Tenant Administrator权限,请参考创建用户组并授权。 父主题: 告警
进入云监控服务提示权限不足该如何处理? 此问题与权限配置有关,一般为IAM子账号权限不足,需检查IAM配置的权限。 管理员使用主账户登录管理控制台。 在控制台页面,鼠标移动至右上方的用户名,在下拉列表中选择“统一身份认证”。 在统一身份认证服务,左侧导航窗格中,单击“用户组”。 展开子账号所属的用户组的详情。
如何将告警通知发送给子账号? 如您想要将告警通知发给子账号,可以通过创建主题并添加订阅(在订阅信息中配置您的手机号码或邮箱),然后在创建告警规则时选择告警通知对象为您创建的主题 。 父主题: 告警
String 企业项目ID,默认值为all_granted_eps。表示所有企业项目。 当查询所有企业项目时,配置为:all_granted_eps。 当需要查询某个企业项目时,配置为对应的企业项目ID,请参考获取企业项目ID。 样例 请求样例一:查询当前告警规则列表。 GET htt
ficientdata_actions(该参数已废弃,建议无需配置)、ok_actions至少有一个不能为空。 若alarm_actions、insufficientdata_actions(该参数已废弃,建议无需配置)、ok_actions同时存在时,notificationList值保持一致。
通知。下面将展示如何配置指标类和事件类的告警策略。 配置指标类告警策略 用户可以针对云服务的核心监控指标设置指标告警,在发生异常时及时通知您采取措施。指标类告警策略包括指标名称、指标值类型、连续触发次数、阈值和告警频率五个必要组成部分。您可以根据以下指引配置告警类告警策略。 基本概念
选择“告警 > 告警模板”,进入告警模板界面。 单击“自定义告警模板”或“自定义事件模板”页签。 单击模板所在行的“修改”。 参考表1,修改已配置的参数。 图1 修改自定义告警模板 单击“立即修改”,完成模板修改。 父主题: 告警模板
gpu硬件、驱动、应用问题导致Xid事件,可能导致业务异常退出。 nvidia-smi命令卡住 nvidiaSmiHangEvent 重要 nvidia-smi命令超时,该命令可能卡住 如果业务受损,请提交工单。 可能是命令执行过程中,触发驱动问题,导致命令卡住,同时可能出现业务使用驱动报错问题。 NPU: 存在不可纠正ECC错误
关键指标展示该类云服务资源的重点业务指标,并支持自定义编辑指标,可根据业务需要对关键指标进行配置推荐。 图4 云服务概览 图5 关键指标 配置云服务告警规则 各类云服务需要给哪些指标配置告警,可参考最佳监控实践推荐的指标及告警策略。最佳实践如:华为云监控配置最佳实践 v5.3.1.xlsx。 步骤: 登录管理控制台。
当探测协议为HTTP(S)时可配置此参数。 HTTP(S)标准的请求方法,包括GET、POST、HEAD,其中POST支持提交内容。 HEAD 端口号 当探测协议为TCP或UDP时可配置此参数。 8080 高级配置 暂不配置 现在配置:不同探测协议对应的高级配置不同。 当探测协议为HTTP(S)协议时,请参见表2。
控指标和ECS自带的监控指标。 操作系统监控指标和基础监控指标请参见云产品监控指标。 前提条件 已完成Agent插件的安装。安装请参考安装配置Agent进行安装。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 查看ECS或BMS的监控指标: 支持企业项目的服务,
gpu硬件、驱动、应用问题导致Xid事件,可能导致业务异常退出。 nvidia-smi命令卡住 nvidiaSmiHangEvent 重要 nvidia-smi命令超时,该命令可能卡住 如果业务受损,请提交工单。 可能是命令执行过程中,触发驱动问题,导致命令卡住,同时可能出现业务使用驱动报错问题。 NPU: 存在不可纠正ECC错误
加安全组中DNS地址配置正确,然后参考《云监控服务用户指南》中“手动配置Agent”章节检查配置是否正确。 账号欠费。 Agent进程故障,请参照管理Agent重启,如果无法重启则说明相关文件被误删,请重新安装Agent。 配置异常:ECS/BMS主机没有配置委托、当前委托权限异
> 云监控服务”。 选择“监控看板 > Dashboards”,单击“创建Dashboard”。 系统弹出“创建Dashboard”窗口。 配置参数。 名称:表示监控看板名称,该参数只能由中文、英文字母、数字、下划线、中划线组成,且长度不超过128。 归属企业项目:将监控看板关联给
管理广域网质量监控告警规则 前提条件 已创建广域网质量监控告警规则。 操作场景 当业务变化或者当之前配置的广域网质量监控的告警规则不符合您的业务需求时,您可参考本章节导出告警记录,或修改、停用、启用、删除、复制、屏蔽、取消屏蔽广域网质量监控的告警规则。 告警记录导出 登录管理控制台。
删除告警规则 功能介绍 删除一条告警规则。 告警规则V1接口只支持配置单资源单策略规则,建议使用批量删除告警规则与前端功能配套使用。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。
启停告警规则 功能介绍 启动或停止一条告警规则。 告警规则V1接口只支持配置单资源单策略规则,建议使用批量启停告警规则与前端功能配套使用。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。