检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
单,开启白名单请参考申请开通SMN新协议公测。 创建飞书机器人 本文以PC版飞书为例,为您介绍创建飞书机器人的操作方法。 在PC版飞书中打开发送告警通知的飞书群。 单击设置图标,添加机器人。 单击添加自定义机器人选项。 输入机器人名字,例如:云监控告警通知,完成添加。 单击复制,复制Webhook地址。
oleToAgency", "iam:permissions:grantRoleToAgencyOnDomain", "iam:permissions:grantRoleToAgencyOnProject",
oleToAgency", "iam:permissions:grantRoleToAgencyOnDomain", "iam:permissions:grantRoleToAgencyOnProject",
维度名称,枚举类型,类型有: mount_point:挂载点, disk:磁盘, proc:进程, gpu:显卡, raid: RAID控制器, 枚举值: mount_point disk proc gpu raid dim_value 否 String 维度值,32位字符串,如:2e84018fc8b4
12:10:10]区间内。对应的Unix时间戳是[1580353250, 1580357410]。 detail 是 detail object 事件详情。 详细参数请参见表4。 表4 detail字段数据结构说明 名称 是否必选 参数类型 说明 content 否 String 事件内容,最大长度4096。
10.0.0 64bit √ × × Debian 10.2.0 64bit(ARM) √ × × Debain10.5 √ × × Debain10.6 √ × × Debain11.10 √ √ × debian 11.4 √ × × debian 11.5 √ × × EulerOS
行状态。 表1 云服务器列表和分组规划 云服务器名称 分组 是否需要安装Agent 所属部门 ECS-01 开发组资源 是 开发项目组 ECS-02 开发组资源 是 开发项目组 ECS-03 无需分组 否 测试项目组 ECS-04 无需分组 否 测试项目组 前提条件 ECS01和
警模板为多个资源或者云服务批量创建告警规则。 在您使用告警模板创建告警规则之前,云监控服务已经根据各个云服务的应用属性以及云监控服务多年的开发、维护经验,为各个云服务量身定做了默认使用的告警模板,供您选择使用。同时云监控服务为用户提供了自定义创建告警模板的功能,用户可以选择在默认
自定义机器人”,完成添加后,即可获得webhook地址。加签的密钥请在飞书群机器人的安全设置中查找。 选择“Welink”,需要填写需要接收消息的群号。进入WeLink开放平台开发者后台,打开其中一个企业内部应用,在应用的“基本信息”中获取相应的client_id和client_secret。 说明: 已创建的通知对
主动监控新增GPU指标。 2018-02-28 第十九次正式发布。 本次变更如下: 人工智能服务新增监控指标。 新对接云数据迁移服务。 主动监控新增负载指标。 2018-01-30 第十八次正式发布。 本次变更如下: 人工智能服务新增监控指标。 2018-01-26 第十七次正式发布。 本次变更如下:
Value:云解析服务实例的名称 Key:domainId Value:用户ID 云解析服务的监控指标说明 CDN与智能边缘 智能边缘小站 SYS.IES Key:site_id Value:边缘小站ID 智能边缘小站的监控指标说明 内容分发网络 SYS.CDN Key:domain_name Value:域名
当前时间+10分钟-20秒]区间内,保证到达服务器时不会因为传输时延造成数据不能插入数据库。 detail Detail object 是 事件详情。 详细参数说明请参见表4。 event_id String 否 事件ID。 表4 detail字段数据结构说明 名称 类型 是否必选 描述 content String
"projects": [ { "domain_id": "65382450e8f64ac0870cd180d14e684b", "is_domain": false, "parent_id": "
单击页面右上角的“设置监控指标”。 进入“设置监控指标”页面。 您可以选择要展示的指标名称,并且可以拖动选中指标对指标进行排序,方便您自定义需要查看的指标运行状况。 人工智能服务、API网关暂不支持自定义设置指标自定义显示。 鼠标滑动到对应指标后,单击指标视图右上角的图标。 进入监控详情页面。 监控详情页面提供
在收集必要信息后,复位SOC以尝试恢复 复位SOC可能中断客户业务 NPU: 需要退出AI任务重新执行 RestartAIProcess 提示 当前故障很可能需要客户退出当前的AI任务并尝试重新执行 在收集必要信息后,尝试退出当前AI任务并尝试重新执行 退出当前AI任务以便重新执行 NPU: errorcode告警
在收集必要信息后,复位SOC以尝试恢复 复位SOC可能中断客户业务 NPU: 需要退出AI任务重新执行 RestartAIProcess 提示 当前故障很可能需要客户退出当前的AI任务并尝试重新执行 在收集必要信息后,尝试退出当前AI任务并尝试重新执行 退出当前AI任务以便重新执行 NPU: errorcode告警
Value:云解析服务实例的名称 Key:domainId Value:用户ID 云解析服务的监控指标说明 CDN与智能边缘 智能边缘小站 SYS.IES Key:site_id Value:边缘小站ID 智能边缘小站的监控指标说明 内容分发网络 SYS.CDN Key:domain_name Value:域名
2.4.5 1分钟 cpu_usage_iowait (Agent)iowait状态占比 该指标用于统计测量对象当前iowait状态占用CPU的比率。 采集方式(Linux):通过计算采集周期内/proc/stat中的变化得出iowait状态占比。用户可以通过top命令查看 %Cpu(s)
不主动让出CPU,导致CPU占用异常。 在SAP HANA云服务器中,操作系统(Guest OS)中内部idle=mwait,当操作系统内部空闲时,进入mwait状态,相比idle=poll消耗资源较少,但同样不主动让出CPU,导致CPU占用异常。 可通过执行cat /proc/
根据界面提示,配置广域网质量监控的基础信息。 图1 填写基础信息 表1 配置基本信息 参数 参数说明 取值样例 名称 系统会随机产生一个名称,用户也可以进行修改。 availabilityMonitor-wi4t 任务类型 目前可针对四种协议进行监控:HTTP、PING、TCP、UDP。 更多探测协议正在部署中。