检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建告警规则时指标和通知类型不匹配 The metric does not support the alarm action type. 根据参数说明修改指标或通知类型,使二者匹配 父主题: 公共参数
主机的监控数据。如需再次使用,请参考操作步骤或操作步骤重新安装。 Windows平台 Windows下Agent分为新版本和老版本两种,请根据安装路径确定Agent版本。 新版本Agent默认安装路径为“C:\Program Files\uniagent\extension\install\telescope”。
果有连续三次退出记录,则休眠20分钟,休眠期间,不会采集监控数据。 当主机挂载磁盘数量较多时,Agent占用的CPU或内存可能较高。您可以根据实际观测主机的资源占用率,参考操作步骤配置Agent熔断机制中的第一阈值和第二阈值。 操作步骤 使用root账号,登录Agent不上报数据的ECS或BMS。
果有连续三次退出记录,则休眠20分钟,休眠期间,不会采集监控数据。 当主机挂载磁盘数量较多时,Agent占用的CPU或内存可能较高。您可以根据实际观测主机的资源占用率,参考操作步骤配置Agent熔断机制中的第一阈值和第二阈值。 操作步骤 使用root账号,登录Agent不上报数据的ECS或BMS。
您可以更改站点监控存储数据所属区域。该区域用于存储站点监控数据,例如您创建的告警规则数据、监控视图数据和导出的监控数据。 在弹出的“创建站点监控”对话框中根据界面提示配置参数,如创建站点监控所示,参数说明如表1所示。 图1 创建站点监控 表1 配置参数 参数 参数说明 取值样例 名称 配置站点监控的名称。
这一过程称为授权。授权后,用户就可以基于策略对云服务进行操作。关于策略的授权方法及示例,请参见《云监控服务用户指南》的“权限管理”章节。 根据授权精细程度分为角色和策略。角色是将服务作为一个整体进行授权,授权后,用户可以拥有这个服务的所有权限。策略以API接口为粒度进行权限拆分,授权更加精细,可以精确到某个操作。
最大值 最小值 求和值 近24小时 平均值 5分钟 最大值 最小值 求和值 近7天 平均值 20分钟 1小时 最大值 最小值 求和值 用户可根据业务需求,拖动其中的监控视图,调整监控视图的顺序,也可以使用展示功能调整每行展示的个数。 您还可以进入监控大屏查看监控视图,请参考大屏查询模式使用技巧。
如果需要所有区域都生效,则需要在所有项目都设置策略。访问Cloud Eye时,需要先切换至授权区域。 权限根据授权精细程度分为角色和策略。 角色:IAM最初提供的一种根据用户的工作职能定义权限的粗粒度授权机制。该机制以服务为粒度,提供有限的服务相关角色用于授权。由于华为云各服务
进程数:1。 配置关键字为:usr,采集到的进程数:3。 添加指定进程的操作步骤: 登录管理控制台。 单击“服务列表 > 云监控服务”。 根据需要查看的资源进行操作: 查看弹性云服务器的进程监控,选择“主机监控 > 弹性云服务器”进入主机监控界面; 查看裸金属服务器的进程监控,选择“主机监控
资源信息更新频率:默认180分钟更新一次;该配置值小于10分钟,将以10分钟1次为资源信息更新频率 ep_ids: "xxx1,xxx2" # 可选配置,根据企业项目ID过滤资源,不配置默认查询所有资源的指标,多个ID使用英文逗号进行分割。 logs_conf_path: "/root/logs
退出当前AI任务以便重新执行 NPU: errorcode告警 NPUErrorCodeWarning 重要 这里涵盖了大量重要及以上的NPU错误码,您可以根据这些错误码进一步定位错误原因 对照《黑匣子错误码信息列表》和《健康管理故障定义》进一步定位错误 NPU当前存在故障,可能导致客户业务终止 nvidia-smi命令卡住
退出当前AI任务以便重新执行 NPU: errorcode告警 NPUErrorCodeWarning 重要 这里涵盖了大量重要及以上的NPU错误码,您可以根据这些错误码进一步定位错误原因 对照《黑匣子错误码信息列表》和《健康管理故障定义》进一步定位错误 NPU当前存在故障,可能导致客户业务终止 nvidia-smi命令卡住