检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
使用Grafana查看AOM中的监控指标 安装配置Grafana 配置Grafana数据源 配置仪表盘查看指标数据 父主题: ModelArts Standard资源监控
接入AOM告警 应用运维管理AOM是云上应用的一站式立体化运维管理平台,实时监控应用及云资源,采集各项指标、日志及事件等数据分析应用健康状态,提供告警及数据可视化功能,帮助用户及时发现故障,全面掌握应用、资源及业务的实时运行状况。
接入CES指标 云监控服务CES可以收集云服务内置监控指标的数据,可以通过监控这些指标来跟踪对应云服务状态。AppStage运维中心支持将CES收集的监控指标数据采集到运维中心监控服务中进行管理,可以参考支持监控的服务列表查看CES当前已支持的监控指标。
前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 步骤一:创建日志项目 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“日志 > 日志接入”。
AstroZero系统设置与运维监控 查看AstroZero账号的业务阈值 设置AstroZero账号的公司信息 设置AstroZero系统通知方式 设置AstroZero系统参数 设置AstroZero系统域名 设置AstroZero系统支持的语言 设置AstroZero代码仓库
监控指标说明 功能说明 本节定义了弹性负载均衡服务上报云监控的监控指标的命名空间,监控指标列表和维度定义。用户可以通过云监控提供的API接口来检索弹性负载均衡服务上报的监控指标以及产生告警信息。
运维详情:运维详情包括两部分,运维计划和运维状态。运维计划将展示全部运维任务基本信息,运维状态将展示运维任务运行状态信息。 该特性仅8.1.3及以上版本支持。 智能运维功能暂不支持存算一体(单机部署)。
AppStage运维中心支持将CES产生的告警接入至监控服务中,如果是其他华为账号资源产生的告警接入,在录入账号时,如果使用AK-SK纳管方式,需要参考录入账号增加资源管理(RMS)权限。 前提条件 已创建CES告警规则,并配置主题订阅的方式进行告警通知。 已创建企业项目。
监控 查询时间序列 查询时序数据 查询指标 查询监控数据 添加监控数据 添加或修改服务发现规则 删除服务发现规则 查询系统中已有服务发现规则 添加阈值规则 查询阈值规则列表 修改阈值规则 删除阈值规则 查询单条阈值规则 批量删除阈值规则 父主题: API
查看云服务监控指标原始数据 本节介绍如何在OBS中通过下载监控数据文件查看已保存至OBS桶的原始数据。 约束与限制 仅支持旧版云服务监控操作。 前提条件 已在云监控服务中成功配置数据存储。配置数据存储请参见配置数据存储。 操作步骤 登录管理控制台。
如何获取平台接入地址? 请进入IoTDA的控制台界面,在左侧菜单栏单击“IoTDA实例”,选择您的实例并单击实例卡片进入。 图1 实例管理-切换实例 在左侧导航栏单击总览,单击“接入信息”,找到您的平台接入地址。 图2 总览-获取接入信息 父主题: 方案咨询
配置url监控项 在“编辑【URL监控】监控配置”页面根据以下示例配置。 使用限制 由于Header、Url参数、Cookie等处可能存在敏感数据,配置后系统将自动拦截,请注意隐私保护。 参数名称 说明 样例 采集间隔 默认60s,此处不支持修改。
图6 添加国标编码设备 其中NVR的国标设备,还需要将对应的通道ID填写到设备上,NVR设备的对应通道才会注册到视频平台 视频监控 可对视频进行多屏实时预览,最多可支持25路视频同时预览。可通过设备名称和节点名称进行设备查询,快速找到需要查看的视频通道。
当带宽出现异常时,云监控会在第一时间通过消息通知服务实时告知资源异常,提醒您处理,以免因此造成业务损失。 父主题: 云监控在视频直播中的应用
运维监控区域 运维监控区域汇总监控信息、成本概况、费用和账单信息,帮助用户优化成本,规划费用。 图1 运维监控区域 仅当我的资源区域切换至“总览”视图时,显示运维监控区域内容。 各个模块的简介和功能如表1所示。
前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 创建过滤器过滤告警 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。
监控信息查询 API统计信息查询-最近一段时间 分组统计信息查询-最近一小时 父主题: 共享版API(仅存量用户使用)
监控弹性负载均衡 使用场景 用户在使用ELB的过程中有了解业务负载详情的需求,为使用户更好地掌握ELB的流量负载情况,华为云提供了立体化监控平台云监控服务(CES)。通过云监控服务用户可以执行自动实时监控、告警和通知操作,帮助用户实时掌握通过ELB负载的运行情况。
在数据开发主界面的左侧导航栏,选择“运维调度 > 作业监控”。 选择“实时集成作业监控”页签,单击作业名称。 图1 实时集成作业监控 在详情页面,选择“监控信息”,在页面最下方可直接查看作业的部分关键指标数据。
训练作业的监控内存指标持续升高直至作业失败 问题现象 训练作业的“状态”为“运行失败”。 原因分析 训练作业的监控内存指标持续升高,导致最后训练作业失败。 处理步骤 查询训练作业的日志和监控信息,是否存在明确的OOM报错信息。 是,训练作业的日志里存在OOM报错,执行2。