检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
"/usr/lib64/libnvidia-ml.so.1" nvmlCceNvidiaLibraryPath = "/opt/cloud/cce/nvidia/lib64/libnvidia-ml.so.1" Windows驱动文件 DefaultNvmlDLLPath =
Agent一键修复后运行正常,但仍然没有监控数据。 约束与限制 当前章节的修复方式只支持新版本Agent,若Agent版本为老版本,建议先升级到新版本。 查看当前Agent版本的命令为: if [[ -f /usr/local/uniagent/extension/install/t
安装云专线指标采集插件 云专线插件是用于检测云专线端到端的网络质量的插件,主要包含网络时延和丢包率两个指标。 云专线插件分为两种: dc-nqa-collector:用于监控自动化专线,探测远端子网的时延和丢包率。 history-dc-nqa-collector:用于监控手工专线,探测远端子网的时延和丢包率。
根据协议拨测结果状态码识别服务的可用性,通过配置监控告警条件,可在出现异常状态时立马告警,并收到服务故障信息。此外,您还能观察到不同地域运营商线路探测点到服务的网络响应时间时延,了解不同地域运营商的用户访问时延体验,可为系统部署架构优化提供参考依据。 网络可用性分析 通过使用广域
选择“所有维度”时,表示该服务的所有监控对象均会转储到分布式消息服务Kafka中。 选择“云服务器”时,表示仅该云服务器的监控指标会转储到分布式消息服务Kafka中。 取值样例:所有维度 监控范围 目前仅支持“全部资源”,表示选择的服务的指定监控对象的全部指标都会转储到分布式消息服务Kafka中。 资源类型
返回结果 状态码 请求发送以后,您会收到响应,其中包含状态码、响应消息头和消息体。 状态码是一组从1xx到5xx的数字代码,状态码表示了请求响应的状态,完整的状态码列表请参见状态码。 对于获取用户Token接口,如果调用后返回状态码为“201”,则表示请求成功。 响应消息头 对应
自动同步,其他维度策略修改后不会自动同步。 例如:“资源层级”选择“子维度”,子维度为弹性云服务器,修改模板中弹性云服务器策略,会自动同步到告警规则中,修改弹性云服务器-磁盘策略,则不会自动同步。 模板 当告警类型选择指标且触发规则选择关联模板时,或告警类型选择事件且事件类型为系统事件时,需要选择导入的模板。
环境,提升用户云中资源的安全性,简化用户的网络部署。 当您的弹性云服务器要访问Internet时,您可使用虚拟私有云创建的弹性公网IP绑定到弹性云服务器上,弹性云服务器即可连接公网。不同弹性公网IP还可以共享带宽,减少您的带宽成本。 使用弹性公网IP时,可使用事件监控弹性公网IP
示监控的测量对象是弹性云服务器。“带外”表示监控的测量对象是虚拟化层面的物理服务器。 流入和流出 流入:表示以弹性云服务器为主体,每秒流入到弹性云服务器的流量。 流出:表示以弹性云服务器为主体,每秒流出到外部网络或客户端的流量。 流入流出方向如下图所示: 指标含义 表1 网络流入流出速率含义
cope\bin文件夹下的conf.json文件。 配置如下参数,参数说明请参见表1。 认证用的AccessKey和SecretKey明文存储有很大的安全风险, 建议对该区域下所有云服务器或裸金属服务器安装的Agent做委托授权,委托方法请参考如何配置委托? { "Ins
修改监控看板。 批量删除监控看板(DeleteDashboards) 批量删除监控看板。 监控视图 创建/复制/批量创建监控视图到指定的监控看板(CreateDashboardWidgets) 创建/复制/批量创建监控视图到指定的监控看板。 查询指定监控看板下的监控视图列表(ListDashboardWidgets)
telescope/bin/conf.json 修改文件中的参数,具体参数请参见表1。 认证用的AccessKey和SecretKey明文存储有很大的安全风险, 建议对该区域下所有云服务器或裸金属服务器安装的Agent做委托授权,委托方法请参考如何配置委托? { "Ins
事件发生时间。UNIX时间戳,单位毫秒。 说明:因为客户端到服务器端有延时,因此插入数据的时间戳应该在[当前时间-1小时+20秒,当前时间+10分钟-20秒]区间内,保证到达服务器时不会因为传输时延造成数据不能插入数据库。 detail Detail object 是 事件详情。
比或环比、展示规则。 旧版中,“柱状图”、“条形图”“表格”和“环形图”的展示数量为3到10之间,“折线图”和“面积图”的展示数量为1到200之间。 新版中,一个视图内该指标可设置展示数量为1到50之间。 新版中,“折线图”和“面积图”的聚合规则可选择是否开启,“柱状图”、“条形
确定”保存配置。 创建告警通知组并添加告警通知对象 创建告警通知组,并将通知对象加入到通知组中。 具体操作请参考创建通知对象/通知组。 创建告警规则 创建告警规则,用户可配置通知策略或直接通知到通知组与通知对象。 创建告警规则请参考创建告警规则和通知,创建通知策略请参考创建/修改/删除通知策略。
监控视图 创建/复制/批量创建监控视图到指定的监控看板 查询指定监控看板下的监控视图列表 查询指定监控视图信息 删除指定监控视图 批量更新监控视图 父主题: 云资源监控
确定”保存配置。 创建告警通知组并添加告警通知对象 创建告警通知组,并将通知对象加入到通知组中。 具体操作请参考创建通知对象/通知组。 创建告警规则 创建告警规则,用户可配置通知策略或直接通知到通知组与通知对象。 创建告警规则请参考创建告警规则和通知,创建通知策略请参考创建/修改/删除通知策略。
确定”保存配置。 创建告警通知组并添加告警通知对象 创建告警通知组,并将通知对象加入到通知组中。 具体操作请参考创建通知对象/通知组。 创建告警规则 创建告警规则,用户可配置通知策略或直接通知到通知组与通知对象。 创建告警规则请参考创建告警规则和通知,创建通知策略请参考创建/修改/删除通知策略。
当告警触发后,我们需要定义通知的渠道和对象,快速的将告警信息通过配置的渠道通知到运维人员。 当前CES支持以下三种方式来完成通知的配置。 通知策略(推荐):产品最新上线能力,通过通知策略可以完成告警的分级通知、简易排班。 通知组:通过在云监控服务上配置的通知群组,可以快速通知到指定运维人员。 主体订阅:通过在消息通知
使用。 次要告警:告警规则对应资源存在相对不太严重点问题,此问题不会阻碍资源的正常使用。 提示告警:告警规则对应资源存在潜在的错误可能影响到业务。 父主题: 告警