检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
已配置委托,配置方法参考如何配置委托?。 确保操作步骤中的安装目录都有读写权限,并且安装成功后的Telescope进程不会被其他软件关闭。 登录方式为账号密码:已收集需要安装Agent的所有主机的IP地址和root用户密码,按照iplist.txt格式整理好,并上传到第一台机器的/usr/local目录下 iplist
当主机挂载磁盘数量较多时,Agent占用的CPU或内存可能较高。您可以根据实际观测主机的资源占用率,参考操作步骤配置Agent熔断机制中的第一阈值和第二阈值。 操作步骤 使用root账号,登录Agent不上报数据的ECS或BMS。 可选:执行以下命令,切换至Agent安装路径的bin下。 Windo
为什么云服务器看不到内存使用率、磁盘使用率、带内网络流入速率和带内网络流出速率四个监控指标? 当前创建的Linux云服务器,均不支持内存使用率、磁盘使用率、带内网络流入速率和带内网络流出速率四个监控指标。但Windows云服务器是支持这四个指标的。 不同操作系统支持的基础监控指标情况请参考弹性云服务器监控指标支持列表。
配置监控视图 随着云上服务的业务日趋增长,用户对云监控服务的使用也日渐成熟,监控视图已添加的监控指标已经无法满足当前的监控需求,用户需要对监控视图中的监控指标进行修改、替换等操作。本章节指导用户如何实现在拆线图和条形图中完成监控指标的增加、修改、删除等日常操作。 曲线图的操作步骤 登录管理控制台。
在“通知策略”页签,单击待修改的通知策略所在行“操作”列的“修改”。 进入“修改通知策略”界面。 在“概况”页面,修改已配置的参数。 在“关联告警规则”页面,可选择一个或多个要解绑的告警规则,单击“解绑”。 图2 修改通知策略 单击“确定”,完成通知策略的修改。 删除通知策略 登录管理控制台。 单击“服务列表 > 云监控服务”。
并使用图例中的颜色根据该大区下的网络性能最优的区域的时延范围进行绘制。 除此之外,公网时延体验馆中标注了华为云各个公网区域在全球的大概位置,通过图例中的颜色表明该区域覆盖的周边国家或地区的平均访问时延。公网时延体验馆还会提供地区选择与网络测速功能,用户可以根据自身想看的地区访问指
com/v3/projects" } } 从控制台获取项目ID 从控制台获取项目ID的步骤如下: 登录管理控制台。 鼠标悬停在右上角的用户名,选择下拉列表中的“我的凭证”。 在“API凭证”页面的项目列表中查看项目ID。 图1 查看项目ID 父主题: 公共参数
主机监控 ECS是电商平台的基础支撑,因此ECS上细微的性能变化,都可能会引起电商业务的大幅震荡,甚至出现宕机,引起巨大损失。 主机监控提供了包括基础监控和操作系统监控两种不同监控粒度层次的监控。基础监控为ECS自动上报的监控指标,操作系统监控通过在ECS中安装Agent插件,为用
告警通知系统模板更新记录 云监控服务930版本将短信告警通知系统模板中的告警信息进行了修改,具体变更信息如表1 短信-指标系统通知模板、表2 短信-系统事件系统通知模板和表3 短信-自定义事件系统通知模板所示: 表1 短信-指标系统通知模板 信息 变更操作 告警恢复状态 新增 跳转连接
资源数”和“7日告警资源数”的统计。 告警统计 该数据统计的是近7天状态为“告警中”的告警级别明细和资源分组告警。告警级别明细中包含对“紧急告警”、“重要告警”、“次要告警”和“提示告警”的统计。 关键指标 展示了产品自主推荐的关键指标的监控详情。 在云服务看板详情页面中,单击左
事件监控简介 事件监控提供了事件类型数据上报、查询和告警的功能。方便您将业务中的各类重要事件或对云资源的操作事件收集到云监控服务,并在事件发生时进行告警。事件监控不依赖于Agent插件。 事件即云监控服务保存并监控的云服务资源的关键操作。您可以通过“事件”了解到谁在什么时间对系统
当告警触发后,我们需要定义通知的渠道和对象,快速的将告警信息通过配置的渠道通知到运维人员。 当前CES支持以下三种方式来完成通知的配置。 通知策略(推荐):产品最新上线能力,通过通知策略可以完成告警的分级通知、简易排班。 通知组:通过在云监控服务上配置的通知群组,可以快速通知到指定运维人员。
查询系统当前可监控指标列表,可以指定指标命名空间、指标名称、维度、排序方式,起始记录和最大记录条数过滤查询结果。 云服务资源删除后,会保留3个小时的数据缓存,在3小时之内还能查到资源对应的监控指标,属于正常现象。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可
数据。 若“插件状态”为“运行中”,等待5分钟后仍没有操作系统监控数据,则需要排查ECS或BMS时间和管理控制台所在客户端时间是否一致。 Agent上报数据时取的是ECS或BMS的操作系统本地时间,管理控制台下发的请求时间范围是依赖用户客户端浏览器的时间,两者如果不匹配则可能导致管理控制台查不到操作系统监控数据。
云专线插件是用于检测云专线端到端的网络质量的插件,主要包含网络时延和丢包率两个指标。 云专线插件分为两种: dc-nqa-collector:用于监控自动化专线,探测远端子网的时延和丢包率。 history-dc-nqa-collector:用于监控手工专线,探测远端子网的时延和丢包率。 自动化
下面将介绍资源监控如何查看和使用。 在总览页面的左侧展示了全部资源的健康评分、资源总数和正在告警的资源数,正在告警的资源数按照告警级别展开。 健康评分的计算公式为:健康评分=无告警资源个数/总资源个数 用户可以选某个资源分组,查看资源分组中对应的服务资源,单击服务资源,可参看服务资源中具体资源名称,维度和告警级别。
修改prometheus中的prometheus.yml文件配置。如下配置所示在scrape_configs下新增job_name名为“huaweicloud”的节点。其中targets中配置的是访问cloudeye-exporter服务的ip地址和端口号,services配置的是你想要监控的服务,比如SYS
Service,CTS),是华为云安全解决方案中专业的日志审计服务,提供对各种云资源操作记录的收集、存储和查询功能,可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。 用户开通云审计服务并创建和配置追踪器后,CTS可记录CES的管理事件和数据事件用于审计。 CTS的详细介绍和开通配置方法,请参见CTS快速入门。
检查应用和数据库之间的连接是否重新建立了连接。 复制状态异常 即主备之间复制时延太大(一般在写入大量数据,或者执行大事务的时候会出现),在业务低峰期备机会逐渐追上主机。还有另一种可能是主备间的网络中断,导致主备复制异常。但不会导致原来单实例的读写中断,客户的应用是无感知的。 提交工单处理。
原始值:指监控指标在被处理或转换之前的最初的形式或状态的值。 平均值:指在聚合周期内对原始值进行平均计算出来的值。 最大值:指在聚合周期内原始值中最大的值。 最小值:指在聚合周期内原始值中最小的值。 方差值:指在聚合周期内原始值中各个数据点与其平均值之间的差异程度的值。 求和值:指在聚合周期内原始值相加得到的值。