检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
置。 单击“立即创建”,完成告警规则的创建。 当业务量飙升,RDS、弹性公网IP和带宽或ELB的监控指标触发设定的阈值时,云监控会在第一时间通过消息通知服务实时告知资源异常,提醒您处理,以免因此造成业务损失。 父主题: 电商平台业务监控
电商平台业务监控 简介 站点监控 主机监控 云服务监控 资源分组 父主题: 场景化实践案例
一套完整的电商平台会使用到ECS、CDN、AS、安全服务、RDS、OBS、VPC等服务,您可以创建资源分组,将电商业务的ECS、EIP、EVS等资源划分成一个分组,通过资源分组功能从业务视角查看资源使用情况、告警情况、健康情况,管理告警规则,可以极大的降低运维复杂度,提高运维效率。 本章节指导用户创建资源分组。
简介 电商业务内存要求高、数据量大并且数据访问量大、要求快速的数据交换和处理,监控要求极其高。 ECS为核心服务,全面、立体的ECS监控系统对业务稳定起到了至关重要的作用。主机监控功能可提供服务器的系统级、主动式、细颗粒度监控服务。为业务的顺畅运行保驾护航。 网站为电商平台的入口
微的性能变化,都可能会引起电商业务的大幅震荡,甚至出现宕机,引起巨大损失。 主机监控提供了包括基础监控和操作系统监控两种不同监控粒度层次的监控。基础监控为ECS自动上报的监控指标,操作系统监控通过在ECS中安装Agent插件,为用户提供服务器的系统级、主动式、细颗粒度监控服务。 应用场景
针对大量的静态数据,如产品图片,产品视频等导致不同网络用户访问电商网站出现网页打开慢、网络延时高等问题。可以使用站点监控对网站或ECS的弹性IP等进行持续拨测,监控业务入口的可用性及响应时间。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击左侧导航栏的“站点监控”。 在“站点监控”界
业务端口被Agent占用该如何处理? 云监控服务的Agent插件会使用HTTP请求上报数据,使用过程中会随机占用动态端口,范围取自/proc/sys/net/ipv4/ip_local_port_range。若发现使用的业务端口与Agent使用的端口冲突,可以修改/proc/sy
Service,以下简称OBS)创建存储桶,然后将原始数据同步保存至OBS,以保存更长时间。 资源分组: 资源分组支持用户从业务角度集中管理其业务涉及到的弹性云服务器、云硬盘、弹性IP、带宽、数据库等资源。从而按业务来管理不同类型的资源、告警规则、告警记录,可以迅速提升运维效率。 站点监控: 站点监控用于模拟
重启虚拟机等。 事件监控默认开通,您可以在事件监控中查看系统事件和自定义事件的监控详情,目前支持的系统事件请参见事件监控支持的事件说明。 事件监控为您提供上报自定义事件的接口,方便您将业务产生的异常事件或重要变更事件采集上报到云监控服务。 上报自定义事件请参见上报事件。 父主题:
可随时监控各业务系统的网络状态。 事件监控 弹性云服务器事件 在各业务中,弹性云服务器作为核心基础,细微的性能变化,运行异常及自动恢复,都可能会引起云服务上的业务受到大幅震荡。因此需使用云监控的事件监控功能对服务器运行异常及自动恢复进行监控,订阅事件告警同步进行业务处理。 关系型数据库事件
怎样让新购ECS实例中带有操作系统监控功能? 操作场景 本章节指导用户如何让新购买的ECS实例带有操作系统监控功能。 制作的私有镜像不可跨Region使用,因为跨Region使用私有镜像创建的ECS实例无法取得监控数据。 前提条件 已有安装Agent的ECS实例。 操作步骤 进入
Server为连接各业务与数据库的各个基础接口。BMS与ECS的运行状态对整体业务至关重要,CPU、内存、磁盘使用率等会直接影响整体业务状态,因此,需使用主机监控和事件监控随时监控ECS与BMS的运行状况。 网站与各个基础接口的可用性、响应时间、丢包率等会直接影响用户使用的流畅程
Agent支持的系统有哪些? 以下列表中系统版本,是经过验证确定可以支持的系统版本,对于其余版本的支持情况,正在验证中。 以下系统都基于华为云IMS服务提供的公共镜像或者公共镜像创建的系统,如果使用未经验证的外部系统,可能会出现依赖问题或引入其他不稳定因素,请谨慎使用。 操作系统 版本 支持Agent安装(ECS)
告警通知系统模板更新记录 云监控服务930版本将短信告警通知系统模板中的告警信息进行了修改,具体变更信息如表1 短信-指标系统通知模板、表2 短信-系统事件系统通知模板和表3 短信-自定义事件系统通知模板所示: 表1 短信-指标系统通知模板 信息 变更操作 告警恢复状态 新增 跳转连接
gpuAnt1EccAlarm 重要 GPU卡出现ECC硬件故障。 如果业务受损停止,则重启业务恢复。 如果业务无法启动,建议尝试重启虚拟机恢复业务。 如果业务仍然无法恢复,请提交工单。 可能会造成业务中断,故障页隔离后业务可继续正常使用GPU。 GPU ECC内存页隔离失败告警 ecc
护航。 最佳实践 电商平台业务监控 云监控在视频直播中的应用 云监控在众包平台中的应用 事件监控最佳实践 常见问题 了解更多常见问题、案例和解决方案 热门案例 什么是聚合? 指标数据保留多少时间? 什么是云监控服务? Agent支持的系统有哪些? 业务端口被Agent占用该如何处理?
基础监控与操作系统监控数据出现不一致的问题 现象 基础监控显示CPU使用率90%以上,接近100%,操作系统内监控的CPU使用率不到50%,两者相差较大。 原因 如果您在操作系统(Guest OS)中配置idle=poll,当操作系统内部空闲时,进入polling状态消耗计算资源
算服务器。在各业务中,弹性云服务器作核心基础,细微的性能变化,运行异常及自动恢复,都可能会引起云服务上的业务受到大幅震荡。 因此需使用弹性负载均衡将访问流量根据转发策略分发到后端多台弹性云服务器,通过流量分发扩展应用系统对外的服务能力,通过消除单点故障提升应用系统的可用性,并且使
使用资源分组 应用场景 业务视角管理资源 使用资源分组,方便用户将云账户下各类资源按业务分类,从业务角度出发查询监控与告警信息。 日常巡检与故障快速定位 资源分组提供资源概览、不健康资源列表、告警规则、告警记录等功能。方便用户查看云资源使用情况,收到报警后迅速定位故障资源与故障原因。
致不同用户访问网站速度变慢。可使用站点监控对网站的可用性进行监控,并且对类目、用户、交易、店铺等接口进行持续拨测,测试接口的可用性,判断业务系统是否正常。 本章节以www.example.com为例,创建站点监控,并为站点的可用性、响应时间、丢包率创建告警规则,当发生异常时通知用户及时处理。