检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
大量的商品类目、用户信息、交易数量、店铺展示信息,会导致不同用户访问网站速度变慢。可使用站点监控对网站的可用性进行监控,并且对类目、用户、交易、店铺等接口进行持续拨测,测试接口的可用性,判断业务系统是否正常。 本章节以www.example.com为例,创建站点监控,并为站点的可用性、响应时间、丢包率创建告警规则,当发生异常时通知用户及时处理。
CS-02),两台用于测试项目组(ECS-03和ECS-04)。现在需要通过告警通知功能,及时获取开发组下的两台弹性云服务器的资源运行状态(包含CPU利用率、CPU空闲时间占比、平均负载、I/O使用率、磁盘使用率、内存使用率、inode已使用占比),而测试组下的两台弹性云服务器不需要获取其运行状态。
文档修订记录 发布日期 修改记录 2023-10-12 第四十六次正式发布: 本次变更如下: 新增告警通知。 新增一键告警。 新增告警通知屏蔽。 新增CES资源标签管理。 2023-08-31 第四十五次正式发布: 本次变更如下: 新增监控看板。 新增监控视图。 新增插件状态查询。
json配置文件default-shm-size字段 方式二: docker run 命令中使用 --shm-size 参数来设置单个容器的共享内存大小 分布式训练时共享内存不足导致训练失败 NPU:RoCE网卡down RoCELinkStatusDown 重要 NPU 卡 %d RoCE Link 状态Down
告警/恢复正常、告警流水号。 数据格式 “通知方式”选择“HTTP(s)”时,需要设置该参数。可选择“文本”或“JSON”。 预览 单击“测试发送”,设置发送方式为“通知组”或“主题订阅”。 说明: “主题订阅”当前只支持配置华北-北京四区域的SMN主题,如需使用,请前往该域创建您的主题。
修订记录 发布日期 修改说明 2024-01-24 第七十次正式发布: 事件监控支持的事件说明新增“数据库代理”事件描述。 Agent版本特性更新Agent版本。 新增创建/删除/复制/修改通知内容模板章节。 2024-01-18 第六十九次正式发布: 新增跨账号查看我的看板章节。
通过资源分组实现云资源分组监控 对于有一定资源规模的组织或企业而言,资源数量大多会因为人工维护繁琐导致易出错,同时应用于不同生产环节的资源可能需要分组管理,例如用于测试和用于生产的资源相比,需要配置的监控与告警、通知渠道与接收用户也可能不一样。云监控支持根据实例名称、实例标签、企业项目进行分组管理告警规则
n > Data source > Add data source > Prometheus > 填写Prometheus地址 > 保存&测试”。 图3 配置Prometheus数据源 配置相关云服务监控视图。 推荐用户使用CES提供的模板,CES提供的模板涉及企业项目概念,请完