检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
GPU:Ant系列机器动态路由配置错误 GpuRouteConfigError 重要 Ant系列机器网卡%s动态路由未配置或配置错误,CMD [ip route]: %s | CMD [ip route show table all]: %s。 请正确配置RoCE网卡路由 NPU网络通信异常
制作的私有镜像不可跨Region使用,因为跨Region使用私有镜像创建的ECS实例无法取得监控数据。 前提条件 已有安装Agent的ECS实例。 操作步骤 进入ECS控制台的实例管理页面,单击该实例右侧的“更多 > 关机”,将已安装Agent的ECS实例关机,如图1所示。 图1 关机 单击该实例右侧的“更多 > 镜像/磁盘/备份
i1、P1系列的ECS,P、Pi、G、KP系列的BMS。 已安装lspci工具,未安装lspci工具的云服务器不支持采集GPU指标数据及上报事件。 安装lspci工具的方法如下 登录弹性云服务器。 更新镜像源,获取安装依赖。 wget http://mirrors.myhuaweicloud
GPU:Ant系列机器动态路由配置错误 GpuRouteConfigError 重要 Ant系列机器网卡%s动态路由未配置或配置错误,CMD [ip route]: %s | CMD [ip route show table all]: %s。 请正确配置RoCE网卡路由 NPU网络通信异常
String 自定义进程名称 最小长度:1 最大长度:250 表7 properties 参数 参数类型 描述 filter String 聚合类型,目前只有TopN这一种类型,折线图不支持该参数 枚举值: topN topN Integer Top前N个;折线图时为随机展示的时序数据条数
关联到分组”。 在“关联到资源分组”页面,选择资源分组。 图1 关联到资源分组 根据界面提示,配置告警通知参数。 图2 配置告警通知 表1 配置告警通知 参数 参数说明 发送通知 配置是否发送短信、邮件、语音通知、HTTP、HTTPS、FunctionGraph(函数)、Func
自定义进程名称 最小长度:1 最大长度:250 表8 properties 参数 是否必选 参数类型 描述 filter 否 String 聚合类型,目前只有TopN这一种类型,折线图不支持该参数 枚举值: topN topN 否 Integer Top前N个;折线图时为随机展示的时序数据条数
优势:配置简单,一键式打开开关。 弹性云服务器、弹性公网IP和关系型数据库的重要事件。 事件监控 指标监控 立即触发 普通告警 根据设置的告警策略触发告警。例如:CPU利用率在5分钟内的平均值连续5次>=80%时发送告警通知。 优势:告警策略更加灵活,可根据业务情况灵活配置。 所有支持监控的服务。
String 自定义进程名称 最小长度:1 最大长度:250 表9 properties 参数 参数类型 描述 filter String 聚合类型,目前只有TopN这一种类型,折线图不支持该参数 枚举值: topN topN Integer Top前N个;折线图时为随机展示的时序数据条数
这里以平时的SNAT连接数为10000为例,高峰期为平时的2-3倍,因此配置SNAT连接数为30000的告警规则。 出网带宽使用率建议配置为80%。 “告警通知”功能触发产生的告警消息由消息通知服务SMN发送,可能产生少量费用,具体费用请参考产品价格说明。 配置完成后,单击“立即创建”,完成创建告警规则。
提供定制化的解决方案,将创意、智慧、技能转化为商业价值和社会价值。 在华为云部署的众包平台的经典架构图如图1所示,核心数据库采用BMS集群方式部署数据库集群,Web-Server与API-Server部署在ECS上,Web-Server主要提供网站的搜索、类目、店铺、交易等业务,
归属企业项目 表1 配置规则信息 参数 参数说明 归属企业项目 资源分组所属的企业项目。只有拥有该企业项目权限的用户才可以查看和管理该资源分组。创建企业项目请参考:创建企业项目。 (可选)配置“高级配置”,关联告警模板,创建新的告警规则。 选择告警模板名称,根据界面提示,配置告警通知参数。
部分云服务的资源查询权限,如在使用中遇到权限问题,需要配置涉及服务的细粒度授权特性,才可以正常使用,支持细粒度授权的云服务列表请参考: 使用IAM授权的云服务。 告警通知:依赖SMN服务的SMN FullAccess。 配置数据转储:依赖OBS服务的OBS OperateAccess。
HTTP状态码 429 错误码 ces.0429 可能原因 原因1:API被流控。详见下方【案例一】 解决方法 若API被流控,需第一时间找运维人员配置新的流程策略。 案例一 API被流控 查看弹性云服务器ID为6f3c6f91-4b24-4e1b-b7d1-a94ac1cb011d的CPU使用率在2019-04-30
目前站点监控功能免费。 站点监控部署在华北-北京一,若子账号无权限,需在用户所在用户组策略中勾选添加华北-北京一的权限。 图1 修改CES授权范围 功能优势 支持创建、修改、停用、启用、删除站点监控。 提供简单的添加配置,不再浪费资源和精力配置复杂的开源产品。 支持站点异常告警,不用担心网站出问题而无人知晓。
GPU驱动正常安装后,最多10分钟将在控制台看到采集到的GPU指标数据。 已安装lspci工具,未安装lspci工具的云服务器不支持采集GPU指标数据及上报事件。 安装lspci工具的方法,请参见安装lspci工具。 确保云服务器的安装目录都有读写权限,并且安装成功后的Telescope进程不会被其他软件关闭。
在弹出的“创建站点监控”对话框中根据界面提示配置参数,如图1所示。 图1 创建站点监控 配置完成后,单击“确定”,完成创建站点监控。 创建站点监控完成后,单击站点名称右侧的“ 创建告警规则”,为设置的站点配置告警规则。 在创建告警规则界面,按照界面提示配置参数,参数说明请参见配置参数。 建议针对可用性
为了更加安全高效的使用云监控服务提供的主机监控功能,我们提供了最新方式的Agent授权方法。在安装主机监控Agent前,仅需要一键式单击该区域的授权按钮或者在创建弹性云服务器页面勾选云监控Agent委托,则系统会自动对该区域下所有云服务器或裸金属服务器安装的Agent做临时AK/SK授权,并且以后在该区域新创建的资
云监控插件(Agent) Agent安装配置方式说明 Agent版本特性 修改DNS与添加安全组 Agent安装说明 手动配置Agent(可选) 升级Agent 管理Agent BMS硬件监控插件说明 安装GPU指标集成插件 安装云专线指标采集插件 父主题: 主机监控
间。 针对电商平台使用的RDS、ELB、VPC等服务,可以使用云服务监控,在云服务监控页面实时查看云服务运行状态、各个指标的使用情况并对监控指标设置告警规则,精确掌握云服务的运行情况。 电商业务主要涉及ECS、CDN、AS、安全服务、RDS、ELB、OBS等服务。通过资源分组功能