正在生成
详细信息:
检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
2(20%),可能有如下情况: 在整个时间间隔内,有20%的SM的Tensor Core以100%的利用率运行。 在整个时间间隔内,有100%的SM的Tensor Core以20%的利用率运行。 在整个时间间隔的1/5时间内,有100%的SM上的Tensor Core以100%利用率运行。
或外部服务的功能异常而引起业务的异常。“告警列表”页面提供告警查询和处理功能,便于您更快地发现、定位并恢复故障。 功能介绍 在告警列表中,有以下关键功能: 告警列表:支持按告警级别图形化查看告警信息。 高级过滤:支持在搜索框中按告警级别 、告警源、告警关键字等条件进行过滤,默认按照告警级别过滤。
验证Redis Exporter是否部署成功。 在工作负载列表中“无状态负载”页签下,单击3.b创建的无状态工作负载的名称,在实例列表中单击操作列下的“更多 > 日志”,可以查看到Exporter成功启动并暴露访问地址。 图1 查看日志 验证。有以下三种方法进行验证: 登录集群节点执行如下任意一种命令:
验证MongoDB Exporter是否部署成功。 在工作负载列表中“无状态负载”页签下,单击3.b创建的无状态工作负载的名称,在实例列表中单击操作列下的“更多 > 日志”,可以查看到Exporter成功启动并暴露访问地址。 图1 查看日志 验证。有以下三种方法进行验证: 登录集群节点执行如下任意一种命令:
验证MongoDB Exporter是否部署成功。 在工作负载列表中“无状态负载”页签下,单击3.b创建的无状态工作负载的名称,在实例列表中单击操作列下的“更多 > 日志”,可以查看到Exporter成功启动并暴露访问地址。 图1 查看日志 验证。有以下三种方法进行验证: 登录集群节点执行如下任意一种命令:
验证Redis Exporter是否部署成功。 在工作负载列表中“无状态负载”页签下,单击3.b创建的无状态工作负载的名称,在实例列表中单击操作列下的“更多 > 日志”,可以查看到Exporter成功启动并暴露访问地址。 图1 查看日志 验证。有以下三种方法进行验证: 登录集群节点执行如下任意一种命令:
配置错误:Region名错误,或PODLB地址错误。 数据采集失败:调openstack接口失败,或采集的hostid为空。 请查看ICAgent的日志并检查配置,根据日志报错判断原因。 父主题: 常见使用问题
重启CCE工作负载 使用重启CCE工作负载卡片可以创建任务重启一个或多个CCE工作负载。 只支持对有状态负载和无状态负载进行重启,其余类型负载不支持。 创建重启CCE工作负载任务 登录AOM 2.0控制台。 在左侧导航栏单击“自动化运维(日落)”,即可进入“自动化运维”界面。 在
安装文件包提示没有OBS权限。 可能原因 自动化运维需要访问凭证授权访问OBS,用来获取OBS中的文件包。 解决方法 请在“设置 > 访问凭证”页面检查是否已创建访问凭证,如果没有创建访问凭证,请新建访问凭证。 父主题: 运维管理(日落)
直接告警:满足告警条件,直接发送告警。 设置是否启用告警行动规则。启用告警行动规则后,系统根据关联SMN主题与消息模板来发送告警通知。如果现有的告警行动规则无法满足需要,可单击“新建告警行动规则”添加。设置告警行动规则的操作详见告警行动规则。 启用告警行动规则后,需要设置是否开启告警恢复通知。开启告
按SQL统计创建告警规则功能仅支持全部用户使用的局点有:华南-广州、华北-北京四、华北-乌兰察布二零一、华北-乌兰察布一、华东-上海一、华东-上海二、中国-香港、亚太-曼谷、亚太-新加坡,支持部分白名单用户使用的局点有:华北-北京一、西南-贵阳一、亚太-曼谷、华南-深圳、华北
Windows环境下安装icagent失败,并提示SERVICE STOP 更多 常见咨询问题 AOM如何计费? AOM有哪些使用限制? AOM与APM有何区别? 如何区分告警和事件? 时间范围和统计周期的关系? AOM展示的日志是否为实时日志? 更多 常见使用问题 无法正常消费日志或阈值告警数据? 没有消息通知服务的访问权限?
Exporter接入 操作场景 使用PostgreSQL过程中需要对PostgreSQL运行状态进行监控,以便了解PostgreSQL服务是否运行正常,及时排查PostgreSQL故障问题原因。Prometheus监控服务提供了CCE容器场景下基于Exporter的方式来监控Po
Exporter接入 操作场景 使用PostgreSQL过程中需要对PostgreSQL运行状态进行监控,以便了解PostgreSQL服务是否运行正常,及时排查PostgreSQL故障问题原因。Prometheus监控服务提供了CCE容器场景下基于Exporter的方式来监控Po
p_server_status) 该指标用于统计主机是否成功连接上NTP服务器。 0、1 0表示已连接 1表示未连接 无 NTP同步状态(aom_node_ntp_status) 该指标用于统计主机本地时间与NTP服务器时间是否同步。 0、1 0表示同步 1表示未同步 无 进程数
Agent时,必须确保接入APM的机器与APM服务网络连通,Agent才能正常工作。 可使用Telnet命令测试目标机器与APM服务器网络是否连通。例如,以检查华北-北京四区域,且源代码选择“增强型探针”的连通性为例,请登录应用所部署的机器,并输入命令telnet 100.125
Agent时,必须确保接入APM的机器与APM服务网络连通,Agent才能正常工作。 可使用Telnet命令测试目标机器与APM服务器网络是否连通。例如,以检查华北-北京四区域,且源代码选择“增强型探针”的连通性为例,请登录应用所部署的机器,并输入命令telnet 100.125
Agent时,必须确保接入APM的机器与APM服务网络连通,Agent才能正常工作。 可使用Telnet命令测试目标机器与APM服务器网络是否连通。例如,以检查华北-北京四区域,且源代码选择“增强型探针”的连通性为例,请登录应用所部署的机器,并输入命令telnet 100.125
安装UniAgent 对主机安装UniAgent,UniAgent有三种安装方式:Excel导入安装、手动安装和远程安装。 您可以按照您的实际场景进行选择。 表1 安装方式 方式 适用场景 手动安装 首次安装UniAgent时,必须使用手动安装方式。 远程安装 必须有可用的安装机,才可进行远程安装。
处理,处理完成后再发送通知,避免产生告警风暴。 告警降噪功能分为分组、去重、抑制、静默四部分。 去重为内置策略,服务后台会自动检验告警内容是否一致实现去重的效果,用户无需手动创建规则。 分组、抑制、静默需手动创建规则,具体的创建方式请参见创建分组规则、创建抑制规则和创建静默规则。