检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
由于JOB在完成任务之后,会自动退出。如果您需要监控JOB指标,要保证存活时间大于90秒才能采集到指标数据。 采集器资源消耗 采集器在采集基础指标时的资源消耗情况和容器、进程数等因素有关,在未运行任何业务的VM上,采集器将消耗30M内存、1% CPU。为保证采集可靠性,单节点上运行的容器个数应小于1000。
当前“概览”功能默认关闭,如需使用,需提前在“菜单开关”中开启概览的开关,详细操作请参见菜单开关。 创建应用 登录AOM 2.0控制台。 在左侧导航栏单击“概览”,即可进入“概览”页面。 在“概览”页面切换为“应用视角”。 图1 切换视角 在快速入门区域,单击“创建应用”,进入“应用管理”页面。
高的线程。 约束与限制 由于线程分析获取方法以及对象的实时参数,因此线程的状态等相关信息可能会产生变化。 通过Debugging诊断线程 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。 在左侧“快速筛选”栏中,选择“区域”、“应用”以及“技术栈”。
Cores有较高的利用率。 该值为 1 (100%) 表示在整个时间间隔内上每两个周期(Volta类型卡为例)执行一次FP16指令。 假设该值为0.2(20%),可能有如下情况: 在整个时间间隔内,有20%的SM的FP16 Core以100%的利用率运行。 在整个时间间隔内,有100%的SM的FP16
故障。 功能介绍 在告警列表中,有以下关键功能: 告警列表:支持按告警级别图形化查看告警信息。 高级过滤:支持在搜索框中按告警级别 、告警源、告警关键字等条件进行过滤,默认按照告警级别过滤。 告警清除:支持单个、批量清除告警。 告警详情:在告警详情中查看告警对象的信息和修复建议,所有的告警都提供修复建议。
级别的告警产生时,可以抑制与其相关的低级别的告警;或当节点故障发生时,抑制节点上的进程或者容器的所有其他告警。 约束与限制 如果在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,抑制对象(被源告警抑制的告警)将正常发送告警通知。 您最多可创建100条抑制规则,如果
Debugging诊断可协助用户分析线程状况,获取方法及对象实时参数。方便开发人员从实时的远程应用程序中获取调试信息,而无需重新启动应用程序,也不会阻止它并导致服务停机。 约束与限制 为了应用运行稳定,强烈建议您按照要求升级JDK版本,在低版本的JDK上使用Debugging诊断功能,存在应用崩溃的风险。
抑制节点上的进程或者容器的所有其他告警。 注意事项 若在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,抑制对象(被源告警抑制的告警)将正常发送告警通知。 用户最多可创建100条抑制规则。 创建抑制规则 在左侧导航栏中选择“告警 > 告警降噪”。 在“抑制规则”页签下单击
参见查看AOM告警或事件。 在左侧导航栏选择“告警管理 > 事件列表”,查看该集群的事件详情,详情请参见查看AOM告警或事件。 在左侧导航栏选择“告警管理 > 告警规则”,查看该集群相关的告警规则,并可根据需要修改,详情请参见管理AOM告警规则。 在左侧导航栏选择“仪表盘”,可以查看当前集群的运行状态。
"hostId2"],表示规则仅会在这些节点上生效(如果不指定节点范围,规则将下发到该项目所有的节点)。 isDefaultRule String 是否为默认规则。 true、false isDetect String 是否为规则预探测场景(预探测场景不会保存规则,仅用于规则下发之前验证该规则能否有效发现节点上的进程)。true、false
添加日志桶 日志桶是对日志文件逻辑上的分组。用于以日志桶为单位查看日志等,使用这些功能前您需先添加一个日志桶。 注意事项 每个日志桶最多可添加500个日志文件。 同一个日志桶中只能添加同一个集群的日志文件。 添加日志桶 登录AOM控制台,在左侧导航栏中选择“日志 > 日志桶”。
息。 目前对于华北-北京一、华东-上海二和华南-广州区域,统计规则支持关键词统计和SQL统计。两者的区别在于统计对象不同。关键词统计的对象为原始日志;SQL统计的对象为结构化后的日志,且只有返回单个数值的SQL语句才能创建统计规则,例如select count(*) where code
发送通知,请参考“创建告警行动规则”设置告警行动规则。 操作步骤 登录AOM控制台,在左侧导航栏中选择“告警 > 告警规则”,单击右上角的“添加告警”。 设置事件类告警规则。 设置告警基本信息:在“规则名称”文本框中输入告警规则名称,并根据需要填写规则的描述信息。 图1 设置告警基本信息
在CTS事件列表查看云审计事件 操作场景 用户进入云审计服务创建管理类追踪器后,系统开始记录云服务资源的操作。在创建数据类追踪器后,系统开始记录用户对OBS桶中数据的操作。云审计服务管理控制台会保存最近7天的操作记录。 云审计控制台对用户的操作事件日志保留7天,过期自动删除,不支持人工删除。
选择监控对象。通过以下两种方式选择: 选择资源对象:单击“选择资源对象”,通过“按资源添加”或“按指标维度添加”方式在资源树上选择待监控的资源,设置完成,单击“确定”。 监控对象最多可添加100条指标数据。 选择监控对象时,如果开启了应用到所有开关,将会针对应用或服务下的所有该类型指标创建一条告警规则。例如选择了“CCE
简介 指标是对资源性能的数据描述或状态描述,指标由命名空间、维度、指标名称和单位组成。 指标命名空间 指标命名空间是对一组资源和对象产生的指标的抽象整合,不同命名空间中的指标彼此独立,因此来自不同应用程序的指标不会被错误地汇聚到相同的统计信息中。 系统指标的命名空间:命名空间是固定不变的,均以“PAAS
资源展示控制效果。 创建告警行动规则(告警通知规则) 登录AOM 2.0控制台。 在左侧导航栏中选择“告警管理 > 告警行动规则”。当前仅华南-广州区域的菜单路径为“告警中心 > 告警通知”。 在右侧区域的“告警行动规则(通知规则管理)”页签下,单击“创建告警行动规则(创建告警通知规则)”。
复制LINUX安装命令 登录ECS主机,在主机中以root权限执行5复制的Linux安装命令进行安装。 安装完成后,在UniAgent列表中查看UniAgent安装状态。UniAgent状态为运行中,则安装成功。 AOM接入弹性云服务器 ECS 登录AOM 2.0控制台。 在左侧导航栏中选择“接入
鼠标悬浮在按钮上,单击“日志折叠设置”,在弹出的日志折叠设置页面中,设置长日志字符个数。 日志超过设置的长日志字符个数时,超出字符将被隐藏,单击“展开”按钮可查看全部内容。默认开启自动折叠长日志,字符个数默认为400个。 日志时间展示 鼠标悬浮在按钮上,单击“日志时间展示”,在弹出的日
关人员,以便及时获取资源运行状态等信息并采取相应措施,避免因资源问题造成业务损失。SMN-价格说明 日志转储:依赖对象存储服务(简称OBS),将日志文件转储到OBS桶中,以便进行长期存储。OBS-价格说明 日志订阅和阈值告警订阅:依赖分布式消息服务Kafka版,发送日志或阈值告警