检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
集群监控 集群监控的对象为通过CCE部署的集群。“集群监控”页面可实时监控集群的多项基础监控指标(例如集群状态、CPU使用率、内存使用率、节点运行状态等)和相关的告警、事件数据,通过这些指标和相关的告警信息,用户可实时了解集群的运行状况,及时处理潜在风险,保障集群稳定运行。 约束与限制
default 描述 规则的描述信息,最多可输入1024个字符。本示例可不填写。 - 设置告警规则的详细信息。 告警规则设置中的规则类型、配置方式、Prometheus 实例默认选择为指标浏览处的配置。 设置告警规则详情。监控的指标自动选择为指标浏览处选择的指标。 指标的详细设置由
以将维度理解为这些特征的类别。 主机 AOM的每一台主机对应一台虚拟机或物理机。主机可以是您自己的虚拟机或物理机,也可以是您通过华为云购买的虚拟机(例如:弹性云服务器,简称ECS)或物理机(例如:裸金属服务器,简称BMS)。只要主机的操作系统满足AOM支持的操作系统,且主机已安装
面上准确查看应用、服务器的指标数据。 ICAgent进程需要root用户安装和运行。 安装方式说明 ICAgent有两种安装方式,您可以按照您的场景进行选择。您需要注意的是,下述两种安装方式,都不适用于容器节点(通过ServiceStage、CCE创建的集群容器节点)。容器节点不
示。 描述 应用的描述信息,最多可输入1000个字符。 接入方式默认选择“增强型探针”。 数据接入方式选择“虚机接入”,按照界面提示步骤接入。 图2 虚机接入 使用PuTTY等远程登录工具,登录待安装Agent的Linux操作系统主机,并以root权限执行复制的命令来下载并安装JavaAgent。
说明: AOM的日志绕接能力是使用copytruncate方式实现的,如果选择了设置,请务必保证您写日志文件的方式是append(追加模式),否则可能出现文件空洞问题。 当前主流的日志组件例如Log4j、Logback等均已经具备日志文件的绕接能力,如果您的日志文件已经实现了
加需要的变量信息。 选择“邮件”方式发送通知时,可单击“预览”查看设置的邮件消息模板效果。在预览界面,可根据需要修改消息主题。 表2 默认消息模板变量说明 变量名称 变量说明 变量定义 告警名称 触发的告警规则的名称。 ${event_name} 告警ID 触发的告警规则的ID。
从默认提供的CCE模板中选择合适的模板,系统会根据选择的模板自动填充相关指标的普罗格式命令行。 说明: 单击告警规则详情后的,可以锁定告警规则详情中的内容。锁定后,您可以进行以下操作: 单击告警规则详情后的,解除锁定。 单击告警规则详情后的,复制普罗语句。 命令行输入的详细说明请参见普罗语句说明。
niAgent的安装脚本。 解决办法 指导用户为Linux系统的ECS主机配置DNS域名解析,并添加安全组,以解决下载UniAgent安装脚本出现域名无法解析问题。 修改ECS主机的DNS配置有两种方式:命令行和管理控制台;您可以根据自己的使用习惯选择其中一种方式进行配置。 配置
、多个服务器的时区、时间都一致。否则,可能会导致安装后不能在界面上准确查看应用、服务器的指标数据。 安装方式说明 ICAgent有两种安装方式,您可以按照您的场景进行选择。您需要注意的是,下述两种安装方式,都不适用于容器节点(通过ServiceStage、CCE创建的集群容器节点
待安装UniAgent主机支持的Linux操作系统,详情请参见操作系统使用限制。 安装方式说明 AOM支持对主机通过命令行方式安装UniAgent。 表1 安装方式 方式 适用场景 命令行安装UniAgent 适用于首次安装、单机安装UniAgent场景。远程登录待安装UniAgent的主机,手动执行安装命令去安装UniAgent。
PM类型的Prometheus实例并显示在AOM控制台的“Prometheus监控 > 实例列表”界面。 约束与限制 使用“多指标”和“满足全部条件触发”的计算方式创建的告警规则,在监控两个及两个以上的指标时,需要同时满足以下条件才会触发告警: 指标的指标数据满足设置的检测规则。
描述 规则的描述信息,最多可输入1024个字符。 设置告警规则的详细信息。 选择“规则类型”为“指标告警规则”。 选择指标配置方式为“全量指标”。 从下拉列表选择需要创建告警的Prometheus实例。 设置告警规则详情。具体的参数说明如表5所示。 设置完成后,监控的指标数据以折
确到具体服务的操作、资源以及请求条件等。基于策略的授权是一种更加灵活的授权方式,能够满足企业对权限最小化的安全管控要求。例如:针对ECS服务,管理员能够控制IAM用户仅能对某一类云服务器资源进行指定的管理操作。多数细粒度策略以API接口为粒度进行权限拆分,AOM支持的API授权项请参见策略和授权项说明。
已创建的告警规则。 如图5所示,单击规则名称前的,可查看该告警规则的详细信息。 在展开的列表中,只要监控对象满足设置的告警条件时,在告警列表界面就会生成一条指标类告警,您可在左侧导航栏中选择“告警管理 > 告警列表”,在告警列表中查看该告警。只要当前示例使用的DCS实例的CPU利
说明: 新版仪表盘功能的图表配置与旧版仪表盘功能的图表配置不相同。 使用旧版仪表盘编辑新版仪表盘中创建的图表时,旧版仪表盘的图表配置无法兼容新版仪表盘的图表配置。 使用新版仪表盘编辑旧版仪表盘中创建的图表时,新版仪表盘的图表配置可以兼容旧版仪表盘的图表配置。 新增告警规则 添加图表时,新增告警规则
方式一:使用AOM预定义好的时间标签,例如,近1小时、近6小时等,您可根据实际需要选择不同的时间粒度。 方式二:通过开始时间和结束时间,自定义时间范围,您最长可设置为30天。 单击列表右上角,在“表格设置”弹框中通过选中或取消选中可选列前的单选框,自定义可选列的展示与隐藏。
实例类型默认为“ECS”。选择方式默认采用“手动选择”方式,选择方式的详细说明请参见表2。 图2 添加实例 表2 选择方式说明 选择方式 说明 手动选择 输入搜索条件,在实例列表中通过搜索条件来选取实例,默认按照名称搜索。 过滤条件 输入过滤属性和对应的过滤值,指定过滤条件来选择实例。
容器监控和组件监控的区别在于所监控的对象不同。 组件监控是全量监控,监控对象为通过CCE部署的工作负载、通过ServiceStage创建的应用,或直接在ECS或BMS上部署的组件。 容器监控的对象仅为通过CCE部署的工作负载、通过ServiceStage创建的应用。 组件监控详细操作请参见:组件监控。
通过helm部署pod后,AOM无法查找到对应的工作负载。 原因分析 在CCE控制台的工作负载页面找到通过helm部署的pod记录,然后对比helm部署pod的yaml文件和直接在CCE控制台部署pod的yaml文件,发现helm部署pod的yaml文件中缺少env参数。 图1 两个yaml文件对比