检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在主机组列表,单击待修改的主机组类型为IP的主机组所在行前的。 在主机页签,单击“添加主机”。 在弹出的添加主机页面,主机列表中显示该主机组所选主机类型下所有未选主机,选择需要加入该主机组的主机。 可以通过服务器名称/ID或IP地址对列表进行过滤,也可以单击,并在弹出的搜索框中输入多个主机IP,进行批量搜索。
在主机组列表,单击待修改的主机组类型为IP的主机组所在行前的。 在主机页签,单击“添加主机”。 在弹出的添加主机页面,主机列表中显示该主机组所选主机类型下所有未选主机,选择需要加入该主机组的主机。 可以通过服务器名称/ID或IP地址对列表进行过滤,也可以单击,并在弹出的搜索框中输入多个主机IP,进行批量搜索。
也可单击“保存”,将创建好的任务展现在任务管理页面,方便后续对任务进行执行或其他操作。 更多操作 文件包创建完成后,您可以在文件管理列表单击对应的文件名称进入该文件的详情页面,查看文件包的基本信息、状态、定时运维引用的任务数、标准化运维引用的任务数和版本列表,还可执行表3中的操作。 表3 相关操作
ent状态”为“离线”的问题。 异常 主机ICAgent功能异常,请联系技术人员处理。 可能原因二:AOM不支持监控当前资源类型 修复建议:请检查您的资源是否为AOM监控的类型,AOM当前支持监控的资源类型有:主机、K8s容器、用户进程(AOM不监控主机的系统进程)。 可能原因三:资源被删除或被停止
本文档介绍通过配置统一监控告警,同时监控不同账号下的指标数据。 自定义OS镜像自动接入采集管理器Uniagent 本文档介绍如何在Linux环境和Windows环境下,基于应用运维服务的采集管理器Uniagent进行镜像打包。您可以使用打包的镜像购买新的ECS主机,就可以为该主机自动安装采集管理器Uniagent。
左侧导航栏单击“智能洞察(BETA)”。 在页面右上角设置应用的时间范围,您可以使用AOM预定义的时间标签,例如近1小时、近6小时等,也可以自定义时间范围。 在过滤器上方的下拉列表中选择需要查看的应用。 单击事件卡片或列表进入该事件详情页面,查看事件的故障传播链。 故障传播链将展示调用链中的故障传播图谱,您可通过故障
华为云:负责云服务自身的安全,提供安全的云。华为云的安全责任在于保障其所提供的IaaS、PaaS和SaaS类云服务自身的安全,涵盖华为云数据中心的物理环境设施和运行其上的基础服务、平台服务、应用服务等。这不仅包括华为云基础设施和各项云服务技术的安全功能和性能本身,也包括运维运营安全,以及更广义的安全合规遵从。
配额设置 指标配额可通过切换基础版(受限免费)和按需版(按需计费)来修改。 登录AOM控制台。 选择“配置管理 > 配额设置”。 查看指标配额。 图1 查看配额 当指标超过配额时,时间较早的指标将会被删除。 父主题: 配置管理
示项后的复选框,自定义列表项的展示/隐藏。 在页面右上角单击,根据需要在下拉列表中设置组件信息的统计条件。 设置时间范围,查看已设时间范围内组件。可通过如下两种方式设置时间范围: 方式一:使用AOM预定义好的时间标签,例如,近30分钟、近1小时等,可根据实际需要选择不同的时间粒度。
、数据展示到数据异常告警的全方位、可视化监控服务,实现从上到下、从前端到后端的全栈一体化监控。 关联分析 应用和资源层层自动关联,通过应用、组件、实例、主机和事务等多视角下钻分析指标、日志、告警数据,直击异常。 精准告警 构建指标告警、事件告警、日志告警的统一告警体系,提供分组、
云服务”和“Prometheus for 多账号聚合”的实例上报的基础指标和自定义指标数量。 指标上报量统计周期为1小时,如果设置的查询时间范围小于1小时,可能会导致指标累计上报量查询结果为0。 “资源消耗”页面展示的指标上报量可能与实际指标上报量存在一定误差。 查看Prometheus实例指标上报量 登录AOM
操作 说明 查看桶日志 单击日志桶名称,可直接查看该桶的日志。 修改日志桶 单击“操作”列的“编辑”。 删除日志桶 单击“操作”列的“删除”。 日志桶是AOM对日志文件逻辑上的分组,删除日志桶后,您的日志文件不会被删除。 父主题: 日志管理
开始时间和结束时间。 输入关键词:单击文本框,文本框下面显示了该桶下的所有统计规则及其关键词,可直接单击进行选择,选择后统计规则的关键词会自动输入到文本框中;也可直接在文本框中手动输入关键词。 对于常用的、复杂的关键词,可单击,创建统计规则。在后续查询时,不用再在文本框中手动输入
账号信息,还可执行表2中的操作。 表2 相关操作 操作 说明 编辑账号 单击“操作”列的“编辑”。 删除账号 单击“操作”列的“删除”。 搜索账号 默认按照账号名称搜索。在列表上方的搜索框中输入关键字,单击后在下面任务列表显示匹配对象。 隐藏/显示账号列表的列信息 单击,根据需要
术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。 多AZ容灾 AOM支持跨AZ容灾,当一个AZ异常时,不影响其他AZ下的实例持续提供服务。
术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。 多AZ容灾 AOM支持跨AZ容灾,当一个AZ异常时,不影响其他AZ下的实例持续提供服务。
标准输出配置 通过添加指定采集容器标准输出标签,用户可以指定采集pod下的对应容器名的标准输出日志。用户在pod的yaml中spec:template:metadata:annotations:字段增加以下字段来实现指定要采集的容器名称。 kubernetes.AOM.log.stdout:
通过仪表盘可将不同图表展示到同一个屏幕上,通过不同的仪表形式来展示资源的指标数据或日志数据,帮助用户全面、深入地掌握监控数据。 约束与限制 新版仪表盘功能的图表配置与旧版仪表盘功能的图表配置不相同。 使用旧版仪表盘编辑新版仪表盘中创建的图表时,旧版仪表盘的图表配置无法兼容新版仪表盘的图表配置。 使用新版仪表
容器监控 容器监控和组件监控的区别在于所监控的对象不同。 组件监控是全量监控,监控对象为通过CCE部署的工作负载、通过ServiceStage创建的应用,或直接在ECS或BMS上部署的组件。 容器监控的对象仅为通过CCE部署的工作负载、通过ServiceStage创建的应用。 组件监控详细操作请参见:组件监控。
组件状态图表:实时监控组件的状态。 图5 组件状态图表 资源TopN图表 资源TopN图表的统计单位为集群,统计对象为集群下的资源(这里的资源指主机、组件和实例)。资源TopN图表可视化地展示了集群中资源占用最高的N个资源,支持资源Top5、Top15数据的汇报展示,其中默认展示资源Top5,放大图表后展示资源Top15。