检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
左侧导航栏选择“接入中心”,单击“Prometheus 中间件”面板的“HAProxy”卡片。 在配置页面中,参考下表配置相关参数信息,并单击“下一步”。 图1 配置采集任务 表1 采集任务参数配置表 操作 参数 说明 选择实例 Prometheus实例 选择一个ECS Prometheus实例用于存储采集数据。
服务韧性 AOM服务提供了多种可靠性容灾能力,可以通过AZ内实例容灾、多AZ容灾、多集群容灾、数据多副本等技术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。
入门实践 当您完成了安装ICAgent、配置服务发现规则等基本操作后,可以根据自身的业务需求使用应用运维管理提供的一系列常用实践。 表1 常用最佳实践 实践 描述 阈值告警最佳实践(新版) 告警作为AOM应用运维管理中一项基础功能,在日常运维中发挥着重要作用。AOM告警可以对接华
登录AOM 2.0控制台。 在左侧导航栏选择“应用洞察(日落) > 应用资源管理”,进入“应用资源管理”界面。 在菜单栏的“全部企业项目”的下拉列表中,选择企业项目。 图2 企业项目 父主题: 应用资源管理
用户开通云审计服务并创建和配置追踪器后,CTS可记录AOM的管理事件用于审计。 CTS的详细介绍和开通配置方法,请参见CTS快速入门。 CTS支持追踪的AOM管理事件列表,请参见审计。 图1 云审计服务 日志 AOM支持采集容器服务日志和虚机(这里的虚机指操作系统为Linux的弹性云服务器或裸金属服务器)日志
用户开通云审计服务并创建和配置追踪器后,CTS可记录AOM的管理事件用于审计。 CTS的详细介绍和开通配置方法,请参见CTS快速入门。 CTS支持追踪的AOM管理事件列表,请参见审计。 图1 云审计服务 日志 AOM支持采集容器服务日志和虚机(这里的虚机指操作系统为Linux的弹性云服务器或裸金属服务器)日志
据采集和数据存储分析的逻辑单元。根据Prometheus监控的对象和使用场景,Prometheus实例可以分为以下几种类型,具体请参见表1。 表1 Prometheus实例说明 Prometheus实例类型 监控对象 监控能力 应用场景 default 通过添加监控数据API上报的指标。
total 写入花费的总时长 node_nf_conntrack_entries 链接状态跟踪表分配的数量 node_nf_conntrack_entries_limit 链接状态跟踪表总量 node_processes_max_processes PID限制值 node_processes_pids
等待大约两分钟后,您可在左侧导航栏中选择“进程监控 > 组件监控”,找到已被监控的组件。 更多应用发现规则操作 应用发现规则添加完成后,您还可以执行表2中的操作。 表2 相关操作 操作 说明 查看规则详情 在“名称”列单击规则的名称。 启、停规则 单击“操作”列的“启用”。 单击“操作”列的“停用
系统运维场景建设。 注意事项 如需使用“应用资源管理”功能,需提前在“菜单开关”中开启应用洞察的开关,详细操作请参见菜单开关。 功能说明 表1 功能说明 类别 说明 首页 提供应用、主机等资源的检索功能,支持通过关键字、名称等方式快速检索资源。 应用管理 用于管理云服务对象与应用之间的关系,层次结构遵循应“应用
在左侧导航栏中选择“作业管理”,单击右上角的“新建作业”。 设置“添加全局参数”,创建参数类型为“字符串”的参数 param1, 创建参数类型为“主机列表”的参数param2,并保存。 创建作业步骤,如创建脚本执行步骤时,可在“脚本参数”中通过 ${param1} 引用字符串参数,可在选择“目
6小时等,您可根据实际需要选择不同的时间粒度。 方式二:通过开始时间和结束时间,自定义时间范围。 在过滤器上方的下拉列表中选择需要查看的应用。 单击事件卡片或列表进入该事件详情页面,查看事件的根因分析。 各异常事件的根因分析 应用服务整体平均响应时间突增:基于应用的调用链数据,针
接入管理”,其他区域菜单路径为“日志分析 > 日志接入”。 如果需要在AOM控制台中使用LTS的功能,需要提前获取LTS的相关权限,详情请参见LTS权限管理。 表1 功能说明 功能名称 功能说明 AOM 2.0控制台入口 LTS控制台入口 参考文档链接 接入管理 接入管理功能支持ICAgent采集、云
等告警降噪策略,结合告警通知和订阅等功能,帮助用户从容应对海量告警风暴,快速检测和修复业务告警。 统一可视化 支持对多种数据源,在同一个仪表盘中统一监控与分析,并以折线图、数字图等形式多样化、可视化呈现,帮助用户快速监控资源、及时获取数据发展趋势和制定决策。
方式请参见创建分组规则、创建抑制规则和创建静默规则。 图1 告警降噪流程图 此模块只作用于消息通知部分,所有触发的告警和事件都可在“告警列表”页面查看。 告警降噪中所有的规则条件均取自告警结构体中的"metadata"字段,可采用系统默认字段,也可根据需要自定义字段。 {
CPU使用率metric_name可以在主机指标中查看,集群ID和节点ID各自对应的name可以在主机指标-维度中查看,namespace可以在表4 QuerySeriesOptionParam中查看。 查询时间序列 接口相关信息 URI格式:POST /v2/{project_id}/series
需配置应用发现规则。 配置日志采集路径(可选) 如果您需使用AOM监控主机的日志,则需配置日志采集路径。 运维(可选) 您可使用AOM的仪表盘、告警通知等功能进行日常运维。
2.0控制台界面操作,也可登录LTS控制台界面操作。 需要先购买云日志服务的相关功能,才可以使用AOM 2.0控制台中“主机组管理”功能。 表1 功能说明 功能名称 功能说明 AOM 2.0控制台入口 LTS控制台入口 参考文档链接 主机组管理 主机组是为了便于分类管理、提升配置多
产品优势 表1 产品优势 开箱即用 一键安装部署即可监控Kubernetes以及各类云产品。 一键接入各种应用组件及告警工具。 低成本 多种指标免费用,覆盖Kubernetes标准组件。 提供全托管式服务,无需另购资源,可降低监控成本,且维护成本几乎为零。 与CCE集成并提供监控
在调用接口时,部分URI中需要填入用户名称、用户ID、项目名称、项目ID,在“我的凭证”页面可以获取这些信息。 登录控制台。 单击右上角已登录的用户名,在下拉列表中单击“我的凭证”。 在“API凭证”界面,可以查看用户名称、账号ID、项目名称、项目ID。 调用API获取项目ID 项目ID还可通过调用查询指定条件下的项目信息API获取。