检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
会同步迁移。 启、停阈值规则 单击“操作”列的“启用”或“停用”。 说明: 单条阈值规则不支持启、停操作。 搜索阈值规则 支持规则名称、描述和指标名称搜索,可在右上角的搜索框中输入关键字,单击后显示匹配对象。 查看告警 在已设的连续周期内,当某个资源的指标数据满足阈值条件时,产生一条阈值告警。
配置的关键词周期性地进行统计,并生成指标数据,以便您实时了解系统性能及业务等信息。 目前对于华北-北京一、华东-上海二和华南-广州区域,统计规则支持关键词统计和SQL统计。两者的区别在于统计对象不同。关键词统计的对象为原始日志;SQL统计的对象为结构化后的日志,且只有返回单个数值
按需版分为按量后付费和预付费套餐包(其中预付费套餐包又分为专业版套餐包和企业版套餐包),计费详见AOM-价格说明。 AOM与其他云服务组合使用,为您提供通知发送、日志转储、性能管理等功能,这些功能可能产生额外费用,具体费用由提供该功能的云服务结算。 阈值规则和告警通知:依赖消息通
Cluster-Id 集群ID 必选 - Namespace 命名空间 必选 - Deployment-Name 应用名称 必选 - 请求参数 请求参数如表3所示。 表3 请求参数 参数名称 参数类型 描述 max_instances Integer 最大实例个数 min_instances Integer
了解更多常见问题、案例和解决方案 常见使用问题 如何区分告警和事件? 怎样查看AOM中的日志是通过哪个应用产生的? 如何区分Prometheus监控功能采集的基础指标和自定义指标数据? ICAgent和UniAgent是同一个插件吗? ECS主机上执行UniAgent安装命令,下载安装脚本失败
例如,手动刷新、1分钟等。 查看该Prometheus实例上报的基础指标和自定义指标数量。 自定义指标上报量:自定义指标的24H上报量和所选时间范围内累计上报量。 基础指标上报量:基础指标的24H上报量和所选时间范围内累计上报量。 自定义指标数量:所选时间范围内累计上报的自定义指标的种类。
人员定位故障,降低运维成本。APM提供了用户体验管理、分布式性能追踪、事务分析等能力,可以帮助运维人员快速解决应用在分布式架构下的问题定位和性能瓶颈等难题,为用户体验保驾护航。 AOM提供基础运维能力,APM是对AOM运维能力的补充。AOM界面集成了APM,可通过AOM界面统一运
CCE集群的指标管理配置完成后,您还可以执行表1中的操作。 表1 相关操作 操作 说明 查看指标管理 在列表中,可查看名称、标签、命名空间、配置方式等信息,并支持按集群名称、命名空间或配置方式筛选查看。 单击“操作”列的,在弹出的对话框中查看ServiceMonitor或PodMonitor采集规则详情。
0控制台。 在左侧导航栏选择“Prometheus监控 > 实例列表”。 在Prometheus实例列表中,单击目标Prometheus实例的名称,进入该实例的详情界面。 在左侧导航栏单击“指标管理”,在“指标”页签下即可查看当前Prometheus实例所有指标的指标名、指标类型等信息。
查询接收的参数,版本管理时,name为脚本名称(版本管理查询时name不能为空),脚本管理页面查询时,name为接收模糊查询的参数,name是null,表示查询所有默认脚本。 最小长度:0 最大长度:128 is_default 否 String 查询规则,如果是类型为default,则为模糊查询和脚本管理主页展示,no_default为版本管理。
如果20s后未探测到符合条件的进程,您需要修改发现规则后继续探测;如果探测到符合的进程,将可进入下一步的操作,否则不能进入后续操作。 设置应用名称及组件名称。 设置应用名称。 在“应用名称设置”下单击“添加命名项”,为已发现的进程设置应用名。长度范围1到255个字符。 若您未设置应用名,则应用名默认为un
) 该指标用于统计测试对象出方向和入方向的网络流速之和。 ≥0 字节/秒(Byte/s) 表2 网络指标维度 维度 说明 clusterId 集群ID。 hostID 主机ID。 nameSpace 集群的命名空间。 netDevice 网卡名称。 nodeIP 主机IP。 nodeName
查询时序数据 场景描述 本章以查询一个节点的CPU使用率时序数据为例。 涉及的基本信息 查询时序数据前,需要确定节点的ID和集群ID的值,节点ID值可以在ECS的dimensions中查看,集群ID值可以在CCE的“集群管理”页面,基本信息的dimensions中查看。 因指标格式
消息通知模板名称。 project_id String 消息通知模板所属项目id。 source String 消息通知模板来源。 templates String 消息通知模板内容。 消息通知模板内容为json字符串,具体内容是由下列参数拼接成json数组后转义而来。 名称 是否必选
请求参数如表3 表3 请求参数 参数名称 是否必选 参数类型 取值范围 描述 id 是 String - 策略ID name 是 String 策略名称必须为以0~9、a~z、A~Z、下划线(_)或中划线(-)组成的1~64位字符串,且必须以字母开头。 策略名称(不支持修改) policy_type
取值满足表达式[a-zA-Z_:][a-zA-Z0-9_:]*。首字符必须以字母、下划线或冒号开头。其他字符为字母、数字下划线、冒号。长度为1~255个字符。 指标名称,此参数在后台将以添加阈值规则时传入的值保存,此处传入的值不能将其修改。 period 是 Integer - 统计周期 alarmLevel
服务ID。 appName 服务名称。 clusterId 集群ID。 clusterName 集群名称。 containerID 容器ID。 containerName 容器名称。 deploymentName k8s Deployment名称。 kind 应用类型。 nameSpace
对用户所有的各类云服务进行统一管理。可全局查看所有的云服务资源对象与应用的关联关系,包括未绑定应用的云资源,便于用户对资源进行分析和管理。 环境标签 根据实际的使用场景,为已创建的应用环境添加标签,便于用户快速过滤和查找相同属性的应用环境。 企业项目 华为云企业项目,一个项目可以包含一个或者多个应用。 基本概念
统一数据采集Agent,完成统一插件生命周期管理,并为AOM提供指令下发,如脚本下发和执行。它自身不提供数据采集能力,运维由不同的插件分工采集,插件按需安装、升级和卸载。后续逐步上线其它插件(如云监控和主机安全),统一规范管理。 AK/SK 访问密钥。通过提供租户级别的AK/SK来安装ICAgent,以便于采集日志数据。
服务韧性 AOM服务提供了多种可靠性容灾能力,可以通过AZ内实例容灾、多AZ容灾、多集群容灾、数据多副本等技术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。