检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
UniAgent和ICAgent安装类常见问题 UniAgent安装机和目标机器网络不通,报错提示“[warn] ssh connect failed, 1.2.1.2:22”如何解决? 答:安装之前先在安装页面单击连接测试,选择网络能通的安装机。 UniAgent安装成功后,后
告警规则详情填写说明 参数名称 参数说明 多指标 按设置的多个指标数据和对应告警条件进行计算,有两种计算方式: 满足以下“全部”指标判断条件时,触发告警。 满足以下“任意”指标判断条件时,触发告警。 指标 需要监控的指标。通过“全量指标”方式选择指标时,仅支持英文展示和英文搜索。 单击“指标”文
通过AstroCanvast自定义AOM监控数据大屏 运维可观测大屏是基于华为云Astro低代码平台开发的面向不同场景、角色的运维监控大屏,基于现网质量、服务韧性、评估优化等N大主题域,通过运维数据建模、可视化等数据分析能力,提供企业级运维沙盘。满足您全场景、自动化、可量化、可观
连续多少个周期满足阈值条件后,发送阈值告警。 统计方式 指标数据按照所设置的统计方式进行聚合,包括:平均值、最小值、最大值、总计、样本个数。 阈值条件 阈值告警的触发条件,由判断条件(≥、≤、>、<)和阈值组成。例如,阈值条件设置为“>85”,表示指标的实际值大于已设置的阈值85时,生成阈值告警。 将光标移动至告警
指标的详细设置由统计周期、条件、检测规则、触发条件以及告警级别组成。指标告警的检测规则,由统计方式(平均值、最小值、最大值、总计、样本个数)、判断条件(>=、<=、>、<)和阈值组成。例如,统计周期为“1分钟”,检测规则设置为“平均值>1”,触发条件为连续周期“3”,告警级别为“紧急
选择资源 定义阈值:选择待监控的指标,设置阈值条件、连续周期、告警级别、统计方式等参数,选择是否发送通知。 阈值条件:阈值告警的触发条件,由判断条件(>=、<=、>、<)和阈值组成。例如,阈值条件设置为“>85”,表示指标的实际值大于已设置的阈值85时,生成阈值告警。 连续周期:连
通过AOM监控主机 主机包括弹性云服务器(ECS)、裸金属服务器(BMS)。AOM既可监控通过创建CCE、ServiceStage集群时购买的主机,也可监控非CCE、ServiceStage集群环境下购买的主机(购买的主机操作系统需满足操作系统及版本,且购买后需要给主机安装ICA
在该弹性云服务器上,根据Uniagent安装指导,使用手动安装方式安装Uniagent。安装后可以在界面上查看Uniagent的状态,判断是否安装成功。 Uniagent安装成功后,在该弹性云服务器上执行下面的指令: sc stop uniagentdservice && del
应用层接入AOM AOM作为华为云服务可观测性分析统一入口,提供接入中心,支持将应用层组件的调用链接入APM,来监控应用相关的性能图表或接口性能指标等。例如:请求平均时延、错误调用次数、请求吞吐量等。 配置应用层接入AOM 登录AOM 2.0控制台。 在左侧导航栏中选择“接入 >
主机指标及其维度 表1 主机指标 指标名称 指标含义 取值范围 单位 CPU内核总量(aom_node_cpu_limit_core) 该指标用于统计测量对象申请的CPU核总量。 ≥1 核(Core) CPU内核占用(aom_node_cpu_used_core) 该指标用于统计测量对象已经使用的CPU核个数。
统计周期。单位为秒,例如 1小时 填“3600”,当trigger_type为“immediately”时 不填。 operator 否 String 判断条件:“>”,“<”,“=”,“>=”,“<=”,当trigger_type为“immediately”时 不填。 thresholds 否
选择资源 定义阈值:选择待监控的指标,设置阈值条件、连续周期、告警级别、统计方式等参数,选择是否发送通知。 阈值条件:阈值告警的触发条件,由判断条件(>=、<=、>、<)和阈值组成。例如,阈值条件设置为“>85”,表示指标的实际值大于已设置的阈值85时,生成阈值告警。 连续周期:连
配置数据多写实现监控指标转储到自建Prometheus 通过数据多写功能,可以实现跨VPC的访问,而不必暴露服务端相关的网络信息,以更加安全、可靠的方式将监控数据上报到自建Prometheus中。 前提条件 服务已接入可观测Prometheus 监控。具体操作,请参见:管理Prometheus实例。
普罗语句说明 AOM对接了PromQL(Prometheus Query Language)语言,该语言内置了丰富的函数,用户可使用该内置函数对指标数据筛选和聚合。 按普罗语句添加指标时,用户可通过普罗语句自定义汇聚指标。 普罗语句语法 普罗语句语法详情可登录prometheus官网查看。
然后将分组后的指标按平均值运算并展示在当前图表中。 检测规则 指标告警的检测规则,由统计方式(平均值、最小值、最大值、总计、样本个数)、判断条件(≥、≤、>、<)和阈值组成。例如,检测规则设置为“平均值>10”,表示指标的平均值大于已设置的阈值10时,生成指标告警。 触发条件
下发批量安装UniAgent任务 功能介绍 该接口用于下发批量安装UniAgent任务。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/uniagent-console/mainview/batch-import 表1 路径参数 参数 是否必选
通过AOM监控集群 集群监控的对象为通过CCE部署的集群。“集群监控”页面可实时监控集群的多项基础监控指标(例如集群状态、CPU使用率、内存使用率、节点运行状态等)和相关的告警、事件数据,通过这些指标和相关的告警信息,用户可实时了解集群的运行状况,及时处理潜在风险,保障集群稳定运行。
连续多少个周期满足阈值条件后,发送阈值告警。 统计方式 指标数据按照所设置的统计方式进行聚合,包括:平均值、最小值、最大值、总计、样本个数。 阈值条件 阈值告警的触发条件,由判断条件(>=、<=、>、<)和阈值组成。例如,阈值条件设置为“>85”,表示指标的实际值大于已设置的阈值85时,生成阈值告警。 将光标移动至
查询指标 功能介绍 该接口用于查询系统当前可监控的指标列表,可以指定指标命名空间、指标名称、维度、所属资源的编号(格式为:resType_resId),分页查询的起始位置和返回的最大记录条数。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/ams/metrics
第三方云厂商或互联网数据中心自建Prometheus对接到AOM Prometheus实例 应用场景 云上用户经常会遇到多云或者跨region采集自建Prometheus指标数据场景。典型场景例如:将者第三方云厂商或互联网数据中心(Internet Data Center,以下简