检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
随着容器技术的普及,越来越多的企业通过微服务框架开发应用,业务实现更多使用云上服务,运维也转向云上的运维服务。对于云上应用的运维也提出了新的挑战。 图1 运维现有问题 运维人员技能要求高,配置繁杂,同时需要维护多套系统。对于分布式追踪系统,学习和使用成本高,并且稳定性差。 云化场景下
选择已创建的代理区域。 qwsertyddfsdfdf 主机 选择已安装的UniAgent主机。 - 代理IP 配置代理机的IP地址 - 端口 端口号,必须小于或等于65535 - 单击“确认”,完成代理机添加。 修改代理IP 代理机创建完成后,可根据需要修改代理机的IP地址。具体操作如下:
Exporter对应的Path的值,默认/metrics port: metric-port # 填写 Prometheus Exporter 对应的 YAML 的 ports的name selector: # 填写要监控Exporter Pod的Label标签,以定位目标Exporter
es等应用运行环境的深入监控并进行集中统一的可视化管理,能够有效预防问题的产生及快速帮助应用运维人员定位故障,降低运维成本。同时,AOM开放统一API,支撑对接自研监控系统或者报表系统。AOM并非传统监控,它通过应用的角度看业务,满足企业对业务的高效和快速迭代的需求,可帮助企业实现
Exporter对应的Path的值,默认/metrics port: metric-port # 填写 Prometheus Exporter 对应的 YAML 的 ports的name selector: # 填写要监控Exporter Pod的Label标签,以定位目标Exporter
} 更多编程语言的SDK代码示例,请参见API Explorer的代码示例页签,可生成自动对应的SDK代码示例。 状态码 状态码 描述 200 OK 请求响应成功。 500 InternalServerError 表明服务端能被请求访问到,但是不能理解用户的请求。 错误码 请参见错误码。
作用。用户被授予的策略中,一个授权项的作用如果同时存在Allow和Deny,则遵循Deny优先。 如果您给用户授予AOM FullAccess的系统策略,但不希望用户拥有AOM FullAccess中定义的删除应用发现规则权限,您可以创建一条拒绝删除应用发现规则的自定义策略,然后同时将AOM
作用。用户被授予的策略中,一个授权项的作用如果同时存在Allow和Deny,则遵循Deny优先。 如果您给用户授予AOM FullAccess的系统策略,但不希望用户拥有AOM FullAccess中定义的删除应用发现规则权限,您可以创建一条拒绝删除应用发现规则的自定义策略,然后同时将AOM
单击“安装ICAgent”,主机类型选择“华为云主机”,安装方式选择“获取AK/SK凭证”。 单击“复制命令”复制安装命令。 通过ECS控制台提供的远程登录方式登录ECS。 登录ECS控制台,在“弹性云服务器”界面的列表中单击ECS所在行“操作”列的“远程登录”,根据界面提示以root用户登录ECS。
onsole/upgrade/batch-upgrade aom:uniagentAgent:upgrade √ x 查询UniAgent主机列表信息 POST /v1/uniagent-console/agent-list/all aom:uniagentAgent:list √
误率突增的原因。 图4 TopN接口错误率突增 应用服务整体流量不均:基于应用下所有实例的流量数据,展示应用下最大流量和最小流量实例的流量和时延数据,并展示应用下流量Top5的接口在最大流量和最小流量实例上的分布,快速定位受影响接口。单击所展示的接口,可详细追踪接口近期的调用情况。
应用是您根据业务需要,对相同或者相近业务的一组组件进行逻辑划分。应用的类型包括系统应用和自定义应用。应用的类型包括系统应用和自定义应用,通过内置发现规则发现的是系统应用,通过自定义规则发现的是自定义应用。 在AOM的应用发现界面配置应用发现规则,可自动发现符合规则的应用并监控相关指标,详情请参考配置应用发现规则。
单击告警条件后的,可将对应行的指标数据在当前图表中隐藏。 单击告警条件后的,可将对应行的指标数据和告警条件转换为Prometheus命令。 单击告警条件后的,可快速复制对应行的指标数据及告警条件等信息,并根据需要修改。 单击告警条件后的,可删除对应行指标数据的监控。 图1 设置告警规则详情
HTTP协议标准报头。包含了服务器用来处理请求的软件信息。 Apache Content-Length HTTP协议标准报头。用于指明实体正文的长度,以字节方式存储的十进制数字来表示。 xxx Content-Type HTTP协议标准报头。用于指明发送给接收者的实体正文的媒体类型。 application/json
AOM通过多种方式监控安全风险,保障数据安全可靠,具体请参见表1。 表1 AOM的监控安全风险 监控安全风险 简要说明 详细介绍 资源监控 AOM提供应用监控、组件监控、主机监控、容器监控、指标浏览等功能,支持实时监控您的应用及相关云资源,并将数据可视化展示,帮助用户快速分析应用健康状态。 资源监控使用说明
将Prometheus数据接入到AOM。具体的操作步骤如下: 创建Prometheus实例。 根据需要参考对应的创建操作,具体请参见: Prometheus实例 for ECS Prometheus实例 for CCE Prometheus 通用实例 将原生Prometheus的指标通过Remote
件等多种方式通知客户当前系统存在的问题。 应用发现最佳实践 应用发现是指AOM通过配置的规则发现和收集主机上部署的应用和关联的指标。可在“应用监控”界面和“监控概览”界面查看发现的应用和应用对应的指标数据。
m(上一次查询出的内容中最后一条日志的序列号)、type(取值"next")和size。 2.category、searchKey、keyWord、startTime、endTime等条件需要保持和第一次查询时相同。 3.如果需要继续分页查询,则修改请求参数中的lineNum为上
描述 分组规则的描述。最多不能超过1024个字符。本示例可不填写。 - 分组条件 根据设置的条件对告警过滤,筛选出符合分组条件的告警,并为符合分组条件的告警设置告警行动规则。 告警级别:指标或事件告警的级别,可以设置为:紧急、重要、次要、提示。 告警源:触发告警或事件的服务名称。可以设置为AOM
资源对应一个规则,可使用独立的规则对某个资源进行监控。 如下图所示,对于一个单条阈值规则,其监控对象为某个主机,当主机的CPU使用率超过85%时,在告警界面产生阈值告警,可在左侧导航栏中选择“告警> 告警列表”,在告警列表中查看该告警;当主机满足已设的通知策略时,就会发送邮件或短信。