检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
传统ITIL流程中面向基础设施资源的管理方式,易造成各运维服务之间数据割裂、信息不一致等问题。应用资源管理将所有资源对象与应用统一管理,为AOM和LTS、APM等运维服务提供准确、及时、一致的资源配置数据,并通过开放配置数据接口,辅助第三方系统运维场景建设。 注意事项 如需使用“应用资源管理
当您完成了安装ICAgent、配置服务发现规则等基本操作后,可以根据自身的业务需求使用应用运维管理提供的一系列常用实践。 表1 常用最佳实践 实践 描述 阈值告警最佳实践(新版) 告警作为AOM应用运维管理中一项基础功能,在日常运维中发挥着重要作用。AOM告警可以对接华为云租户虚机、组件等数十种指标,
说明 为指标添加创建告警规则 选择指标后,在指标列表右上方单击,可为当前添加的所有指标创建告警规则。 说明: 快捷跳转到“创建告警规则”界面后,“告警规则设置”和“告警规则详情”相关信息会自动选择为跳转前“指标浏览”界面的配置。 删除指标 在需要删除的指标项后单击。 添加指标图表到仪表盘
Prometheus实例 for ECS ECS Prometheus实例类型,适合需要在华为云的虚拟私有云VPC内(通常为弹性云服务器ECS 集群)运行Prometheus监控的场景,可以通过接入中心添加Prometheus中间件监控。 创建ECS Prometheus实例 登录AOM
1.0原有功能,结合用户常用的应用监控,增加了多种指标和日志数据的采集与监控,并对监控结果可视化呈现。同时,通过自动化运维功能将日常运维操作服务化、自动化,减少运维人员重复性操作。 本章节主要对比AOM 2.0与AOM 1.0版本的功能特性。 表1 AOM 2.0与AOM 1.0版本的功能特性对比
代理区域管理 为解决多云之间网络互通,需要在华为云购买和配置ECS主机为代理机,同时代理机上需要绑定公网IP,AOM通过该代理机下发部署控制命令到远程主机,运维数据也将经过该代理机至AOM。代理区是由多个代理机组成,主要是考虑代理机高可用。 代理区域 代理机 父主题: 采集设置
该指标用于统计主机本地时间与NTP服务器时间的偏移量,NTP偏移量越接近于0,主机本地时间与NTP服务器时间越接近。 - 毫秒(ms) aom_node_ntp_server_status NTP服务器状态 该指标用于统计主机是否成功连接上NTP服务器。 0、1 0表示已连接 1表示未连接
对权限最小化的安全管控要求。 策略:IAM最新提供的一种细粒度授权的能力,可以精确到具体服务的操作、资源以及请求条件等。基于策略的授权是一种更加灵活的授权方式,能够满足企业对权限最小化的安全管控要求。例如:针对ECS服务,管理员能够控制IAM用户仅能对某一类云服务器资源进行指定的
云审计服务支持的AOM操作列表 AOM为运维人员提供一站式立体运维平台,实时监控应用、资源运行状态,通过数十种指标、告警与日志关联分析,快速锁定问题根源,保障业务顺畅运行。 AOM作为应用运维环境的多层次一站式运维监控平台,可以实现对云主机、 存储、网络、WEB容器、docker
1个仪表盘中最多可添加20个图表。 仪表盘中图表可选资源、阈值规则、组件或主机的个数 1个曲线图中最多可添加100个资源,且资源可跨集群选择。 1个数字图最多可添加12个资源,只能展示1个资源,默认展示第一个资源。 1个阈值状态图表最多可添加10个阈值规则。 1个主机状态图表最多可添加10个主机。
题。 基于关键性能指标对比,优化应用性能。 根据指标变化趋势配置告警,及时了解异常。 容器运维场景 业务痛点 Prometheus是容器场景的最佳监控工具,但自建Prometheus对于运维人力有限的中小型企业而言,成本太高。对于业务发展快速的大企业又容易出现性能瓶颈。因而使用云
获取Prometheus实例的服务地址 在default、ECS、CCE、通用实例类型的Prometheus实例的“设置”页签下“服务地址”区域,可以获取当前Prometheus实例的Remote Read和Remote Write Prometheus配置代码。在云服务、多账号
式:Excel导入安装、手动安装和远程安装。 您可以按照您的实际场景进行选择。 表1 安装方式 方式 适用场景 手动安装 首次安装UniAgent时,必须使用手动安装方式。 远程安装 必须有可用的安装机,才可进行远程安装。 说明: 安装机是远程安装方式下命令的执行机。 Excel导入安装
也被大家日渐关心,由于SAP系统都是企业内的核心业务系统,仅仅IAAS监控难再满足业务的需求,IT运维也日渐趋向于以应用为中心,需要结合SAP应用监控(数据库和中间件),来确保服务器与应用的正常健康运行,进而保证关键业务系统的高可用性和性能。 该方案构建云上的SAP应用监控系统,提供了如下几种应用监控特性:
服务指标及其维度 服务指标是由实例指标汇聚而来的,其指标维度与实例指标维度相同。 实例指标详见:实例指标及其维度。 父主题: 指标总览
Failed 未满足前提条件,服务器未满足请求者在请求中设置的其中一个前提条件。 413 Request Entity Too Large 由于请求的实体过大,服务器无法处理,因此拒绝请求。为防止客户端的连续请求,服务器可能会关闭连接。如果只是服务器暂时无法处理,则会包含一个Retry-After的响应信息。
创建告警规则数 仅支持1000。 默认3000+,最多支持10000+。 告警模板可添加告警规则数 仅支持50。 支持添加20+云服务,每个云服务支持添加100+告警规则。 历史告警保存时间 7天。 1年。 单次创建告警规则可选择的被监控对象数 5000 不限制,支持全部资源、正则匹配、精准匹配。
前提条件 已购买弹性云服务器ECS。 操作步骤 安装并启动Prometheus,具体操作请参见Prometheus官方文档。 添加AccessCode。 登录AOM控制台,在左侧导航栏中选择“配置管理 > 接入管理”。 单击“添加AccessCode”。 图1 添加AccessCode
容器监控和组件监控的区别在于所监控的对象不同。 组件监控是全量监控,监控对象为通过CCE部署的工作负载、通过ServiceStage创建的应用,或直接在ECS或BMS上部署的组件。 容器监控的对象仅为通过CCE部署的工作负载、通过ServiceStage创建的应用。 组件监控详细操作请参见:组件监控。