检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
运维遇到挑战 随着容器技术的普及,越来越多的企业通过微服务框架开发应用,业务实现更多使用云上服务,运维也转向云上的运维服务。对于云上应用的运维也提出了新的挑战。 图1 运维现有问题 运维人员技能要求高,配置繁杂,同时需要维护多套系统。对于分布式追踪系统,学习和使用成本高,并且稳定性差。
日志分析 AOM展示的日志是否为实时日志? 怎样查看AOM中的日志是通过哪个应用产生的?
两者均采用(by nodeIP)进行过滤,以使获得的指标值具有相同的指标维度。(仅value不同) 将上述两者获得的指标值进行“/”运算,即可获得pod的内存实际使用率。 pod的内存实际使用率的普罗语句如下所示: sum(aom_container_memory_used_megabyte
号信息,还可执行表2中的操作。 表2 相关操作 操作 说明 编辑账号 单击“操作”列的“编辑”。 删除账号 单击“操作”列的“删除”。 搜索账号 默认按照账号名称搜索。在列表上方的搜索框中输入关键字,单击后在下面任务列表显示匹配对象。 隐藏/显示账号列表的列信息 单击,根据需要勾
在“云服务接入”页面右侧已接入云服务下单击需要取消接入的云服务卡片,在弹出的对话框中单击“取消接入云服务”。 查看/修改已接入的云服务标签配置 在“云服务接入”页面单击已接入云服务下的云服务卡片,即可修改“接入云服务标签(可选)”的相关设置,具体设置请参见表3。 父主题: 接入AOM
账号名称 凭证的账号名称。最多可输入64个字符。 AK 已获取的访问密钥ID,参考获取AK/SK。 SK 已获取的访问密钥,参考获取AK/SK。 描述 凭证的描述信息。 单击“确定”,完成创建。 更多操作 凭证创建完成后,您可以在凭证列表页面查看凭证信息,还可执行表2中的操作。 表2
)组成的格式为XX.XX的3~32位字符串。 指标维度 维度是指标的分类。每个指标都包含用于描述该指标的特定特征,可以将维度理解为这些特征的类别。 系统指标维度:维度是固定不变的,不同类型的指标维度不同,维度信息的详细说明请参见指标维度。 自定义指标维度:维度为1~32位的字符串,需要您自定义。
常见使用问题 没有消息通知服务的访问权限? 资源运行异常怎么办? 如何设置全屏模式在线时长? 日志配额已达到90%或已满怎么办? 如何获取AK/SK? 如何查询服务不可用时间? AOM告警规则状态为什么显示“数据不足”? 正常状态的工作负载,AOM界面显示异常是什么原因? 如何创建委托apm_admin_trust
AOM与CES的云服务监控功能对比 本章节主要对比AOM 2.0的云服务监控与CES的云服务监控功能差异。 AOM的指标数据来源于CES。AOM的指标数据为Prometheus格式,CES为自定义格式。AOM与CES的云服务监控功能对比如表1所示。 表1 AOM的云服务监控与CES的云服务监控功能对比
AOM是一个以资源数据为中心并关联日志、指标、资源、告警和事件等数据的立体运维服务。AOM从架构上主要分为数据采集接入层、传输存储层和业务计算层。 架构图 图1 AOM架构 采用三层架构 数据采集接入层 ICAgent采集数据 给主机安装ICAgent(插件式的数据采集器)并通过ICAgent上报相关的运维数据。
Management,简称AOM)是云上应用的一站式立体化运维管理平台,融合云监控、云日志、应用性能、真实用户体验、后台链接数据等多维度可观测性数据源,提供应用资源统一管理、一站式可观测性分析和自动化运维方案,帮助用户及时发现故障,全面掌握应用、资源及业务的实时运行状况,提升企业海量运维的自动化能力和效率。
告警管理使用说明 告警是指AOM自身或外部服务在异常情况或在可能导致异常情况下上报的信息,并且您需采取相应措施清除故障,否则会由于AOM自身或外部服务的功能异常而引起业务的异常。 告警管理使用前提条件:已在主机安装ICagent,详情请参考安装ICAgent,安装之后使用流程请参见图1。
及对象实时参数。方便开发人员从实时的远程应用程序中获取调试信息,而无需重新启动应用程序,也不会阻止它并导致服务停机。 约束与限制 为了应用运行稳定,强烈建议您按照要求升级JDK版本,在低版本的JDK上使用Debugging诊断功能,存在应用崩溃的风险。 Debugging诊断仅针对白名单用户开放。
资源监控使用说明 满足内置发现规则的服务,安装ICAgent后该服务会自动被发现;对于不满足内置应用发现规则的服务,您则需配置应用发现规则。 资源监控使用说明如下: 图1 资源监控使用说明 父主题: 资源监控
AOM 1.0与AOM 2.0使用对比 具有AOM 1.0的权限后,使用AOM 2.0需要单独授权吗? AOM 2.0采用新计费方式,与AOM 1.0的计费方式不同,所以首次从AOM 1.0切换到AOM 2.0,还需要再单独申请AOM 2.0的操作权限,具体请参见开通AOM 2.0。
错误)。 下面以添加“CPU使用率”的指标图表和“延迟”的日志图表为例说明。 添加“CPU使用率”的指标图表。 选择“CPU使用率”指标,设置完成后,添加的指标图表如图9所示。 图9 添加指标图表 添加“延迟”的日志图表。单击“日志源”,设置日志图表的相关参数。 可直接从图表中获取SQL查询语句:
通过grafana查看AOM中的指标数据 前提条件 已购买弹性云服务器ECS。 已购买弹性公网IP,并绑定到购买的弹性云服务器ECS上,具体操作请参见《弹性公网IP快速入门》。 操作步骤 安装并启动Grafana,具体操作请参见Grafana官方文档。 添加AccessCode。
stub_status模块。 如果未输出任何结果,则可以使用 --with-http_stub_status_module 参数重新配置configure文件,来编译一个Nginx。示例如下: ./configure \ ##在原基础上添加--with-http_stub_status_module参数进行编译。
通过AOM界面您可监控FunctionGraph的基础资源和运行在其上的应用,同时在AOM界面还可查看相关的日志和告警。 智能边缘平台 智能边缘平台(Intelligent EdgeFabric,简称IEF)通过纳管您的边缘节点,提供将云上应用延伸到边缘的能力,联动边缘和云端的数据,满足客户对边缘计算资源的远程管控、
trace和*.out类型的文本日志文件);若配置的为具体某个文件,则直接采集对应文件。指定文件必须为文本文件,不支持其他类型(例如二进制日志文件)的日志文件。 AOM能监控其他云服务商的服务器吗? 可以,您需要先购买一台华为云创建弹性云服务ECS作为跳板机用于监控数据的转发,同时需要在其