检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
手动接入Agent AOM提供应用接入功能,通过快速接入Agent,实现数据的自定义接入。 前提条件 部署APM Agent时,必须确保接入APM的机器与APM服务网络连通,Agent才能正常工作。 可使用Telnet命令测试目标机器与APM服务器网络是否连通。例如,以检查华北-
每周:在周几的某个固定时间点检查一次查询和分析结果。 固定间隔:按照固定间隔检查查询和分析结果。 说明: 检查频率可以选择设置为固定间隔15秒或30秒以实现秒级监控。指标告警的时效性取决于指标上报周期、规则检查频率及通知发送耗时。 例如,指标上报周期为5秒,规则检查频率设置为固定间隔30秒,通
5表示未高效利用GPU,大于0.8是必要的。 假设一个GPU有N个SM: 一个核函数在整个时间间隔内使用N个线程块运行在所有的SM上,此时该值为1(100%)。 一个核函数在一个时间间隔内运行N/5个线程块,此时该值为0.2。 一个核函数使用N个线程块,在一个时间间隔内,仅运行了1/5个周期的时间,此时该值为0
理完成后再发送通知,避免产生告警风暴。 告警降噪功能分为分组、去重、抑制、静默四部分。 去重为内置策略,服务后台会自动检验告警内容是否一致实现去重的效果,用户无需手动创建规则。 分组、抑制、静默需手动创建规则,具体的创建方式请参见创建分组规则、创建抑制规则和创建静默规则。 图1 告警降噪流程图
2.0控制台。 在左侧导航栏中选择“基础设施监控 > 进程监控”,进入应用监控界面,查看应用列表。 在应用列表上方搜索框中设置过滤条件,可以实现应用列表过滤显示。 在页面右上角单击,通过选中/取消选中各展示项后的复选框,自定义列表项的展示/隐藏。 在页面右上角单击,根据需要在下拉列表中设置应用信息的统计条件。
效率。 图1 AOM产品结构图 托管&运行态 AOM可无缝对接多个上层运维服务,支持快速从应用管理与运维平台(ServiceStage)、函数工作流(FunctionGraph)和微服务引擎(Cloud Service Engine,CSE)等上层运维服务采集指标数据并实时、可视化呈现。
轴名称、Y轴名称及显示数值等,配置参数的说明具体请参见日志数据类图表。 交互模式 指标 统计函数作用于选定的字段,计算出你想要的指标。可在下拉列表中选择,包括:日志条数、聚合统计、估算函数。 日志条数:日志条数 count(*)、字段值非空的条数、字段值非零的条数、不同字段值的条数
本执行、文件分发、云服务变更等原子操作功能,支持自定义编排原子操作并组装成作业和标准化运维流程。自动化运维将日常运维操作沉淀并发布成服务,实现日常变更的标准化、自动化、无差异化运维,将运维工作从日常重复繁杂的应用变更操作中解脱出来,提升运维操作的质量和效率,帮助企业运维转型和运维价值提升。
统。AOM并非传统监控,它通过应用的角度看业务,满足企业对业务的高效和快速迭代的需求,可帮助企业实现 IT 对业务的有效支撑,保护、优化IT资产投资,使企业更好的达到其战略目标并实现IT资产价值的最大化。通过云审计服务,您可以记录与AOM服务相关的操作事件,便于日后的查询、审计和回溯。
图1 查看告警规则 表1 告警规则相关操作 操作 说明 过滤显示告警规则 在规则列表的列表项支持按规则名称、类型、状态等设置筛选条件,实现告警规则过滤显示。 刷新告警规则 在规则列表右上角单击,可实时获取所有告警规则的最新信息。 自定义列表项 在规则列表右上角单击,通过选中/
统。AOM并非传统监控,它通过应用的角度看业务,满足企业对业务的高效和快速迭代的需求,可帮助企业实现 IT 对业务的有效支撑,保护、优化IT资产投资,使企业更好的达到其战略目标并实现IT资产价值的最大化。通过云审计服务,您可以记录与AOM服务相关的操作事件,便于日后的查询、审计和回溯。
索条件,实现进程过滤显示。 单击右上角的,可获取到设置的时间范围内进程的最新信息。 在CCE主机的“Pod实例”页签下,可查看实例状态、节点IP等信息。 单击实例名称,可逐层下钻查看该实例的容器、进程的详细信息。 在实例列表右上角的搜索框可按实例名称等设置搜索条件,实现实例过滤显示。
什么是应用运维管理 运维遇到挑战 随着容器技术的普及,越来越多的企业通过微服务框架开发应用,业务实现更多使用云上服务,运维也转向云上的运维服务。对于云上应用的运维也提出了新的挑战。 图1 运维现有问题 运维人员技能要求高,配置繁杂,同时需要维护多套系统。对于分布式追踪系统,学习和使用成本高,并且稳定性差。
业海量运维的自动化能力和效率。 托管&运行态:AOM可无缝对接多个上层运维服务,支持快速从应用管理与运维平台(ServiceStage)、函数工作流(FunctionGraph)和微服务引擎(Cloud Service Engine,CSE)等上层运维服务采集指标数据并实时、可视化呈现。
添加AccessCode 每个项目最多可创建2个AccessCode。 AccessCode是调用API的身份凭据,请您妥善保管。 在弹出的窗口,单击“确定”,添加AccessCode。 添加成功后,单击即可查看AccessCode。也可单击“删除”,删除AccessCode(删除后无法恢复,请谨慎操作)。
静态文件配置和动态发现机制发现监控对象,实现轻松迁移及接入。 数据规模无上限 凭借云存储能力,数据存储无上限,不再受限于本地容量。云端分布式存储保障数据可靠性。 通过Prometheus实例 for 多账号聚合实例将多个资源账号的指标数据汇聚到一个Prometheus实例,实现统一监控。 高性能 相
负责自动发现采集目标、采集指标和远程写到其他库。 PromQL Prometheus监控的查询语言。支持瞬时查询和时间跨度查询,内置多种函数和操作符。可以对原始数据进行聚合、切片、预测和联合。 Sample 一条时间线在某个时间点对应的数值。在Prometheus监控服务中,每
在左侧导航栏中选择“主机监控”,查看主机列表。 为了方便您查看主机列表,您可以: 单击右上角图标对主机列表进行过滤显示,实现隐藏控制节点。 可以在主机列表上方设置过滤条件,实现主机列表过滤显示。 您可根据需要选择是否对主机执行如下操作: 添加别名 当主机名称过于复杂不便于识别时,您可根据需要给主机添加一个便于识别的别名。
智能运维,提供智能阈值机制,基于机器学习动态阈值告警,提升监控效率。 端侧分析,支持移动APP和Browser性能指标分析和崩溃分析等,实现应用全端掌控。 事务洞察,支持自动发现事务性能问题,智能筛选,完成根因探究。 中间件监控,无需额外安装其他插件,即可在AOM界面监控关系型
在ECS桌面单击“复制粘贴”,使用快捷键“Ctrl+V”将3中已复制的ICAgent安装命令粘贴至窗口中并单击“发送”,将复制的ICAgent安装命令发送至命令行窗口,如下图所示。然后在命令行窗口输入回车,执行ICAgent安装命令。 图2 复制粘贴按钮 图3 粘贴并发送安装命令 当显示“ICAgent