检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
2018 /usr/lib/systemd/systemd --switched-root --system --deserialize 20 2 kthreadd Tue Oct 2 21:12:06 2018 [kthreadd] 3 ksoftirqd/0
相关配置请参见通过Profiler分析代码性能。 接口调用 接口调用主要是对外部服务调用当前应用程序进行监控,主要包括URL监控、dubbo服务端监控、cse服务端监控、CSEProvider集群监控、Functiongraph监控等。 相关配置请参见查看组件接口调用监控项。 基础监控 基础监控主
您至少要添加一条检查项,检查项您最多可添加5条。当有多条检查项时,所有检查项同时满足,AOM才能发现进程。 添加检查项完成后,单击“开始探测”,查找符合的进程。 如果20s后未探测到符合条件的进程,您需要修改发现规则后继续探测;如果探测到符合的进程,将可进入下一步的操作,否则不能进入后续操作。 设置应用名称及组件名称。
2018 /usr/lib/systemd/systemd --switched-root --system --deserialize 20 2 kthreadd Tue Oct 2 21:12:06 2018 [kthreadd] 3 ksoftirqd/0
管控要求。例如:针对ECS服务,管理员能够控制IAM用户仅能对某一类云服务器资源进行指定的管理操作。多数细粒度策略以API接口为粒度进行权限拆分,AOM支持的API授权项请参见策略和授权项说明。 如表1所示,包括了AOM的所有系统权限。 表1 AOM系统权限 子服务名称 策略名称
个筛选条件: 事件名称:输入事件的名称。 事件ID:输入事件ID。 资源名称:输入资源的名称,当该事件所涉及的云资源无资源名称或对应的API接口操作不涉及资源名称参数时,该字段为空。 资源ID:输入资源ID,当该资源类型无资源ID或资源创建失败时,该字段为空。 云服务:在下拉框中选择对应的云服务名称。
u/work/xig/debug,则ICAgent不采集/opt/yilu/work/xig/debug中的日志文件。 一个虚机最多可配置20条日志采集路径。 若配置的日志文件的最后修改时间和当前时间的时间差已超过12小时,则不会采集。 同一资源集下的所有ECS主机,无法同时使用
原因。 图2 应用服务整体错误率突增 TopN接口平均响应时间突增:基于应用的调用链数据,针对接口粒度提供调用链响应时间分析,快速定位根因。 图3 TopN接口平均响应时间突增 TopN接口错误率突增:基于应用的调用链数据,针对接口粒度提供调用链错误率分析,快速定位根因。单击“查
TopN接口平均响应时间突增:默认对流量Top 5的接口进行检测,基于接口历史3小时数据,判断最近10分钟Top 5接口平均响应时间是否有异常突增点。 应用服务整体错误率突增:基于应用历史3小时数据,判断最近10分钟应用服务整体错误率是否有异常突增点。 TopN接口错误率突增:默认对流量Top
创建静默规则 通过静默规则,您可以在指定时间段屏蔽告警通知,静默规则一旦创建完成,即刻生效。 创建静默规则 用户最多可创建100条静默规则。 在左侧导航栏中选择“告警 > 告警降噪”。 在“静默规则”页签下单击“创建静默规则”,设置规则名称、静默条件等信息。 图1 创建静默规则 表1
累计触发:某个监控周期内达到累计次数则触发告警,按照设置的频率发送对应的事件告警通知。 例如,设置事件名称为“数据卷扩容失败”,监控周期为“20分钟”,累计次数为“3”,频率为“每5分钟”,则表示20分钟内累计3次发生数据卷扩容失败事件,则每5分钟发送一次告警通知直到告警被清除。 立即触发:满足筛选条件立即触发告警。
若ICAgent安装成功,但是无法监控到主机,通常有几种原因: 配置错误:Region名错误,或PODLB地址错误。 数据采集失败:调openstack接口失败,或采集的hostid为空。 请查看ICAgent的日志并检查配置,根据日志报错判断原因。 父主题: 常见使用问题
节点温度 Atlas 500小站节点温度,由用户调用edgecore接口上报。 ≥0 摄氏度(℃) node_power node_power 节点功率 Atlas 500小站节点功率,由用户调用edgecore接口上报。 ≥0 瓦(W) node_voltage node_voltage
创建AOM告警静默规则 告警静默规则功能可以在指定时间段屏蔽告警通知。 约束与限制 您最多可创建100条静默规则,如果静默规则数量已达上限100时,请删除不需要的静默规则。 静默规则一旦创建完成,即刻生效。 创建告警静默规则 登录AOM 2.0控制台。 在左侧导航栏中选择“告警管理
事件巡检:提供基于应用性能管理APM平台的应用监控服务,通过应用服务和流量Top N接口的平均RT、错误率等关键指标看护服务质量,自动检测指标异常。 事件根因分析:提供基于应用性能管理APM平台的调用链追踪根因定位技术。可以从应用服务和流量Top N接口的指标、调用链维度,全局分析问题,快速诊断并定位故障根因。
故障传播链将展示调用链中的故障传播图谱,您可通过故障转播图谱定位根因。支持查看故障传播链的异常事件类型包括: 应用服务整体平均响应时间突增 TopN接口平均响应时间突增 应用服务整体错误率突增 TopN接口错误率突增 图1 故障传播图谱 父主题: 智能洞察(BETA)
等问题。应用资源管理将所有资源对象与应用统一管理,为AOM和LTS、APM等运维服务提供准确、及时、一致的资源配置数据,并通过开放配置数据接口,辅助第三方系统运维场景建设。 约束与限制 如需使用“应用资源管理”功能,需提前在“菜单开关”中开启应用洞察的开关,详细操作请参见菜单开关。
MySQL,DCS,RDS,OBS,DMS,ELB,NAT,VPC,GaussDB DWS,LakeFormation,WAF,DRS,DDS,DC,CSS,EVS,CBR,APIG)以及ICAgent采集的CCE和ECS指标。 步骤一:被监控账号接入云服务资源 下面的操作以接入接入FunctionGraph、ECS
资源TopN图表的标题支持您自定义,标题默认命名为资源类型(集群名称)。 注意事项 1个区域中最多可创建50个仪表盘。 1个仪表盘中最多可添加20个图表。 1个曲线图中最多可添加10个资源,且资源可跨集群选择。 1个数字图只能添加1个资源。 1个阈值状态图表最多可添加10个阈值规则。
Debugging诊断概述 Debugging诊断可协助用户分析线程状况,获取方法及对象实时参数。方便开发人员从实时的远程应用程序中获取调试信息,而无需重新启动应用程序,也不会阻止它并导致服务停机。 约束与限制 为了应用运行稳定,强烈建议您按照要求升级JDK版本,在低版本的JDK