检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
检查内网域名配置 由于上述配置中的数据上报是通过内网进行数据传输,因此需要确保您的Prometheus所在的主机能够解析内网域名,请参考配置内网DNS。 重新启动Prometheus。 可通过通过grafana查看AOM中的指标数据中grafana查询指标数据的方法,来验证上述配置修改后数据上报是否成功。
如何处理界面“ICAgent状态”为“离线”的问题? ICAgent安装完成后,界面“ICAgent状态”为“离线”。 问题分析 原因:AK/SK配置不正确或30200、30201端口未连通。 影响:ICAgent无法正常使用。 解决办法 以root用户登录安装ICAgent的服务器。 执行以下命令,检查AK/SK配置是否正确。
Prometheus实例读写地址支持公网的局点 华为云用户应使用公网Remote Read地址和Remote Write地址访问AOM的Prometheus监控服务,内网地址仅供华为云内部云服务调用。 公网Remote Write地址仅部分局点支持,具体请参见表1。 表1 支持公网数据上报的说明 局点名称
u_usage) 该指标用于统计测量对象的CPU使用率。服务实际使用的与限制的CPU核数量比率。 0~100 百分比(%) 磁盘读取速率(aom_container_disk_read_kilobytes) 该指标用于统计每秒从磁盘读出的数据量。 ≥0 千字节/秒(kB/s) 磁
搜索AccessCode 在搜索框中输入AccessCode的ID,单击后显示匹配对象。 删除AccessCode 单击“操作”列的“删除”。 刷新AccessCode 单击,可实时获取到AccessCode的最新信息。 父主题: 设置
编辑作业后,作业的执行方案未更新 编辑作业后不会自动同步更新该作业的执行方案。 解决方法 编辑作业后,该作业的执行方案不会自动更新,需要用户重新创建该作业的执行方案。创建执行方案的详细操作请参考作业管理。 父主题: 运维管理(日落)
t所需的AK/SK。 使用说明 目前只支持部署CCE的JAVA应用。相关参数说明参见表1。 表1 性能管理配置参数列表 参数名称 参数说明 安装探针 选择安装探针。目前支持“不启动”“APM 2.0探针”。 探针版本 选择探针的版本类型。探针类型建议与负载所在node节点的CPU架构对应版本一致。
Query参数 参数 是否必选 参数类型 描述 action 是 String 对当前节点的操作:失败重试,失败跳过,暂停继续。 restart可重新执行失败的节点,skip可跳过失败的节点进入下个节点的执行,continue可通过暂停节点进入下一个节点。 最小长度:1 最大长度:10 枚举值:
您可通过接入管理生成的认证凭据access_code,将原生Prometheus的指标通过remote write上报到AOM服务端,参见将Prometheus的数据上报到AOM,实现时序数据的长期存储;也可以通过access_code作为认证凭据来查询AOM中的数据,参见通过gr
选择已创建的代理区域。 qwsertyddfsdfdf 主机 选择已安装的UniAgent主机。 - 代理IP 配置代理机的IP地址 - 端口 端口号,必须小于或等于65535 - 单击“确认”,完成代理机添加。 修改代理IP 代理机创建完成后,可根据需要修改代理机的IP地址。具体操作如下:
状态上报延迟导致显示异常的问题。 遇到工作负载状态显示不对的情况,首先在Agent管理页面查看ICAgent的版本是不是最新的。 图2 查看ICAgent的版本 节点的时间与实际不同步。 如果节点时间与实际时间相差过大,会导致ICAgent指标上报延迟,从而导致状态判断出现问题。
cpu_used_core) 该指标用于统计测量对象已经使用的CPU核个数。 ≥0 核(Core) CPU使用率(aom_process_cpu_usage) 该指标用于统计测量对象的CPU使用率。服务实际使用的与申请的CPU核数量比率。 0~100 百分比(%) 句柄数(aom
以CSV格式的表格文件导出,该CSV文件包含了本次查询结果的所有事件,且最多导出5000条信息。 单击按钮,可以获取到事件操作记录的最新信息。 在需要查看的事件左侧,单击展开该记录的详细信息。 在需要查看的记录右侧,单击“查看事件”,会弹出一个窗口显示该操作事件结构的详细信息。
为什么购买的资源在“资源管理”界面看不到? 如果确认资源购买成功,请先通过“资源>我的资源”查看是否有此资源。如果确认资源已经展示在“我的资源”处,即可在“资源管理”界面,单击“刷新”,即可显示相关资源。 图1 查看资源 图2 刷新“资源管理”界面 父主题: 应用资源管理(日落)
“我的资源”已经释放删除了,为什么还会在界面展示? 如果资源绑定在CMDB环境下,那CMDB不会直接清除资源,只会标记资源状态为“已销毁”。 如需清理此类资源,需要用户手动解绑已释放的资源,CMDB会在凌晨清除已释放且未绑定环境的资源。如果释放删除的资源未绑定CMDB环境,则CMDB会同步清除。
组规则。 所选择告警降噪的分组规则中配置的告警级别、标签等信息需与告警规则中的配置信息匹配,否则分组规则不生效。 图3 设置告警降噪方式 单击“立即创建”,完成创建。创建完成后,单击“返回告警规则列表”可查看已创建的告警规则。 当CCE服务的资源满足设置的事件告警条件时,在告警界
使用限制 单账号跟踪的事件可以通过云审计控制台查询。多账号的事件只能在账号自己的事件列表页面去查看,或者到组织追踪器配置的OBS桶中查看,也可以到组织追踪器配置的CTS/system日志流下面去查看。 用户通过云审计控制台只能查询最近7天的操作记录。如果需要查询超过7天的操作记录,您必
通过helm部署pod的yaml文件后,AOM无法检测到工作负载 问题描述 通过helm部署pod的yaml文件后,AOM无法检测到工作负载。 原因分析 通过对比helm部署pod的yaml文件和在CCE控制台部署的pod yaml文件,发现helm部署pod的yaml文件中缺少env参数。
配置、组件与基础设施关联分析设置。 关联日志服务设置 应用性能管理(APM)与云日志服务(LTS)关联,您可以在 LTS中关联调用链的 TraceID 信息,当应用出现故障时,可以通过调用链的 TraceID 快速关联到业务日志,及时定位分析并解决问题。 关联业务日志与Trace
支持按规则名称等信息搜索,可在右上角的搜索框中输入关键字,单击后显示匹配对象。 查看告警规则详细信息 单击规则名称前的,可查看该告警规则的详细信息,包括每个规则的基本信息、告警条件等。指标告警规则还可查看监控对象及触发的告警列表信息。 查看告警 在已设的连续周期内,当某个资源的指标数据满足阈值条件时,产生一条阈值告警。