检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
添加日志转储 AOM支持将日志转储到对象存储服务(Object Storage Service,简称OBS)的OBS桶中,以便进行长期存储。如果您有更长时间的日志存储需求,可添加日志转储。 AOM提供周期性转储和一次性转储两种转储方式,供您选择使用。 周期性转储:将当前日志实时转
通过拓扑图查看组件间调用关系 拓扑图展示服务之间一段时间的调用关系,可以是从调用方统计,也可以是从被调用方统计。通过拓扑图可以自动梳理组件之间的调用关系,帮助用户快速定位问题。 通过拓扑图查看组件查看间调用关系 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。
该指标用于统计主机本地时间与NTP服务器时间的偏移量,NTP偏移量越接近于0,主机本地时间与NTP服务器时间越接近。 - 毫秒(ms) NTP服务器状态(aom_node_ntp_server_status) 该指标用于统计主机是否成功连接上NTP服务器。 0、1 0表示已连接 1表示未连接
设置时间范围: 方式一:使用AOM预定义好的时间标签,例如,近1小时、近6小时、近一天等,您可根据实际需要选择不同的时间粒度。 方式二:通过开始时间和结束时间,自定义时间范围,您最长可设置为31天。 设置搜索条件后,单击,查看在已设时间范围内满足搜索条件的事件。 您可参考表1执行如下操作:
通过新增变量可在仪表盘页面查看或新增图表时,自定义添加过滤器,过滤展示监控数据。 约束与限制 系统预置的仪表盘模板都保存在“系统内置”分组下,包含容器、云服务、原生中间件、应用。预置仪表盘不允许删除或调整分组,仪表盘模板不支持创建。 系统预置的容器类型仪表盘需要在CCE集群下的“插件管理”中安装
该指标用于统计测量对象已经使用的CPU核个数。 ≥0 核(Core) CPU使用率(aom_process_cpu_usage) 该指标用于统计测量对象的CPU使用率。服务实际使用的与申请的CPU核数量比率。 0~100 百分比(%) 句柄数(aom_process_handle_count) 该指标用于统计测量对象使用的句柄数。
“超额继续采集日志”开关关闭后,当日志超过每月免费赠送的额度(500M)时,将暂停采集日志,且云日志服务LTS控制台的“超额继续采集日志”也将同步关闭,请谨慎操作。 日志最大存储时长:30天,可根据需要修改存储时长。 父主题: 日志配置
原因:AK/SK配置不正确或30200、30201端口未连通。 影响:ICAgent无法正常使用。 解决办法 以root用户登录安装ICAgent的服务器。 执行以下命令,检查AK/SK配置是否正确。 cat /var/ICAgent/oss.icAgent.trace | grep proxyworkflow
ontainer、process等类型。例如设置为:资源类型+等于+container。 告警源:触发告警或事件的服务名称。可以设置为AOM 、LTS、CCE等服务名称。例如设置为:告警源+等于+AOM。 标签:告警标识属性,由标签名和标签值构成,支持用户自定义。例如设置为:标签
该指标用于统计主机本地时间与NTP服务器时间的偏移量,NTP偏移量越接近于0,主机本地时间与NTP服务器时间越接近。 - 毫秒(ms) aom_node_ntp_server_status NTP服务器状态 该指标用于统计主机是否成功连接上NTP服务器。 0、1 0表示已连接 1表示未连接
敬请期待。 您可通过接入管理生成的认证凭据access_code,将原生Prometheus的指标通过remote write上报到AOM服务端,参见将Prometheus的数据上报到AOM,实现时序数据的长期存储;也可以通过access_code作为认证凭据来查询AOM中的数据
日志升级后,容器日志和虚机日志均接入AOM 2.0,历史虚机日志可登录AOM 1.0查看。 采集器升级 采集器升级后,进程发现能力增强,并且可自动适配指标浏览服务相关功能。 告警规则升级 告警规则升级后,告警规则相关数据从1.0平滑切换至2.0,并可自动适配AOM 2.0告警规则相关功能。 日志升级
用户侧使用虚拟网卡,想要获取到ICAgent状态信息需要修改下相关脚本规避。 解决方法 以root用户登录已安装ICAgent的CCE集群的某个主机服务器。 执行以下命令,查看正在使用的hostIP地址,如图1所示。 netstat -nap | grep establish -i 图1 查看hostIP地址
ontainer、process等类型。例如设置为:资源类型+等于+container。 告警源:触发告警或事件的服务名称。可以设置为AOM 、LTS、CCE等服务名称。例如设置为:告警源+等于+AOM。 标签:告警标识属性,由标签名和标签值构成,支持用户自定义。例如设置为:标签
计算;尤其在大规模集群和复杂业务场景下可以有效的降低PromQL的复杂度,从而提高指标查询性能,解决用户配置以及查询慢的问题。 前提条件 服务已接入CCE类型Prometheus 监控并接入CCE集群,具体请参见Prometheus实例 for CCE。 配置Recording Rule
的Prometheus实例,默认选择default类型的Prometheus实例。 支持选择的数据源类型:Prometheus for 云服务、Prometheus for ECS、Prometheus for CCE、Prometheus 通用实例、Prometheus for
coredns_dns_response_size_bytes_sum DNS响应大小直方图sum coredns_dns_responses_total DNS响应码及数量 coredns_forward_conn_cache_hits_total 每个协议和数据流的缓存命中次数 coredns_forw
输入日志组名称。日志组名称只支持输入英文、数字、中文、中划线、下划线及小数点,且不能以小数点、下划线开头或以小数点结尾。 设置日志存储时间。存储时间默认为7天,可设置为1-30天内的时间节点。超出存储时间的日志将会被自动删除,您可以按需将日志数据转储至OBS桶中长期存储。 单击“确定”完成创建。 创建日志流