检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
标的类别、名称、含义等信息。 当主机类型为“CCE”时,可以查看磁盘分区指标,支持的系统为:CentOS 7.6版本、EulerOS 2.5。 以root用户登录CCE节点,执行docker info | grep 'Storage Driver'命令查看docker存储驱动类型。如果执行结果为“Device
在左侧导航栏中选择“脚本管理”,单击右上角的“创建脚本”。 设置脚本信息,具体的参数说明请参见表1。 图1 创建脚本信息 表1 脚本信息说明 参数类型 参数名称 说明 - 脚本名称 脚本的名称。最多可输入64个字符,只能由大小写字母、数字、下划线和中文字符组成。 版本号 脚本的版本信息,请按照实际输入。 企业项目 选择所属的企业项目。
监控相关API,包括查询指标,查询、添加监控数据等接口。 Prometheus监控 prometheus监控相关API,包括区间数据查询、瞬时数据查询等接口。 日志 日志相关API,包括查询日志接口。 Prometheus实例 Prometheus实例相关API,包括新增、查询Promet
应用示例 查询时间序列 查询时序数据 查询指定告警行动规则详细信息
创建任务 更新任务 对暂停中的任务进行操作 获取工作流执行中的执行详情 终止任务执行 脚本查询 脚本版本查询 作业管理主页模糊查询 根据作业id查询方案(自定义模板)列表 获取方案信息 查询任务列表 获取任务执行历史 执行工作流 父主题: API
基础指标:Flink指标 介绍通过Flink服务上报到AOM的指标的类别、名称、含义等信息。 表1 Flink服务监控指标 分类 指标 指标含义 单位 CPU flink_jobmanager_Status_JVM_CPU_Load JobManager中JVM的CPU负载。 无
查看告警 查看告警 在左侧导航栏中选择“告警 > 告警列表”。 在“告警列表”页面中查看告警。 设置时间范围,查看已设时间范围内产生的告警。可通过如下两种方式设置时间范围: 方式一:使用AOM预定义好的时间标签,例如,近1小时、近6小时、近一天等,您可根据实际需要选择不同的时间粒度。
签。 依次在下拉框选择“日志组名称”和“日志流名称”。 在SQL查询条件框中输入SQL语句,单击“查询”即可查看该日志流下日志数据分析。目前支持的SQL语句详见SQL查询语法。 依照业务需求选择不同图表类型,呈现查询结果。图表类型与配置的详细说明请参见日志数据类图表。 单击:以表格形式展示当前日志数据。
cms:template:get 获取模板信息 无 查询模板详情,查询作业执行方案详情 cms:template:list 获取模板列表 查询作业执行方案列表,查询可用于创建任务的模板列表 cms:script:get 查询脚本信息 查询脚本详情 cms:script:list 查询脚本列表 查询脚本列表 cms:job:list
亚健康 当有级别为次要或提示的告警时资源状态为亚健康。 修复建议:请在告警界面参考告警详细信息处理告警。 异常 当有级别为紧急或重要的告警时资源状态为异常。 修复建议:请在告警界面参考告警详细信息处理告警。 通道静默 当ICAgent无法采集资源的指标时资源状态为通道静默,通道静默可能由于但不限于以下原因导致:
的列表信息,最大支持导出100条。 单击“总次数”列的蓝色数值,可以查看所选时间段内该线程异常总数的趋势图。 单击“消息”列的蓝色文字,可以查看消息的详细内容,包括:时间和消息内容。 单击“异常堆栈”列的“查看详情”可以查看异常的详细信息。 单击“异常堆栈”列的“历史信息”可以查看该类名的历史异常堆栈列表。
AOM提供告警监控能力。告警是指AOM自身或外部服务在异常情况、可能导致异常情况下上报的信息,需要您采取相应措施清除故障,否则会由于AOM自身或外部服务的功能异常而引起业务的异常。事件是指AOM自身或外部服务发生了某种变化,但不一定会引起业务异常情况下上报的信息,您可根据需要对事件进行处理。 功能说明 告警行动规则
订阅AOM指标或告警数据 AOM支持用户订阅指标或者告警信息。订阅后可以将数据转发到用户配置的DMS或Webhook的Topic中,供消费者消费转发订阅的信息。 约束与限制 最多可创建10个数据订阅规则。 Webhook订阅类型当前受限开放,如有需求可以通过提交工单,联系工程师为您开放此功能。
的参数配置信息如下: 日志组名称:日志组的名称,必选项。 日志流名称:日志组下的日志流名称,必选项。 查询时间:当前所选日志的查询时间,可选项。查询时间(1 ~ 60分钟/1 ~ 24小时),单位为分钟或小时。 查询语句:可视化查询语句,必填项。具体请参考SQL语法查询。 从图表
和拉美-圣地亚哥区域:输入组件名或主机名搜索后选择,或直接在导航树中选择一个或多个(最多可选12个)关注的指标。 参考表1设置指标参数信息,查看页面上方的指标图表,多角度对指标数据进行分析。 表1 指标参数说明 参数 说明 统计方式 指标数据按照所设置的统计方式进行聚合,包括:平均值、最小值、最大值、总计、样本个数。
基础指标:node-exporter指标 介绍通过中间件Exporter上报到AOM的node-exporter指标的类别、名称、含义等信息。 表1 CCE/自建K8s集群容器指标 Job名称 指标 指标含义 node-exporter node_filesystem_size_bytes
<string> ] # 查询 promql 中必须包含以下 label 过滤条件才会进行 remote read 查询 required_matchers: [ <labelname>: <labelvalue> ... ] # remote read 查询超时时间 [ remote_timeout:
量 kube_job_info job信息 kube_namespace_labels 命名空间标签 kube_node_labels 节点标签 kube_node_info 节点信息 kube_node_spec_taint 节点污点信息 kube_node_spec_unschedulable
等。 自定义指标:您自己定义的指标。可参考如下两种方式上报自定义指标。 方式一:通过AOM提供的接口上报自定义指标,接口详见添加监控数据和查询监控数据。 方式二:在CCE创建容器应用时,通过对接普罗米修斯上报自定义指标,详细内容请参见对接普罗米修斯(自定义监控)。 指标命名空间
root”。 图1 安装ICAgent 可能原因 安装ICAgent的脚本会同时安装crontab计划任务,该提示信息表示当前没有root的计划任务。 解决方法 无需解决。 只要系统回显信息包含“ICAgent install success”,即表示ICAgent安装成功,ICAgent的数据采集等功能即可正常使用。