检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
使用Prometheus监控CCE集群指标 AOM基于Prometheus监控生态,提供了托管式的CCE类型Prometheus实例 ,适合需要对容器服务集群及其上面运行的应用进行一体化监控场景。CCE Prometheus实例默认提供对容器服务CCE集群的Prometheus云
在左侧导航栏选择“认证管理”,然后在右侧区域单击“创建AccessCode”。 在弹出的“创建AccessCode”对话框中单击“立即生成”,系统自动为当前用户生成AccessCode。 AccessCode是调用API的身份凭据,每个项目最多可创建2个AccessCode,请您妥善保管。
可能原因二:AOM不支持监控当前资源类型 修复建议:请检查您的资源是否为AOM监控的类型,AOM当前支持监控的资源类型有:主机、K8s容器、用户进程(AOM不监控主机的系统进程)。 可能原因三:资源被删除或被停止 修复建议: 在ECS界面检查主机是否已被重启、关机或删除。 在CCE界面检查服务是否已被停止或删除。
产品架构 AOM是一个以资源数据为中心并关联日志、指标、资源、告警和事件等数据的立体运维服务。AOM从架构上主要分为数据采集接入层、传输存储层和业务计算层。 架构图 图1 AOM架构 采用三层架构 数据采集接入层 ICAgent采集数据 给主机安装ICAgent(插件式的数据采集
meInMillis + durationInMinutes * 60 * 1000)计算结束时间,如果计算出的结束时间大于当前系统时间,则使用当前系统时间。如1650852000000.-1.5,则相当于1650852000000.1650852300000.5 duratio
繁调用。 使用Token前请确保Token离过期有足够的时间,防止调用API的过程中Token过期导致调用API失败。 Token在计算机系统中代表令牌(临时)的意思,拥有Token就代表拥有某种权限。Token认证就是在调用API的时候将Token加到请求消息头,从而通过身份认证,获得操作API的权限。
meInMillis + durationInMinutes * 60 * 1000)计算结束时间,如果计算出的结束时间大于当前系统时间,则使用当前系统时间。如1650852000000.-1.5,则相当于1650852000000.1650852300000.5 duratio
在左侧导航栏选择“认证管理”,然后在右侧区域单击“创建AccessCode”。 在弹出的“创建AccessCode”对话框中单击“立即生成”,系统自动为当前用户生成AccessCode。 AccessCode是调用API的身份凭据,每个项目最多可创建2个AccessCode,请您妥善保管。
接入云服务:从云服务下拉列表中选择需要监控的一个或多个云服务。 数据存储:组织内子账号指标数据接入Prometheus For聚合实例后,子账号保留数据。系统默认不选择。 添加云服务支持的相关指标:单击“新增指标”,依次为接入的云服务添加相关指标。 图1 账号接入界面 父主题: Prometheus监控
meInMillis + durationInMinutes * 60 * 1000)计算结束时间,如果计算出的结束时间大于当前系统时间,则使用当前系统时间。如1650852000000.-1.5,则相当于1650852000000.1650852300000.5 duratio
容器内日志文件所在路径挂载到主机上的位置,如:/var/paas/sys/log/nginx 挂载路径 输入数据逻辑卷挂载到容器上的路径,如:/tmp 须知: 请不要挂载在系统目录下,如“/”、“/var/run”等,会导致容器异常。建议挂载在空目录下,若目录不为空,请确保目录下无影响容器启动的文件,否则文件会被
当下拉框中没有可用的日志组或日志流时,需要单击“添加日志组”、“添加日志流”创建。创建日志流后,需选择所属的企业项目。 自动映射:自动将工作负载的日志接入到系统生成的同名日志流。 规则名称:填写规则名称(自定义即可)。 选择集群:在下拉框中选择已有集群。 命名空间:在下拉框中选择已有命名空间。 工
目。 全部日志:选择日志组和日志流。 指定日志路径:填写需要接入的日志路径,然后选择日志组和日志流。 自动映射:自动将工作负载的日志接入到系统生成的同名日志流。 规则名称:自定义规则名称,只支持输入英文字母、数字、中划线、下划线以及小数点。 命名空间:在下拉框中选择已有命名空间。
告警规则触发的告警:单击告警详情页中涉及容器相关资源的cluster_name、node、pod、container时,可以跳转至AOM的系统内置仪表盘中查询相应时间的指标曲线。 规则类型为应用性能监控的告警规则触发的告警:单击告警详情页的应用、组件、环境,可跳转至组件详情页。 查看事件详情
and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"] projectId = "{project_id}"
所有标签:由相同告警源触发的告警,且其标签相同时,合并为一组发送告警通知。 智能合并模式开关:智能合并模式开关功能当前仅在华北-北京四,华南-广州区域开放。系统默认关闭智能合并模式开关,打开开关后,用户可以按照选择的告警属性智能合并告警。 告警名称:触发的告警中有相同或相似的告警名称,智能合并为一组发送告警通知。
and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"] projectId = "{project_id}"
接入方式默认选择“增强型探针”。 数据接入方式选择“虚机接入”,按照界面提示步骤接入。 图2 虚机接入 使用PuTTY等远程登录工具,登录待安装Agent的Linux操作系统主机,并以root权限执行复制的命令来下载并安装JavaAgent。 curl -k https://javaagent.***/apm_agent_install2
查看事件 事件告诉您AOM自身或外部服务发生了某种变化,但不一定会引起业务异常,事件一般用来表达一些重要信息。您不用对事件进行处理。 查看事件 在左侧导航栏中选择“告警 > 事件列表”。 在“事件列表”页面中查看事件。 设置时间范围,查看已设时间范围内产生的事件。可通过如下两种方式设置时间范围:
查看告警 查看告警 在左侧导航栏中选择“告警 > 告警列表”。 在“告警列表”页面中查看告警。 设置时间范围,查看已设时间范围内产生的告警。可通过如下两种方式设置时间范围: 方式一:使用AOM预定义好的时间标签,例如,近1小时、近6小时、近一天等,您可根据实际需要选择不同的时间粒度。