检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
>主机详情。详情页面包含了当前主机上所发现的所有实例,显卡,网卡,磁盘,文件系统等信息。 应用自动发现 您在主机上部署应用后,在主机上安装的ICAgent将自动收集应用信息,包括进程名称,组件名称,容器名称,Kubernetes pod名称等,自动发现的应用在界面上以图形化方式展
日志管理 日志管理使用说明 搜索日志 查看日志文件 添加日志桶 查看桶日志 添加日志转储 创建统计规则 接入LTS 容器日志采集配置
资源监控 资源监控使用说明 应用监控 组件监控 主机监控 容器监控 指标浏览 云服务监控
提供全托管式服务,无需另购资源,可降低监控成本,且维护成本几乎为零。 与CCE集成并提供监控服务,容器监控体系创建时间从2天降低至10分钟。一个Prometheus For CCE实例可以上报多个CCE集群数据。 开源兼容 支持自定义多维数据模型、HTTP API模块、PromQL查询。
体验保障:实时掌控业务KPI健康状态,对异常事务根因分析。 故障快速诊断:分布式调用追踪,快速找到异常故障点。 资源运行保障:实时监控容器、磁盘、网络等上百种资源运维指标,集群->虚机->应用->容器异常关联分析。 图2 立体化运维
更新任务 功能介绍 更新定时任务的启停状态,可启动定时任务或停止定时任务,返回操作任务结果。 调用方法 请参见如何调用API。 URI PUT /v1/{project_id}/cms/workflow/{workflow_id}/trigger/action 表1 路径参数 参数
指标总览 简介 网络指标及其维度 磁盘指标及其维度 磁盘分区指标 文件系统指标及其维度 主机指标及其维度 集群指标及其维度 容器组件指标及其维度 虚机组件指标及其维度 实例指标及其维度 服务指标及其维度
基础指标:node-exporter指标 介绍通过中间件Exporter上报到AOM的node-exporter指标的类别、名称、含义等信息。 表1 CCE/自建K8s集群容器指标 Job名称 指标 指标含义 node-exporter node_filesystem_size_bytes 挂载的文件系统占用空间
查看组件接口调用监控项 查看组件基础监控项 查看组件异常日志 查看组件外部调用监控项 查看组件通信协议监控项 查看组件数据库监控项 查看组件Web容器监控项 查看组件消息队列监控项 查看组件远程过程调用监控项 查看组件日志监控项 查看组件基础设施监控项 查看组件调用链监控项 父主题: 应用监控
Debugging诊断概述 Debugging诊断可协助用户分析线程状况,获取方法及对象实时参数。方便开发人员从实时的远程应用程序中获取调试信息,而无需重新启动应用程序,也不会阻止它并导致服务停机。 约束与限制 为了应用运行稳定,强烈建议您按照要求升级JDK版本,在低版本的JDK上使用Debugging诊断功能,存在应用崩溃的风险。
监控的功能。 工作负载监控 工作负载监控的对象通过CCE部署的工作负载,通过工作负载监控可及时了解工作负载的资源使用、状态和告警等信息。 集群监控 集群监控的对象为通过CCE部署的集群。“集群监控”页面可实时监控展示集群的Pods运行状态、CPU使用率等信息。 主机监控 通过主机
的Prometheus实例。 集群 可选参数,如果5.a选择的云服务中包含“CCEFromProm”服务,则显示该参数。 下拉列表中显示当前用户账号下的所有CCE集群,请从下拉列表中选择需要关联的CCE集群。 通知场景 设置发送告警通知的场景。 告警触发时:满足告警触发条件,则以
全可靠,具体请参见表1。 表1 AOM的监控安全风险 监控安全风险 简要说明 详细介绍 资源监控 AOM提供应用监控、组件监控、主机监控、容器监控、指标浏览等功能,支持实时监控您的应用及相关云资源,并将数据可视化展示,帮助用户快速分析应用健康状态。 资源监控使用说明 告警管理 A
CTS的详细介绍和开通配置方法,请参见CTS快速入门。 CTS支持追踪的AOM管理事件列表,请参见审计。 图1 云审计服务 日志 AOM支持采集容器服务日志和虚机(这里的虚机指操作系统为Linux的弹性云服务器或裸金属服务器)日志采集,并展现在AOM界面中供用户搜索和查看,详细介绍请参见日志分析。
CTS的详细介绍和开通配置方法,请参见CTS快速入门。 CTS支持追踪的AOM管理事件列表,请参见审计。 图1 云审计服务 日志 AOM支持采集容器服务日志和虚机(这里的虚机指操作系统为Linux的弹性云服务器或裸金属服务器)日志采集,并展现在AOM界面中供用户搜索和查看,详细介绍请参见日志管理使用说明。
接入管理”。 单击“添加AccessCode”。 图1 添加AccessCode 每个项目最多可创建2个AccessCode。 AccessCode是调用API的身份凭据,请您妥善保管。 在弹出的窗口,单击“确定”,添加AccessCode。 添加成功后,单击即可查看AccessCode。也
重启CCE工作负载 使用重启CCE工作负载卡片可以创建任务重启一个或多个CCE工作负载。 只支持对有状态负载和无状态负载进行重启,其余类型负载不支持。 创建重启CCE工作负载任务 登录AOM 2.0控制台。 在左侧导航栏单击“自动化运维(日落)”,即可进入“自动化运维”界面。 在
任务管理 “任务管理”页面展示所有任务的执行记录,您可以在这里执行已创建的任务。 任务操作 登录AOM 2.0控制台。 在左侧导航栏单击“自动化运维(日落)”,即可进入“自动化运维”界面。 在左侧导航栏中选择“定时运维 ”,单击右上角的“创建定时任务”。 任务创建或执行完成后,您
“组件”、“环境”、“IP”或“主机名”条件进行筛选。 你可以根据需要对Agent支持如下操作: 单击主机列表“Agent启停”列下按钮,启动或停止Agent。 选中多个主机前的复选框,单击“批量操作Agent”,即可批量开启、停止、删除Agent。 表1 Agent状态说明 状态
gpuUtil GPU使用率 该指标用于统计测量对象显卡使用率。 0~100 百分比(%) 容器状态 aom_container_status status 容器状态 该指标用于统计容器的状态。 ≥0 无 进程指标 CPU aom_process_cpu_usage cpuUsage