检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如果通过旧版方式安装UniAgent的主机是Windows操作系统,需在主机上手动执行重装UniAgent操作。 UniAgent暂时不提供自动升级,而是根据您的需求自主进行升级。 如果通过旧版方式安装UniAgent的主机是Windows操作系统,则需在主机上手动执行卸载UniAgent操作。
如果通过旧版方式安装UniAgent的主机是Windows操作系统,需在主机上手动执行重装UniAgent操作。 UniAgent暂时不提供自动升级,而是根据您的需求自主进行升级。 如果通过旧版方式安装UniAgent的主机是Windows操作系统,则需在主机上手动执行卸载UniAgent操作。
趋势图上方的值为所选组件下监控的最新时间点CPU&内存使用率的值。 在卡片左下角通过勾选“隐藏系统组件”可隐藏系统组件。 集群监控(磁盘)卡片 图5 集群监控(磁盘) 此卡片主要展示了3种信息: 统计最新时间前1分钟内的集群的磁盘使用率在TOP5的集群信息。 最近1小时内的所选集群的磁盘使用率的趋势图,趋势图的每一
本章节以在ECS控制台购买的一台ECS为例,演示如何为其安装ICAgent并在AOM界面对其进行监控。 注意事项 已购买一台ECS。 ECS的操作系统满足AOM支持的操作系统及版本。 请提前获取AK/SK。 本地浏览器时间和ECS时间一致。 安装ICAgent 登录AOM控制台,选择“配置管理 >
邮件等多种方式通知客户当前系统存在的问题。 支持的指标 AOM可以支持设置阈值告警的指标类型如下。 类型 指标举例 组件(进程) CPU内核总量、CPU内核占用、CPU使用率等 主机网络 接收Bps、接收错包率、发送错包率、总Bps。 主机磁盘、文件系统 磁盘读取速率、磁盘写入速率、磁盘使用率。
维也转向云上的运维服务。对于云上应用的运维也提出了新的挑战。 图1 运维现有问题 运维人员技能要求高,配置繁杂,同时需要维护多套系统。对于分布式追踪系统,学习和使用成本高,并且稳定性差。 云化场景下的分布式应用问题分析困难主要表现在如何可视化微服务间的依赖关系、如何提高应用性能体
自动化运维自定义策略 如果系统预置的自动化运维权限不能满足您的授权要求,您可以创建自定义策略。自定义策略中可以添加的授权项(Action),请参考策略和授权项说明。 目前华为云支持以下两种方式创建自定义策略: 可视化视图创建自定义策略:无需了解策略语法,按可视化视图导航栏选择云服
和线程的调用关系和执行效率的差异,帮助您对比代码性能差异。 查看代码性能快照:支持快照列表查询功能。快照列表以分钟为时间维度,获取应用程序的调试信息,如CPU核数、内存分配速率、实例名称以及主机名称。 查看建议:支持查看建议。Profiler根据用户的性能数据,识别出超过CPU使用率阈值的方法,然后给出合理的建议。
单击“组件”列,某一个组件名称,进入该组件详情页,默认展示“接口调用”详细信息。 单击“调用链”,切换至调用链页签,页面展示该组件调用链详情。 图1 调用链 通过选择实例、URL等查询条件查询,也可在界面下方新增自定义查询条件来查看调用链详情。详情请参考查看调用链。 父主题: 监控组件性能指标
亚健康 当有级别为次要或提示的告警时资源状态为亚健康。 修复建议:请在告警界面参考告警详细信息处理告警。 异常 当有级别为紧急或重要的告警时资源状态为异常。 修复建议:请在告警界面参考告警详细信息处理告警。 通道静默 当ICAgent无法采集资源的指标时资源状态为通道静默,通道静默可能由于但不限于以下原因导致:
升级ICAgent 为了更好的采集体验,AOM会不断更新ICAgent版本。当系统提示您有新的ICAgent版本时,您可以按照如下操作步骤进行升级。 如果ICAgent存在严重的bug时,系统会对采集的版本进行升级。 在左侧导航栏中选择“配置管理 > Agent管理”。 在页面右
单击右上角的,可获取到3.a设置的时间范围内工作负载的最新信息。 单击右上角的,通过选中/取消选中各展示项前的复选框,自定义列表项的展示/隐藏。 单击工作负载名称,可查看该工作负载的详细信息。 在“Pod实例”页签下,可查看该工作负载所有实例的概况。单击实例名称,可查看该实例下所有容器的资源使用与健康状态。
及时了解主机的资源使用情况、趋势和告警,使用这些信息,您可以快速响应,保证主机流畅运行。 主机监控的设计类似应用监控,主机的层级关系为:主机列表->主机详情。详情页面包含了当前主机上所发现的所有实例,显卡,网卡,磁盘,文件系统等信息。 应用自动发现 您在主机上部署应用后,在主机上
基础指标:Flink指标 介绍通过Flink服务上报到AOM的指标的类别、名称、含义等信息。 表1 Flink服务监控指标 分类 指标 指标含义 单位 CPU flink_jobmanager_Status_JVM_CPU_Load JobManager中JVM的CPU负载。 无
升级ICAgent 为了更好的采集体验,AOM会不断更新ICAgent版本。当Linux系统提示您有新的ICAgent版本时,您可以按照如下操作步骤进行升级。 登录AOM控制台,在左侧导航栏中选择“配置管理 > Agent管理”。 在页面右侧的下拉列表框中选择“集群:xxx”或“其他:用户自定义接入主机”。
查看日志流中日志的上下文 您可以通过本操作查看指定日志生成时间点前后的日志,用于在运维过程中快速定位问题。 登录AOM 2.0控制台。 在左侧导航栏中选择“日志分析 > 日志流”。 在“原始日志”页面单击,查看上下文。 在查看上下文结果中,可以查看该日志的前后若干条日志详细信息。
grep proxyworkflow.go 若无回显信息,则说明AK/SK配置错误 => 执行 3 若有回显信息,则说明AK/SK配置正确 => 执行4 配置AK/SK后,重新安装ICAgent。如果仍未安装成功,请执行4。 查询端口连通性。 执行以下命令,获取ACCESS的IP地址。
grep proxyworkflow.go 若无回显信息,则说明AK/SK配置错误 => 执行 3 若有回显信息,则说明AK/SK配置正确 => 执行4 配置AK/SK后,重新安装ICAgent。如果仍未安装成功,请执行4。 查询端口连通性。 执行以下命令,获取ACCESS的IP地址。
本对话框中展示前置脚本的内容信息,安装脚本对话框中展示安装脚本的内容信息,最多可以展示1000个字符。 操作类型选择“卸载”,脚本类型为“卸载脚本”。卸载脚本对话框中展示卸载脚本的内容信息,最多可以展示1000个字符。 暂停步骤 步骤说明 步骤说明信息,最多可输入1000个字符。
by(__name__,hostID,nodeIP) 如需查看Prometheus格式命令行的详细说明,请将光标移至搜索框后的处,单击“了解更多”。 系统自动填充:不确定指标信息或对Prometheus格式不了解时,可采用系统自动填充方式。系统自动填充方式需要从“指标浏览”界面跳转后填充。 具体操作:在左侧导航栏中选择“监控