检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
UniAgent版本 UniAgent的版本,必选项。 1.1.6 接入方式 接入UniAgent的方式,此处选择“直连接入”。 直连接入:华为云主机,使用直连接入的方式。 直连接入 安装命令 安装UniAgent的命令,此处选择复制LINUX安装命令。 单击复制安装命令。 set +o
Debugging诊断概述 Debugging诊断可协助用户分析线程状况,获取方法及对象实时参数。方便开发人员从实时的远程应用程序中获取调试信息,而无需重新启动应用程序,也不会阻止它并导致服务停机。 约束与限制 为了应用运行稳定,强烈建议您按照要求升级JDK版本,在低版本的JDK
高级过滤:支持在搜索框中按告警级别 、告警源、告警关键字等条件进行过滤,默认按照告警级别过滤。 告警清除:支持单个、批量清除告警。 告警详情:在告警详情中查看告警对象的信息和修复建议,所有的告警都提供修复建议。 在事件列表中,有以下关键功能: 事件列表:支持按事件级别图形化查看事件信息。 高级过滤:支持在搜索框中按事件级别
障发生时,抑制节点上的进程或者容器的所有其他告警。 约束与限制 如果在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,抑制对象(被源告警抑制的告警)将正常发送告警通知。 您最多可创建100条抑制规则,如果抑制规则数量已达上限100时,请删除不需要的抑制规则。 创建告警抑制规则
设置此参数。 Prometheus监控 当指标或事件满足对应的告警条件时,系统根据关联的接收对象与消息模板来发送告警通知。 日志监控 当日志数据满足对应的告警条件时,系统根据关联的接收对象与消息模板来发送告警通知。 云监控 AOM 2.0控制台中创建监控数据来源为“云监控”类型的告警通知规则功能由云监控服务
设置告警规则的详细信息。 设置“规则类型”为“事件类告警”。 设置告警来源、触发对象和触发策略。 表1 告警规则填写说明 参数名称 填写说明 告警来源 事件类告警来源的服务名称,从现有的服务列表中选择。 触发对象 服务事件的筛选条件。从通知类型、事件名称、告警级别、自定义属性、命名空间
持各种数据采集插件生命周期管理能力。 统一告警管理:提供Prometheus、日志、云服务统一告警规则管理,统一告警模板管理,统一告警通知对象管理;预置100+告警模板,支持告警分组、抑制、静默等多种降噪方式,支持自定义消息模板和多种通知渠道(邮件、短信、语音、企业微信、钉钉、飞书、Webhook)。
Kafka 名称/ID、规格、分区上限、区域、应用环境、操作。 RabbitMQ 名称/ID、规格、区域、应用环境、操作。 存储 对象存储服务OBS - 桶名称、区域、企业项目、区域、应用环境、操作。 云备份CBR - 名称/ID、资源状态、资源类型、计费模式、区域、企业项目、应用环境、操作。
中划线和点组成。 应用名称 应用的名称。 支持输入2~64个字符,只能由大小写字母、数字、下划线、中划线、点和中文字符组成。 企业项目 华为云企业项目,请从下列列表中选择。 如果现有的项目无法满足需求,可单击“创建项目”添加。 描述 应用的描述信息,最多可输入255个字符。 设置完成后,单击“确认”。
方式二:在CCE创建容器应用时,通过对接普罗米修斯上报自定义指标,详细内容请参见对接普罗米修斯(自定义监控)。 指标命名空间 指标命名空间是对一组资源和对象产生的指标的抽象整合,不同命名空间中的指标彼此独立,因此来自不同应用程序的指标不会被错误地汇聚到相同的统计信息中。 系统指标的命名空间:命名空间是固定不变的,均以“PAAS
右键单击某一个组件图标,选择 “查看调用链”或者“查看指标”,支持查看调用链或组件性能指标,详情请参见查看调用链和查看组件性能指标。 可通过鼠标左键选中调用对象的图标,移动位置,来改变拓扑图布局。 单击“重新布局”按钮,将修改后的拓扑图恢复至默认的布局。 单击刷新时间选择按钮,选择刷新拓扑图数据的
除”。 删除单条或多条规则:勾选对应规则前的复选框,单击“批量删除”。 搜索静默规则 在右上角的搜索框中输入规则名称关键字,单击后显示匹配对象。 父主题: 告警降噪
删除后相关数据将停止计费。如果用户需要继续使用相关指标和日志数据,建议采用以下方式存储: 日志数据:通过日志转储功能,将日志数据转储到OBS桶中,以便进行长期存储。日志数据的相关费用统一由LTS提供并上报话单,AOM不会双算。 指标数据:通过数据订阅功能,将指标数据转发到用户配
说明: 删除告警行动规则前需要先删除该行动规则绑定的告警规则。 搜索告警行动规则 在右上角的搜索框中输入规则名称关键字,单击后显示匹配对象。 父主题: 告警行动规则
enterpriseProjectIdSearchJobsRequestBody:= "" pageSizeSearchJobsRequestBody:= int32(10) pageNumSearchJobsRequestBody:= int32(1) nameSearchJobsRequestBody:=
https://aom-uniagent-{region_id}.{obs_domain}/install_uniagentd_self_OS.sh 以华北-北京四区域为例: wget https://aom-uniagent-cn-north-4.obs.cn-north-4.myhuaweicloud
搜索告警模板 在右上角的搜索框中输入模板名称关键字,单击后显示匹配对象。 查看通过模板创建的告警规则 在左侧导航栏中选择“告警管理(告警中心) > 告警规则”,在告警规则列表上方的搜索框中输入模板名称关键字,单击后显示匹配对象。如果事先为告警模板关联过Prometheus实例或集群,也
变量新增完成后,您还可以在“变量设置”页面执行表2中的操作。 表2 更多操作 参数名称 说明 搜索变量 支持按变量名称搜索,可在变量列表上方的搜索框中输入关键字,单击后显示匹配对象。 编辑变量 单击变量列表操作列的,详细操作请参见表1。 删除变量 单击变量列表操作列的,在弹框中单击“确定”。 通过变量填充仪表盘图表标题
什么是应用运维管理 运维遇到挑战 随着容器技术的普及,越来越多的企业通过微服务框架开发应用,业务实现更多使用云上服务,运维也转向云上的运维服务。对于云上应用的运维也提出了新的挑战。 图1 运维现有问题 运维人员技能要求高,配置繁杂,同时需要维护多套系统。对于分布式追踪系统,学习和使用成本高,并且稳定性差。
主机状态图表:实时监控主机的状态。 图4 主机状态图表 组件状态图表:实时监控组件的状态。 图5 组件状态图表 资源TopN图表 资源TopN图表的统计单位为集群,统计对象为集群下的资源(这里的资源指主机、组件和实例)。资源TopN图表可视化地展示了集群中资源占用最高的N个资源,支持资源Top5、Top15数