检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
什么是应用运维管理 运维遇到挑战 随着容器技术的普及,越来越多的企业通过微服务框架开发应用,业务实现更多使用云上服务,运维也转向云上的运维服务。对于云上应用的运维也提出了新的挑战。 图1 运维现有问题 运维人员技能要求高,配置繁杂,同时需要维护多套系统。对于分布式追踪系统,学习和使用成本高,并且稳定性差。
标签名称 标签的名称。 支持输入2~64个字符,只能由大小写字母、数字、下划线、中划线、点和中文字符组成。 描述 标签的描述信息,最多可输入255个字符。 关联节点 标签要关联的节点。 区域:资源支持的区域,请从下拉列表中选择或输入关键字搜索后选择。 节点:待关联的节点,直接从下
下划线(_)或中划线(-)组成的1~64位字符串,且必须以字母开头。 同一伸缩组下的策略,相同指标(metric_name)的metric_operation为“>”的metric_threshold值必须比metric_operation为“<”的metric_threshold值大。
使用自动化运维资源。 根据企业用户的职能,设置不同的访问权限,以达到用户之间的权限隔离。 将自动化运维资源委托给更专业、高效的其他华为云账号或者云服务,这些账号或者云服务可以根据权限进行代运维。 如果华为云账号已经能满足您的要求,不需要创建独立的IAM用户,您可以跳过本章节,不影响您使用自动化运维服务的其它功能。
告警抑制规则功能可以抑制或阻止与某些特定告警相关的其他告警通知。例如:当严重级别的告警产生时,可以抑制与其相关的低级别的告警;或当节点故障发生时,抑制节点上的进程或者容器的所有其他告警。 约束与限制 如果在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,抑制对象(被源告警抑制的告警)将正常发送告警通知。
预聚合(Recording Rule)可以对落地的指标数据做二次开发。您可以配置预聚合规则将计算过程提前写入端,减少查询端资源占用。 应用场景 某些指标查询可能需要在查询端进行大量的计算,查询端压力过大,影响查询性能。通过配置预聚合规则对一些常用的指标或者计算相对复杂的指标进行提前计算;尤其在大规模
其他中间件指标接入AOM 如果当前AOM提供的中间件Exporter插件不满足您的需求,可以先安装自定义的Exporter,然后使用AOM提供的Custom Exporter插件创建采集任务,即可以监控该中间件的相关指标。 前提条件 主机已安装UniAgent,且状态为运行中。 已创建ECS
使用抑制规则,您可以抑制或阻止与某些特定告警相关的其他告警通知。例如:当严重级别的告警产生时,可以抑制与其相关的低级别的告警。或当节点故障发生时,抑制节点上的进程或者容器的所有其他告警。 注意事项 若在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,抑制对象(被源告警抑制的告警)将正常发送告警通知。
ebug中的日志文件。 一个虚机最多可配置20条日志采集路径。 同一资源空间下的所有ECS主机,无法同时使用AOM和LTS的日志采集功能,只能匹配系统中最新的日志采集配置。例如,当前在AOM中配置了ECS主机的日志采集路径,则之前在该资源空间下,LTS中所有ECS主机的采集配置都失效。
标准输出配置 通过添加指定采集容器标准输出标签,用户可以指定采集pod下的对应容器名的标准输出日志。用户在pod的yaml中spec:template:metadata:annotations:字段增加以下字段来实现指定要采集的容器名称。 kubernetes.AOM.log.stdout:
”字段的值。 如果2为空,则取环境变量“PAAS_MONITORING_GROUP”的值。 如果3为空,则取进程的启动命令中“DAOM.APPN”字段的值。 组件名称取值优先级: 取进程的启动命令中“DAOM.PROCN”字段的值,如果为空则取“Dapm_tier”字段的值。 如
查询时间序列 场景描述 本章以查询一个节点的CPU使用率时间序列为例。 涉及的基本信息 查询时间序列前,需要确定节点的ID和集群ID的值,节点ID值可以在ECS的dimensions中查看,集群ID值可以在CCE的“集群管理”页面,基本信息的dimensions中查看。 CPU使用
如果在AOM中已创建日志接入LTS规则,则实际的日志存储时长以LTS中“日志管理”界面设置的“日志存储时间(天)”为准,“配置设置”界面的“日志存储时长”不生效。 图1 查看日志配额 超额继续采集日志:开启后表示当日志超过免费赠送的额度(500M)时,继续采集日志,超过的部分按需收费。 “超额继续采
orter的方式来监控Redis运行状态。本文为您介绍如何使用Prometheus监控Redis。 其他Exporter接入AOM实现指标监控 如果您所使用的基础组件还没有提供相应的集成方式,可以参考如下方式进行集成,以及自定义监控大屏来满足相应的监控需求。 当前支持的中间件Ex
)组成的格式为XX.XX的3~32位字符串。 指标维度 维度是指标的分类。每个指标都包含用于描述该指标的特定特征,可以将维度理解为这些特征的类别。 系统指标维度:维度是固定不变的,不同类型的指标维度不同,维度信息的详细说明请参见指标维度。 自定义指标维度:维度为1~32位的字符串,需要您自定义。
您可以在“费用中心 > 账单管理”查看资源的费用账单,以了解该资源在某个时间段的使用量和计费信息。 账单上报周期 按需计费模式的资源按照固定周期上报使用量到计费系统进行结算。按需计费模式产品根据使用量类型的不同,分为按小时、按天、按月三种周期进行结算,应用运维管理的按需计费模式按天进行结算。具
单击“总次数”列的蓝色数值,可以查看所选时间段内该线程异常总数的趋势图。 单击“消息”列的蓝色文字,可以查看消息的详细内容,包括:时间和消息内容。 单击“异常堆栈”列的“查看详情”可以查看异常的详细信息。 单击“异常堆栈”列的“历史信息”可以查看该类名的历史异常堆栈列表。 单
对未执行的任务单击“操作”列的“去执行”。 对已执行的任务单击“操作”列的“重新执行”。 删除任务 单击在“操作”列的“删除”,删除任务。 只有未执行过的任务行,"操作"列,才会显示“删除”。 搜索任务 支持按企业项目、任务名称、执行人、任务类型、任务状态搜索。在右上角的搜索框中输入关键字,单击后在下面任务列表显示匹配对象。
件监控”的主操作界面。 在“实例列表”页签,可查看该组件所有实例的概况。 单击实例名称,可监控业务进程或组件pod的资源占用与健康状态。 在“主机列表”页签,可查看该组件所在的主机概况。 在“告警分析”页签,可查看该组件的告警情况。 单击“监控视图”页签,可监控该组件的各种指标。
Operations Management,以下简称AOM)是云上应用的一站式立体化运维管理平台,实时监控您的应用及相关云资源,分析应用健康状态,提供灵活的告警及丰富的数据可视化功能,帮助您及时发现故障,全面掌握应用、资源及业务的实时运行状况。 图1 AOM使用流程 开通AOM(必选) 创建子账号并设置权限(可选)