检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
标准输出配置 通过添加指定采集容器标准输出标签,用户可以指定采集pod下的对应容器名的标准输出日志。用户在pod的yaml中spec:template:metadata:annotations:字段增加以下字段来实现指定要采集的容器名称。 kubernetes.AOM.log.stdout:
本功能当前在华北-北京一、华北-北京四、华东-上海一、华东-上海二、华南-广州、西南-贵阳一、中国-香港、华南-深圳、华南-广州-友好用户环境、华北-乌兰察布一、亚太-曼谷和亚太-新加坡区域开放,如有需求可以通过提交工单,联系工程师为您开放此功能。 父主题: 告警行动规则
告警。 注意事项 若在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,抑制对象(被源告警抑制的告警)将正常发送告警通知。 用户最多可创建100条抑制规则。 创建抑制规则 在左侧导航栏中选择“告警 > 告警降噪”。 在“抑制规则”页签下单击 “创建抑制规则”,设置规则名称、根源告警等信息。
编排好的作业,能否在执行时再选择执行机,填入脚本参数等内容? 在创建作业时,如需在每次执行作业时填入脚本参数,确认执行目标实例等,则需要配置全局参数,并在作业步骤中引用。 操作步骤 登录AOM 2.0控制台,在左侧导航栏单击“自动化运维(日落)”,进入“自动化运维”界面。 在左侧导航栏中选择“作业管理”,单击右上角的“新建作业”。
务类型的Prometheus实例名称,进入该实例的“云服务接入”界面。 在右侧“未接入云服务”下单击DCS服务卡片,打开“接入云服务标签”下“指标维度是否增加云服务标签”的开关并单击“立即接入”。 如图1所示,即可接入DCS服务与标签。 图1 接入云服务和标签 步骤三:告警添加标签
告警规则,同时也支持使用告警模板为多个资源或者云服务批量创建告警规则。 告警模板 告警模板是一组以云服务为单位的告警规则组合,通过告警模板用户可对同一个云服务下的多个指标批量创建阈值告警规则、事件告警规则和PromQL告警规则。 约束与限制 系统支持创建的指标告警规则、事件告警规
查看场景分类 在场景分类页面自动化运维已定义了服务场景的类型,具体如下: 故障处理 日常巡检 软件部署 云服务场景 通用场景 父主题: 运维配置
息,您可以快速响应,保证应用流畅运行。 应用监控是逐层下钻设计,层次关系为:应用列表->应用详情->组件详情->实例详情->进程详情。即在应用监控中,将应用、组件、实例、进程做了层层关联,在界面上就可以直接得知各层关系。 主机监控 主机监控是针对主机的监控,通过主机监控您可以及时
APM指标数据未采集上来,可能有哪些原因? 如果APM探针刚接入,可以稍微等待几分钟后,就能看到数据。 如果显示数据采集被停止,可能的原因有: 实例级别停止,APM探针管理中采集被停止。 监控项级别停止,监控项状态列表某些监控项采集被人为停止。 APM控制台的“全局配置(系统管理
AOM服务提供了多种可靠性容灾能力,可以通过AZ内实例容灾、多AZ容灾、多集群容灾、数据多副本等技术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。 多AZ容灾
] } 示例2:拒绝用户删除应用发现规则 拒绝策略需要同时配合其他策略使用,否则没有实际作用。用户被授予的策略中,一个授权项的作用如果同时存在Allow和Deny,则遵循Deny优先。 如果您给用户授予AOM FullAccess的系统策略,但不希望用户拥有AOM FullAc
环境”的应用管理模型。 资源管理 全局查看所有的云服务资源对象与应用的关联关系,便于用户对资源进行分析和管理。 环境标签 为已创建的应用环境添加标签,便于用户快速过滤和查找相同属性的应用环境。 资源监控 接入中心 快速接入需要监控的业务层、应用层、中间件层、基础设施层指标。 不支持 支持 仪表盘
AOM服务提供了多种可靠性容灾能力,可以通过AZ内实例容灾、多AZ容灾、多集群容灾、数据多副本等技术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。 多AZ容灾
创建告警行动规则 前提条件 已创建一个主题,操作详见创建主题。 已设置主题策略,操作详见设置主题策略。 已为主题添加相关的订阅者,即通知的接收人(例如:邮件或短信),操作详见订阅主题。 注意事项 您最多可创建1000个告警行动规则,如果告警行动规则数量已达上限1000时,请删除不需要的行动规则。
Enterprise-Project-Id 否 String 企业项目id。获取方式请参见:获取企业项目ID。 删除单个企业项目下实例,填写企业项目id。 不填时,默认删除企业项目id为0的企业项目下实例。 响应参数 无 请求示例 删除仪表盘id为2439f2c7--43eb--cd1b****8b2e的仪表盘
Enterprise-Project-Id 否 String 企业项目id。获取方式请参见:获取企业项目ID。 删除单个企业项目下实例,填写企业项目id。 不填时,默认删除企业项目id为0的企业项目下实例。 响应参数 无 请求示例 删除仪表盘分组 https://{Endpoint}/v2/{project
场景描述 本章以查询一个节点的CPU使用率时间序列为例。 涉及的基本信息 查询时间序列前,需要确定节点的ID和集群ID的值,节点ID值可以在ECS的dimensions中查看,集群ID值可以在CCE的“集群管理”页面,基本信息的dimensions中查看。 CPU使用率metric_
通过Debugging诊断代码 Debugging诊断概述 通过Debugging诊断线程 通过Debugging诊断方法 通过Debugging诊断对象 父主题: 监控组件性能指标
场景描述 本章以查询一个节点的CPU使用率时序数据为例。 涉及的基本信息 查询时序数据前,需要确定节点的ID和集群ID的值,节点ID值可以在ECS的dimensions中查看,集群ID值可以在CCE的“集群管理”页面,基本信息的dimensions中查看。 因指标格式统一,部分指标被
Forbidden 请求被拒绝访问。返回该状态码,表明请求能够到达服务端,且服务端能够理解用户请求,但是拒绝做更多的事情,因为该请求被设置为拒绝访问,建议直接修改该请求,不要重试该请求。 500 InternalServerError 表明服务端能被请求访问到,但是不能理解用户的请求。 503