检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
欠费说明 用户在使用云服务时,账户的可用额度小于待结算的账单,即被判定为账户欠费。欠费后,可能会影响云服务资源的正常运行,请及时充值。 欠费原因 按需计费模式下,您的账户的余额不足会导致欠费。 欠费影响 当您的账号因AOM按需资源自动扣费导致欠费后,账号将变成欠费状态。欠费后,按
时数据查询等接口。 日志 日志相关API,包括查询日志接口。 Prometheus实例 Prometheus实例相关API,包括新增、查询Prometheus实例、卸载托管Prometheus实例等接口。 配置管理 配置相关API,包括查询aom2.0相关云服务授权信息和查询集群主机安装的ICAgent信息接口。
本功能当前在华北-北京一、华北-北京四、华东-上海一、华东-上海二、华南-广州、西南-贵阳一、中国-香港、华南-深圳、华南-广州-友好用户环境、华北-乌兰察布一、亚太-曼谷和亚太-新加坡区域开放,如有需求可以通过提交工单,联系工程师为您开放此功能。 父主题: 告警行动规则
场景分类 在场景分类页面自动化运维已定义了服务场景的类型,具体如下: 故障处理 日常巡检 软件部署 云服务场景 通用场景 父主题: 设置
概述 AOM提供告警行动规则定制功能,您可以通过创建告警行动规则关联SMN主题与消息模板,通过创建消息模板,自定义通知消息配置。告警行动规则创建成功后,可在“告警管理 > 告警降噪 > 分组规则”中“创建分组规则”关联行动规则。 创建告警行动规则 创建消息模板 父主题: 告警行动规则
标准输出配置 通过添加指定采集容器标准输出标签,用户可以指定采集pod下的对应容器名的标准输出日志。用户在pod的yaml中spec:template:metadata:annotations:字段增加以下字段来实现指定要采集的容器名称。 kubernetes.AOM.log.stdout:
告警行动规则 概述 创建告警行动规则 创建消息模板 父主题: 告警管理
Prometheus instances. prometheus实例数量超限。 请检查对应的参数是否符合要求。 400 AOM.11017013 The Prometheus instance ID is empty. 普罗实例id为空。 请检查对应的参数是否符合要求。 400 AOM
告警管理使用说明 告警是指AOM自身或外部服务在异常情况、可能导致异常情况下上报的信息,并且您需采取相应措施清除故障,否则会由于AOM自身或外部服务的功能异常而引起业务的异常。 告警管理使用前提条件:已在主机安装UniAgent,详情请参考“安装UniAgent”,安装之后使用流程请参见图1。
Debugging诊断 概述 线程分析 方法分析 对象分析 父主题: 组件列表
时间范围和统计周期的关系 AOM约束单个指标单次查询最大返回1440个数据点,因此统计周期与时间范围的关系如下所示: 最大可查询时间范围=统计周期×1440 当您选中的查询时间范围小于等于最大可查询时间范围时,所有满足以上条件的统计周期可以被选择。例如,查询1小时的指标时,可选的统计周期为1分钟和5分钟。
AOM服务提供了多种可靠性容灾能力,可以通过AZ内实例容灾、多AZ容灾、多集群容灾、数据多副本等技术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。 多AZ容灾
Profiler性能分析 概述 Profiler开启 性能分析 对比 快照列表 建议 父主题: 组件列表
APM指标数据未采集上来,可能有哪些原因? 如果APM探针刚接入,可以稍微等待几分钟后,就能看到数据。 如果显示数据采集被停止,可能的原因有: 实例级别停止,APM探针管理中采集被停止。 监控项级别停止,监控项状态列表某些监控项采集被人为停止。 APM控制台的“全局配置(系统管理
联系技术支持工程师。 执行以下命令,检查用户侧节点时间。 date 若查询到的用户侧节点时间和所在时区当前时间一致 => 请联系技术支持工程师。 若查询到的用户侧节点时间和所在时区当前时间不一致 => 执行 4 执行以下命令,重新配置用户侧节点时间。 date -s 所在时区当前时间(例如12:34:56)
应用管理的使用说明 应用管理用于管理云服务对象与应用之间的关系,遵循“应用 + 子应用(可选)+ 组件 + 环境”的应用管理模型,主要用于管理ECS、RDS和ELB等云服务资源。 创建应用 添加节点 添加环境 关联资源 图1 应用管理模型 父主题: 应用管理
AOM服务提供了多种可靠性容灾能力,可以通过AZ内实例容灾、多AZ容灾、多集群容灾、数据多副本等技术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。 多AZ容灾
onds_total 写入花费的总时长 node_nf_conntrack_entries 链接状态跟踪表分配的数量 node_nf_conntrack_entries_limit 链接状态跟踪表总量 node_processes_max_processes PID限制值 node_processes_pids
自动化运维自定义策略样例 示例:拒绝用户对服务卡片进行上下架操作 拒绝策略需要同时配合其他策略使用,否则没有实际作用。用户被授予的策略中,一个授权项的作用如果同时存在Allow和Deny,则遵循Deny优先。 如果您给用户授予CMS FullAccess的系统策略,但不希望用户拥有CMS Full
统计租户在当前实例/资源空间下的在线的设备数量 ≥0 个 iotda_device_status_totalCount 设备总数 统计租户在当前实例/资源空间下的总的设备数量 ≥0 个 iotda_device_status_offlineCount 离线设备数 统计租户在当前实例/资源空间下的离线的设备数量