检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
提供创建作业等功能,并支持对作业进行管理。 脚本管理 提供创建脚本等功能,并支持对脚本进行版本管理。 文件管理 提供创建文件包等功能,并支持对文件包进行版本管理。 设置 提供账号、访问凭证、场景分类管理功能。 工具市场 提供不同的原子服务场景,并且可以对各原子服务场景卡片进行上下架管理。 父主题: 运维管理
的指标、日志和性能数据。 部分支持 只支持指标数据和系统性能数据的可视化监控,不支持日志数据的监控。 支持 告警管理 对服务设置事件条件或者对资源的指标设置阈值条件,当AOM自身或外部服务存在异常或可能存在异常而产生告警时,将告警信息以邮件、短信、企业微信等方式发送给指定的人员。
此时需要打开“超额继续采集日志”开关。方法如下: 登录AOM控制台,在左侧导航栏中选择“配置管理 > 日志配置”,在“配置中心 > 配额设置”页签,将“超额继续采集日志”开关置于“开启”状态。 客户欠费后,为防止相关资源不被停止或者释放,需要客户及时进行充值,详细说明请参见:欠费还款。
下面以关键词统计为例,创建统计规则: 登录AOM控制台,在左侧导航栏中选择“日志 > 统计规则”。 单击右上角的“创建统计规则”,选择规则类型,设置规则名称、关键词,选择已创建的日志桶,单击“确认”,如下图所示。 统计规则以日志桶为单位, AOM会周期统计关键词在日志桶的日志文件中出现的条数,并生成日志指标。
应用运维管理服务提供了REST(Representational State Transfer)风格API,支持您通过HTTPS请求调用,调用方法请参见如何调用API。
403 Forbidden 请求被拒绝访问。 返回该状态码,表明请求能够到达服务端,且服务端能够理解用户请求,但是拒绝做更多的事情,因为该请求被设置为拒绝访问,建议直接修改该请求,不要重试该请求。 500 InternalServerError 表明服务端能被请求访问到,但是不能理解用户的请求。
用链查看微服务间调用关系。 管理APM探针启停状态 AOM支持管理APM探针启停的状态。 APM配置管理 AOM支持管理APM的访问密钥,设置Agent相关通用配置,以及查看探针的统计数量。 父主题: 应用监控
实例列表”。 在Prometheus实例列表中,单击目标CCE类型的Prometheus实例名称,进入该实例的详情界面。 在左侧导航栏单击“设置”,然后在“预聚合(Recording Rule)”区域单击“编辑RecordingRule.yaml”。 在弹出的对话框,删除默认模板并输入预聚合规则。
ut_vm表示扩容。 scale_in_k8s、scale_in_vm表示缩容。 scale_set_k8s、scale_set_vm表示设置应用实例个数。 含有k8s的表示容器应用,含有vm的表示进程应用。 parameters 是 参见表6 - 包含扩缩容的实例数 表6 parameters字段数据结构说明
域区分包括:华东、华南。按照DevOps流水线阶段区分包括:alpha,beta,gamma,product。 环境标签:环境标签是为环境设置的一个属性,多个环境可能具有相同的标签,通过标签可过滤显示需要的环境。同一个标签只能添加在本应用下的不同环境,不能跨应用添加。 资源绑定:
执行脚本任务失败,提示 :agent not found 问题现象 在ECS执行脚本任务时失败,系统提示“agent not found”。 可能原因 没有正确安装UniAgent。 UniAgent为非“运行中”状态。 解决方法 检查UniAgent的状态,UniAgent状态
服务场景 服务场景概述 启动ECS实例 关闭ECS实例 重启RDS实例 修改ECS非管理员密码 重启CCE工作负载 清理磁盘空间 父主题: 运维管理
云服务场景 云服务场景展现启动ECS实例、关闭ECS实例、重启RDS实例、修改ECS非管理员密码、重启CCE工作负载已上架的工具卡片。可以使用卡片快速创建任务,也可以对卡片进行收藏或下架操作,具体操作参见启动ECS实例、关闭ECS实例、重启RDS实例、修改ECS非管理员密码、重启CCE工作负载。
资源接入AOM 安装ICAgent(华为云主机) 安装ICAgent(非华为云主机) ICAgent版本说明 配置应用发现规则 配置日志采集路径
高危命令说明 高危命令指影响系统或服务的正常运行,或造成系统特殊文件被恶意删除或修改命令。自动化运维服务涉及的高危命令请参见表1。 表1 高危命令说明 高危命令名称 高危命令校验规则 样例 导致风险 vi /etc/xxx.xx command \\s*(vi|vim)\\s+/
计费云服务:除Modelarts/IotDA/IEF/CSE以外,其它云服务接入Prometheus实例后均会产生计费。 ECS场景 在ECS场景自建中间件,会产生计费。 在ECS场景安装Node Exporter,部分指标会产生计费。 其它可能场景 除几类基础指标以外,其它指标上报到AOM均可能产生计费。
场景描述 本章以查询一个节点的CPU使用率时间序列为例。 涉及的基本信息 查询时间序列前,需要确定节点的ID和集群ID的值,节点ID值可以在ECS的dimensions中查看,集群ID值可以在CCE的“集群管理”页面,基本信息的dimensions中查看。 CPU使用率metric_
场景描述 本章以查询一个节点的CPU使用率时序数据为例。 涉及的基本信息 查询时序数据前,需要确定节点的ID和集群ID的值,节点ID值可以在ECS的dimensions中查看,集群ID值可以在CCE的“集群管理”页面,基本信息的dimensions中查看。 因指标格式统一,部分指标被
"alarm", "resource_provider" : "ecs", "resource_type" : "vm", "resource_id" : "ecs123" , "key1" : "value1" // 创建告警规则时配置的告警标签
go_gc_duration_seconds 数据来自调用debug.ReadGCStats(),调用该函数时,会将传入参数GCStats结构体的PauseQuantile字段设置为5,这样函数将会返回最小、25%、50%、75% 和最大,这5个GC暂停时间百分位数。然后prometheus Go客户端根据返回的GC