-
OS账号 - 应用运维管理 AOM
管理不同类型的系统账号,用于执行脚本和文件管理。单用户支持最多创建100个账号。 创建账号 登录AOM 2.0控制台。 在左侧导航栏单击“自动化运维(日落)”,即可进入“自动化运维”界面。 在左侧导航栏中选择“设置 > OS账号”,进入账号管理页面。 单击右上角的“创建账号”,弹出创建账号页面。
-
入门实践 - 应用运维管理 AOM
入门实践 当您完成了安装ICAgent、配置服务发现规则等基本操作后,可以根据自身的业务需求使用应用运维管理提供的一系列常用实践。 表1 常用最佳实践 实践 描述 阈值告警最佳实践(新版) 告警作为AOM应用运维管理中一项基础功能,在日常运维中发挥着重要作用。AOM告警可以对接华
-
配置容器服务日志采集路径 - 应用运维管理 AOM
日志文件。 图3 查看容器服务日志文件 查看容器服务日志并进行分析 在左侧导航栏中选择“日志 > 日志搜索”,在“组件”页签中选择对应的集群与命名空间,选择某个组件及已配的文件名称,查看采集到的日志并进行分析。详细操作请参见搜索日志。 图4 查看容器服务日志并进行分析 父主题: 配置日志采集路径
-
产品优势 - 应用运维管理 AOM
据等多维度可观测性数据源。 全栈一体化监控 覆盖用户端、服务端及云产品所有监控数据,提供从数据发现、数据展示到数据异常告警的全方位、可视化监控服务,实现从上到下、从前端到后端的全栈一体化监控。 关联分析 应用和资源层层自动关联,通过应用、组件、实例、主机和事务等多视角下钻分析指标、日志、告警数据,直击异常。
-
策略和授权项说明 - 应用运维管理 AOM
如果您需要对您所拥有的AOM进行精细的权限管理,您可以使用统一身份认证服务(Identity and Access Management,简称IAM),如果华为账号所具备的权限功能已经能满足您的要求,您可以跳过本章节,不影响您使用AOM服务的其它功能。 默认情况下,新建的IAM用户没有任何权限,
-
管理接入规则 - 应用运维管理 AOM
和日志流。 当下拉框中没有可用的日志组或日志流时,需要单击“添加日志组”、“添加日志流”创建。创建日志流后,需选择所属的企业项目。 自动映射:自动将工作负载的日志接入到系统生成的同名日志流。 规则名称:自定义规则名称,只支持输入英文字母、数字、中划线、下划线以及小数点。 命名空间:在下拉框中选择已有命名空间。
-
获取告警行动规则列表 - 应用运维管理 AOM
Forbidden 请求被拒绝访问。返回该状态码,表明请求能够到达服务端,且服务端能够理解用户请求,但是拒绝做更多的事情,因为该请求被设置为拒绝访问,建议直接修改该请求,不要重试该请求。 500 InternalServerError 表明服务端能被请求访问到,但是不能理解用户的请求。 错误码 请参见错误码。
-
相关说明 - 应用运维管理 AOM
相关说明 标签和标注 普罗语句说明 时间范围和统计周期的关系
-
通过规则名称获取告警行动规则 - 应用运维管理 AOM
Forbidden 请求被拒绝访问。返回该状态码,表明请求能够到达服务端,且服务端能够理解用户请求,但是拒绝做更多的事情,因为该请求被设置为拒绝访问,建议直接修改该请求,不要重试该请求。 500 InternalServerError 表明服务端能被请求访问到,但是不能理解用户的请求。 错误码 请参见错误码。
-
应用示例 - 应用运维管理 AOM
应用示例 查询时间序列 查询时序数据 查询指定告警行动规则详细信息
-
升级ICAgent - 应用运维管理 AOM
其它升级失败场景,请直接登录节点使用安装命令重新安装ICAgent即可(覆盖式安装,无需卸载操作)。 父主题: ICAgent管理(华为云主机)
-
产品功能 - 应用运维管理 AOM
机上所发现的所有实例,显卡,网卡,磁盘,文件系统等信息。 应用自动发现 您在主机上部署应用后,在主机上安装的ICAgent将自动收集应用信息,包括进程名称,组件名称,容器名称,Kubernetes pod名称等,自动发现的应用在界面上以图形化方式展示,支持您自定义别名和分组对资源进行管理。
-
环境标签 - 应用运维管理 AOM
的节点,或输入关键字搜索后选择。 设置完成后,单击“确认”。 更多操作 标签新增完成后,您可以在标签列表中查看标签的名称、描述、更新时间和创建时间,还可执行表2中的操作。 表2 相关操作 操作 说明 修改标签 单击“操作”列的“编辑”。 删除标签 单击“操作”列的“删除”。 父主题:
-
创建分组规则 - 应用运维管理 AOM
通知。通常设置为秒级别的时间,便于告警合并后再发送,避免告警风暴。 取值范围:0s-10min,推荐设置为 15s。 变化等待 合并集合内的告警数据发生变化后,等待多久发送告警通知。通常设置为分钟级别的时间。如果您需要尽快收到告警通知,也可设置为秒级时间。 此处的变化是指新增告警或告警状态改变。
-
创建统计规则 - 应用运维管理 AOM
当需要查看更详细的指标数据时,可双击缩略图以对其进行放大。放大后,可在界面上方设置时间范围和统计周期,查看不同时间范围和统计周期下的指标数据。还可在界面上方单击“添加阈值规则”,对该指标添加阈值规则,当满足阈值条件时产生阈值告警,以便您能在第一时间发现异常并进行处理。 图2 方式一 方式二:在“指标监控”界面查看指标数据,如图3所示。
-
监控 - 应用运维管理 AOM
ata aom:metric:get √ × 添加或修改服务发现规则 PUT /v1/{project_id}/inv/servicediscoveryrules aom:discoveryRule:set √ × 删除服务发现规则 DELETE /v1/{project_id}
-
产品优势 - 应用运维管理 AOM
一键接入各种应用组件及告警工具。 低成本 多种指标免费用,覆盖Kubernetes标准组件。 提供全托管式服务,无需另购资源,可降低监控成本,且维护成本几乎为零。 与CCE集成并提供监控服务,容器监控体系创建时间从2天降低至10分钟。一个Prometheus For CCE实例可以上报多个CCE集群数据。
-
升级ICAgent - 应用运维管理 AOM
t预计需要1分钟左右,请耐心等待。待ICAgent的状态由“升级中”变为“运行”时,表示升级成功。 父主题: ICAgent管理(非华为云主机)
-
查询指标类或者事件类告警规则列表 - 应用运维管理 AOM
更多编程语言的SDK代码示例,请参见API Explorer的代码示例页签,可生成自动对应的SDK代码示例。 状态码 状态码 描述 200 OK 请求响应成功。 500 InternalServerError 表明服务端能被请求访问到,但是不能理解用户的请求。 错误码 请参见错误码。 父主题:
-
查询事件类告警规则列表 - 应用运维管理 AOM
Forbidden 请求被拒绝访问。返回该状态码,表明请求能够到达服务端,且服务端能够理解用户请求,但是拒绝做更多的事情,因为该请求被设置为拒绝访问,建议直接修改该请求,不要重试该请求。 500 InternalServerError 表明服务端能被请求访问到,但是不能理解用户的请求。 错误码 请参见错误码。