检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
或者容器的所有其他告警。 约束与限制 如果在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,抑制对象(被源告警抑制的告警)将正常发送告警通知。 您最多可创建100条抑制规则,如果抑制规则数量已达上限100时,请删除不需要的抑制规则。 创建告警抑制规则 登录AOM 2
docker run --security-opt seccomp=unconfined XXX 如需配置更详细的系统调用控制,请参见https://docs.docker.com/engine/security/seccomp/。 Kubernetes环境:需要配置特权容器参数privileged:
描述 error_code String AOM.30001005 error_msg String 没有权限 请求示例 删除app https://{Endpoint}/v1/applications/{application_id} 响应示例 无 SDK代码示例 SDK代码示例如下。
access_code_id。 create_at Long 创建时间。 status String 状态。 请求示例 获取Prometheus实例调用凭证。 https://{Endpoint}/v1/{project_id}/access-code 响应示例 状态码: 200 OK 请求响应成功。 {
分组、avg by、max by、min by、sum by。例如,分组条件设置为:avg by clusterName,表示将指标按集群名称分组,然后将分组后的指标按平均值运算并展示在当前图表中。 检测规则 指标告警的检测规则,由统计方式(平均值、最小值、最大值、总计、样本个数
更多操作 标签新增完成后,您可以在标签列表中查看标签的名称、描述、更新时间和创建时间,还可执行表2中的操作。 表2 相关操作 操作 说明 修改标签 单击“操作”列的“编辑”。 删除标签 单击“操作”列的“删除”。 父主题: 应用资源管理
Content-Type 是 String 指定类型为application/json。 响应参数 无 请求示例 查询集群主机安装的ICAgent信息。 https://{Endpoint}/v1/{project_id}/{cluster_id}/{namespace}/agents 响应示例 状态码:
指标彼此独立,因此来自不同应用程序的指标不会被错误地聚合到相同的统计信息中。维度是指标的分类,每个指标都包含用于描述该指标的特定特征,可以将维度理解为这些特征的类别。图1以集群指标为例,介绍了命名空间、维度和指标的关系。 图1 集群指标 AOM的基础版和按需版所对应的指标存储时长及计费方式不同,详见收费详情。
应用资源管理概述 传统ITIL流程中面向基础设施资源的管理方式,易造成各运维服务之间数据割裂、信息不一致等问题。应用资源管理将所有资源对象与应用统一管理,为AOM和LTS、APM等运维服务提供准确、及时、一致的资源配置数据,并通过开放配置数据接口,辅助第三方系统运维场景建设。 约束与限制
参数类型 描述 error_code String AOM.30001005 error_msg String 没有权限 请求示例 创建组件 https://{Endpoint}/v1/components { "model_id" : "9616a75c75af4bcdacf38d77ff72a88e"
请求示例 删除project_id下prom_id为08****2a-8b-45-b1-d1******79的Prometheus实例。 https://{Endpoint}/v1/{project_id}/aom/prometheus?prom_id=08****2a-8**b-4
描述 error_code String AOM.30001005 error_msg String 没有权限 请求示例 查询组件详情 https://{Endpoint}/v1/components/application/{application_id}/name/{component_name}
分组、avg by、max by、min by、sum by。例如,分组条件设置为:avg by clusterName,表示将指标按集群名称分组,然后将分组后的指标按平均值运算并展示在当前图表中。 检测规则 指标告警的检测规则,由统计方式(平均值、最小值、最大值、总计、样本个数
的操作。 表1 相关操作 操作 说明 使用静态阈值模板创建一条批量阈值规则 单击“操作”列的“创建规则”,操作详见使用模板创建阈值规则。 修改静态阈值模板 单击“操作”列的“编辑”。 删除静态阈值模板 删除一个静态阈值模板:单击“操作”列的“删除”。 删除一个或多个静态阈值模板:
以自定义时间范围。 在过滤器上方的下拉列表中选择需要查看的应用。 单击事件卡片或列表进入该事件详情页面,查看事件的故障传播链。 故障传播链将展示调用链中的故障传播图谱,您可通过故障转播图谱定位根因。支持查看故障传播链的异常事件类型包括: 应用服务整体平均响应时间突增 TopN接口平均响应时间突增
短信。 图3 单条阈值规则 更多阈值规则操作 阈值规则创建完成后,您还可以执行表1中的操作。 表1 相关操作 操作 说明 修改阈值规则 单击“操作”列的“修改阈值”。 删除阈值规则 删除一个阈值规则:单击“操作”列的“删除”。 删除一个或多个阈值规则:选中一个或多个阈值规则前的复选框,单击页面上方的“删除”。
error_code String AOM.30001005 error_msg String 没有权限 请求示例 创建sub-app https://{Endpoint}/v1/sub-applications { "name" : "example1", "display_name"
描述 error_code String AOM.30001005 error_msg String 没有权限 请求示例 创建app https://{Endpoint}/v1/applications { "description" : "应用信息", "display_name"
毫秒(ms) flink_jobmanager_job_lastCheckpointSize 最新checkpoint的大小,如果启用了增量检查点或更改日志,则此度量可能与lastCheckpointFullSize不同。 字节(Byte) flink_jobmanager_job_num
表接口。 仪表盘 仪表盘相关API,包括查询,删除仪表盘等接口。 应用资源管理(仅适用AOM 2.0) 应用资源管理相关API,包括新增、修改、查询、删除应用等接口。 自动化运维(仅适用AOM 2.0) 自动化运维相关API,包括创建任务、快速创建执行脚本等接口。 自动化运维相关