检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
container_fs_inodes_free 文件系统的可用inode数量 container_fs_usage_bytes 文件系统的使用量 container_fs_inodes_total 文件系统的总计inode数量 container_fs_io_current 磁盘/文件系统当前正在进行的 I/O
and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"] projectId = "{project_id}"
_bytes 挂载的文件系统占用空间 node_filesystem_readonly 只读挂载的文件系统 node_filesystem_free_bytes 挂载的文件系统剩余空间 node_filesystem_avail_bytes 挂载的文件系统可用空间 node_cpu_seconds_total
此模块只作用于消息通知部分,所有触发的告警和事件都可在告警、事件页面查看。 告警降噪中所有的规则条件均取自告警结构体中的"metadata"字段,可采用系统默认字段,也可根据需要自定义字段。 { "starts_at" : 1579420868000, "ends_at" :
设置告警通知策略。告警通知策略有两种方式,请根据需要选择: 直接告警:满足告警条件,直接发送告警。 需要设置是否启用告警行动规则。启用后,系统根据关联SMN主题与消息模板来发送告警通知。如果现有的告警行动规则无法满足需要,可单击“新建告警行动规则”添加。设置告警行动规则的操作详见创建告警行动规则。
资源分组 AOM支持按企业项目以及资源细粒度对资源进行分类管理,帮助用户快速管理和使用资源。 资源分组最多可以创建100个。 创建资源分组 在左侧导航栏中选择“资源分组”,可查看资源分组的信息。 单击右上角的“创建资源分组”。 根据界面提示配置参数,具体如表1所示。 表1 配置参数
行。 主机监控的设计类似应用监控,主机的层级关系为:主机列表->主机详情。详情页面包含了当前主机上所发现的所有实例,显卡,网卡,磁盘,文件系统等信息。 应用自动发现 您在主机上部署应用后,在主机上安装的ICAgent将自动收集应用信息,包括进程名称,组件名称,容器名称,Kubernetes
用,如果已被引用,需先删除被引用场景,才能下架服务,具体见警告提示框的“引用详情”。 下架后服务场景页面将不展示该卡片,并且在工具市场页面系统默认的卡片会同步下架,作业方案卡片对应的执行方案发布状态更新为未发布。 下架服务卡片后 ,服务卡片关联的任务将不能再次执行,待卡片重新上架后,关联的任务将恢复执行功能。
个云服务下的多个指标批量创建阈值告警规则、事件告警规则和PromQL告警规则。 约束与限制 系统支持创建的指标告警规则、事件告警规则、应用性能监控告警规则总计不能超过3000条。如果系统中的告警规则数量已达到上限,请删除不需要的告警规则后重新创建。 父主题: 配置AOM告警规则
Balance,简称ELB)是将访问流量根据转发策略分发到后端多台云服务器流量分发控制服务。弹性负载均衡可以通过流量分发扩展应用系统对外的服务能力,通过消除单点故障提升应用系统的可用性。 当您开通了ELB后,无需额外安装其他插件,即可在AOM界面监控ELB的运行状态及各种指标。 分布式缓存服务
ity}_${event_type}_${clear_type}]于${starts_at}时间发生告警\",\"content\":\"华为云账号:${domain_name};\\n通知类型:${event_type};\\n事件级别:${event_severity};\\
通常来源于组件性能图表或接口性能数据。 接口调用次数、请求平均时延、错误调用次数、请求吞吐量等 接入应用层指标 中间件指标 通常来源于原生中间件或云中间件数据。 文件系统容量、文件系统使用率等 接入中间件指标 基础设施层指标 通常来源于容器或云服务相关数据,例如计算、存储、网络、数据库等。 CPU使用率、内存使用率、健康状态等
IEF、Web应用防火墙 WAF、云堡垒机 CBH、消息通知服务 SMN、内容分发网络 CDN 指标 云服务接入AOM 开源监控系统接入 Prometheus通用实例 指标 开源监控系统接入AOM Prometheus API/SDK接入 应用运维管理AOM API 指标 通过API接入相关的指标数据。
管理AOM告警规则 告警规则创建完成后,可在“规则列表”中查看告警规则的规则名称、类型、状态、监控对象等信息,并可根据需要修改、启动或停止告警规则。 管理指标或事件告警规则 管理日志告警规则 管理云监控告警规则 约束与限制 当前仅华南-广州区域“告警管理”菜单名称更名为“告警中心
应用资源管理 “√”表示支持,“x”表示暂不支持。 表1 应用资源管理 权限 对应API接口 授权项 IAM项目(Project) 企业项目(Enterprise Project) 新增应用 POST /v1/applications aom:cmdbApplication:create
SASL_SSL参数 参数 说明 示例 用户名 SASL用户名用于实例访问认证。 demo 密码 SASL密码用于实例访问认证,请妥善管理密码,系统无法获取您设置的密码内容。 - 客户端证书 请采用.pem格式的客户端证书 - 单击“验证并保存自定义Kafka配置信息”,验证自定义Kafka实例连通性。
分钟内组件CPU&内存使用率的值。 趋势图上方的值为所选组件下监控的最新时间点CPU&内存使用率的值。 在卡片左下角通过勾选“隐藏系统组件”可隐藏系统组件。 集群监控(磁盘)卡片 图5 集群监控(磁盘) 此卡片主要展示了3种信息: 统计最新时间前1分钟内的集群的磁盘使用率在TOP5的集群信息。
参数名称 说明 任务名称 自定义任务名称。 最多可输入64个字符,只能由大小写字母、数字、下划线、中划线以及中文字符组成。默认勾选“自动命名”,系统将自动生成任务名称。 企业项目 选择所属的企业项目。 选择实例。 单击“添加资源”,弹出选择实例页面。单个任务最多支持选择100个实例。
日志时间:当日志格式选择“单行日志”时,需要选择每条日志的行首显示的是日志的采集时间(选择“系统时间”),还是日志的打印时间(选择“时间通配符”)。 日志采集时间:ICAgent采集日志,并且发送到云日志服务的时间。 日志打印时间:系统产生并打印日志的时间。 时间通配符:用日志打印时间来标识一条日志数据
机器IP。 port 是 Integer 机器登录端口,默认22。 account 是 String 机器ssh账号。 os_type 是 String 机器操作系统类型。 vpc_id 否 String 机器所属VPC ID。 coc_cmdb_id 否 String 外来唯一标识,COC用。