检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
String 错误码。 error_msg String 错误信息。 最小长度:0 最大长度:1024 请求示例 查询agent列表信息 https://{Endpoint}/v1/uniagent-console/agent-list/all { "page" : 1, "page_size"
在左侧导航栏中选择“日志分析 > 日志转储”。 使用日志分析(新版)功能的区域可以通过表2中描述的入口进入“日志路径”页面。 单击右上角的“添加日志转储”,参考表1设置相关参数后,单击“确定”。 表1 周期性转储参数说明 参数 说明 示例 转储方式 请选择周期性转储。 周期性转储 筛选条件 可按照日志类型
执行以下命令,检查ICAgent是否可成功上报指标。 cat /var/ICAgent/oss.icAgent.trace | grep httpsend | grep MONITOR 若回显信息中包含“failed”字样,则说明ICAgent无法成功上报指标 => 执行3。 若回显
安装文件包提示没有OBS权限。 可能原因 自动化运维需要访问凭证授权访问OBS,用来获取OBS中的文件包。 解决方法 请在左侧导航栏单击“自动化运维(日落)”,进入“设置 > 访问凭证”页面,检查是否已创建访问凭证,如果没有创建访问凭证,请新建访问凭证。 父主题: 运维管理(即将下线)
告警行动规则 告警行动规则定义产生告警之后,按照规则做何种动作。包括消息发送到哪里和以什么形式发送。消息发送到哪里通过华为云服务SMN主题设置。 Prometheus实例 Prometheus监控功能提供的管理Prometheus数据采集和数据存储分析的逻辑单元。 Prometheus探针
最大长度:100 trace_id String 响应id。 最小长度:12 最大长度:12 请求示例 删除名称为1112222的告警行动规则 https://{Endpoint}/v2/{project_id}/alert/action-rules [ "1112222" ] 响应示例
最大长度:100 trace_id String 响应id。 最小长度:12 最大长度:12 请求示例 删除名称为"1112222"的静默规则 https://{Endpoint}/v2/{project_id}/alert/mute-rules [ { "name" : "1112222"
最大值、总计、样本个数。 统计时段 指标数据按照所设置的时间范围进行聚合。设置时间范围的方式包括:近30分钟、近1小时、近6小时、近1天、近1周、自定义时间段。 如果您使用的是新版仪表盘,设置时间的方式包括:相对时间、整点时间、自定义。 相对时间:表示查询距离当前时间1分钟、5分
批量安装的ECS需和已安装成功的节点保持网络互通,scp、ssh命令可用。 如果已安装的服务器使用了委托方式安装,其它批量安装的节点也需要设置委托。 批量安装脚本依赖python版本,建议在python3.x版本的机器上执行此操作。 iplist.cfg文件中每一行应以回车作为结尾。
执行指标采集任务的超时时间,单位为秒(s),默认为60s,可选择10、30和60。超时时间必须小于或等于采集周期。 执行用户 执行指标接入规则的用户,即所选主机组的用户。默认设置为root。 其他配置 自定义键值对维度 以键值对形式添加静态维度,用于标识指标的附加属性。单击“添加标签”可配置多个自定义键值对维度。
取值范围说明: 告警级别:指标或事件告警的级别,可以设置为:紧急、重要、次要、提示。例如设置为:告警级别+等于+紧急。 资源类型:创建告警规则或自定义上报告警时选定的资源类型。可以设置为:host、container、process等类型。例如设置为:资源类型+等于+container。
取值范围大于0并且大于等于(endTimeInMillis - startTimeInMillis) / (60 * 1000) - 1。当开始时间与结束时间都设置为-1时,系统会将结束时间设置为当前时间UTC毫秒值,并按(endTimeInMillis - durationInMinutes * 60 * 1000)计算开始时间。如:-1
在左侧导航栏中选择“资源管理”,在右侧区域单击任一资源页签,即可在下方资源列表区域查看该资源所有实例的名称、项目、环境等信息。 在资源列表上方设置过滤条件,可实现资源列表过滤显示。 单击右上角的,可实时获取到所有资源实例的最新信息。 单击右上角的,通过选中/取消选中各展示项前的复选框,自定义其展示/隐藏。
单击“新建告警行动规则”添加。设置告警行动规则的操作详见创建告警行动规则。 启用告警行动规则后,需要设置是否开启告警恢复通知。开启告警恢复通知后,当满足“高级设置-告警恢复”中设置的告警恢复条件,则按照选择的告警行动规则发送告警恢复通知。 图6 设置直接告警方式 告警降噪:对告警
均值>0.5”,“触发条件”设置为“连续周期 3”,“告警级别”设置为,表示监控对象连续3个周期平均值大于0.5时,生成紧急告警。 图3 设置告警规则详情 单击“高级设置”,设置检查频率、告警恢复等信息。本示例可保持系统默认设置。 设置告警通知策略。告警通知策略有两种方式,如图4所示,此处选择直接告警方式。
”,“-”,“(”,“)”。 最多可添加10个指标维度。例如:维度名为label1,维度值为label2,则添加成功后为label1:"label2"。 高级设置 配置如下采集信息: 采集周期(秒):采集数据的周期,单位为秒(s),默认为60s,可选择10s、30s和60s。 超时时间(秒):执行采
告警的XX参数的值。例如设置为:资源类型+正则+host*,表示筛选出metedata字段中资源类型的值包含host字样的告警。 设置规则说明: 分组条件最多可设置10个并行条件,每个并行条件下最多可设置10个串行条件,每个并行条件下可设置一个或多个告警行动规则。 多个串行条件之
”,“-”,“(”,“)”。 最多可添加10个指标维度。例如:维度名为label1,维度值为label2,则添加成功后为label1:"label2"。 高级设置 配置如下采集信息: 采集周期(秒):采集数据的周期,单位为秒(s),默认为60s,可选择10s、30s和60s。 超时时间(秒):执行采
标,可以按如下方案设置: 告警条件a的指标设置为“aom_node_cpu_used_core”,其余参数采用默认设置。该指标用于统计测量对象已经使用的CPU核个数。 告警条件b的指标设置为“aom_node_cpu_limit_core”,其余参数采用默认设置。该指标用于统计测量对象申请的CPU核总量。
分组规则的描述。最多不能超过1024个字符。 告警分组规则 分组条件 根据设置的条件对告警过滤,筛选出符合分组条件的告警,并为符合分组条件的告警设置告警行动规则。 分组条件最多可设置10个并行条件,每个并行条件下最多可设置10个串行条件,每个并行条件下可设置一个或多个告警行动规则。 多个串行条件之间是“和