检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
选择“接入 > 接入中心 ”,单击右上角“返回旧版”按钮。 创建主机组(IP地址) 登录AOM 2.0控制台。 在左侧导航栏选择“设置 > 采集设置 > 主机组管理”,单击右上角“新建主机组”。 在弹出的新建主机组页面,输入“主机组名称”,主机组类型选择IP,主机类型选择“Linux主机”。
选择待操作的仪表盘,在对应“仪表盘”页面右上角单击。 在弹出的对话框中设置全屏模式在线时长。具体的参数说明请参见表1。 图1 设置在线时长 表1 在线时长参数说明 参数名称 说明 设置方式 在线时长的设置方式,包括以下两种: 自定义在线时长:自定义设置固定时长后,自动退出到登录界面。 持续在线:表示不
均值>0.5”,“触发条件”设置为“连续周期 3”,“告警级别”设置为,表示监控对象连续3个周期平均值大于0.5时,生成紧急告警。 图3 设置告警规则详情 单击“高级设置”,设置检查频率、告警恢复等信息。本示例可保持系统默认设置。 设置告警通知策略。告警通知策略有两种方式,如图4所示,此处选择直接告警方式。
当icagent_install_flag设置为true:如果plugin_install_base_param取值为空,默认安装最新版本ICAgent插件;如果plugin_install_base_param传入指定版本,则安装指定版本的ICAgent插件。 当icagent_install_flag设置为fa
告警行动规则 告警行动规则定义产生告警之后,按照规则做何种动作。包括消息发送到哪里和以什么形式发送。消息发送到哪里通过华为云服务SMN主题设置。 Prometheus实例 Prometheus监控功能提供的管理Prometheus数据采集和数据存储分析的逻辑单元。 Prometheus探针
踪。 相关配置请参见查看组件调用链监控项。 组件设置 组件设置支持自定义设置(关联日志服务设置、Profiler性能剖析设置、组件与基础设施关联分析设置,全采样设置。)、管理APM探针启停状态、查看或启停监控项。 相关配置请参见设置组件监控开关。 父主题: 监控组件性能指标
AOM最佳实践汇总 本文汇总了应用运维管理(AOM,Application Operations Management)常见应用场景的操作实践,为每个实践提供详细的方案描述和操作指导,帮助用户轻松使用AOM。 表1 AOM 最佳实践一览表 最佳实践 说明 通过AOM告警分组规则清除ELB告警风暴
企业项目 所属的企业项目。 如果在全局页面设置为“ALL”,此处请从下拉列表中选择企业项目。 如果在全局页面已选择企业项目,则此处灰化不可选。 实例类型 Prometheus实例的类型,此处选择“Prometheus for 云服务”。 设置完成,单击“确定”。 配置云服务接入AOM
应用名称 应用显示的名称,不能为空。 支持输入1~128个字符,只能包含数字、字母、下划线、中划线、并且以英文字母开头。 应用别名 应用的别名。设置应用别名后应用名称优先展示应用别名。 支持输入1~128个字符,只能包含数字、字母、中文、下划线、中划线、括号以及小数点。 企业项目 在下
在左侧导航栏选择“Prometheus监控 > 实例列表”,在实例列表中单击目标Prometheus实例的实例名称,进入Prometheus实例详情页面。 在左侧导航栏选择“设置”,在“服务地址”区域的的“内网”或“公网”页签中,单击右侧复制Remote Read Prometheus配置代码。 remote_read:
接入云服务前,需要先为云服务选择所属的企业项目。如果事先已在全局页面选择具体的企业项目,此处无需再设置。如果在全局页面设置为“全部企业项目”,请从下拉列表中选择。 图1 查看云服务信息 在云服务实例列表右上角可设置筛选条件或按实例名称、ID等设置搜索条件,实现云服务实例过滤显示。 单击右上角的,可实时获取到该云服务全部实例的最新信息。
取值范围说明: 告警级别:指标或事件告警的级别,可以设置为:紧急、重要、次要、提示。例如设置为:告警级别+等于+紧急。 资源类型:创建告警规则或自定义上报告警时选定的资源类型。可以设置为:host、container、process等类型。例如设置为:资源类型+等于+container。
配置作业管理 如需设置审批配置、执行策略,可展开“更多设置”进行配置,配置参数如表5。 表5 更多设置 参数类别 参数名称 说明 审批配置 人工审核 选择是否开启人工审核开关,默认不允许更改。如需更改,系统默认的服务场景请前往工具市场对原子卡片进行设置。作业执行方案需前往作业中设置,文件管
取值范围说明: 告警级别:指标或事件告警的级别,可以设置为:紧急、重要、次要、提示。例如设置为:告警级别+等于+紧急。 资源类型:创建告警规则或自定义上报告警时选定的资源类型。可以设置为:host、container、process等类型。例如设置为:资源类型+等于+container。
指标监控的维度,根据用户设置的普罗语句自动生成。 持续时长 连续多长时间满足告警条件后,触发指标告警。包括:立即、15秒、30秒、1分钟、2分钟、5分钟、10分钟。例如,设置持续时长为“2分钟”,则表示连续2分钟满足默认规则的条件,触发指标告警。 高级设置 检查频率 根据设置的频率对指标数据查询和分析结果进行检查。
务,具体见警告提示框的“引用详情”。 上架卡片 单击卡片右上角的并选择“上架”,上架后可在服务场景中使用。 设置卡片 单击卡片右上角的并选择“设置”,可以对该卡片任务设置审批配置和执行策略。 审批配置 选择是否开启人工审核开关,默认不打开。 开启人工审核后,需要选择审批人。 审批通知方式当前支持邮件和短信2种方式。
服务”下方查找并选择AOM的云服务,并且勾选“创建内网域名”,选择终端节点所在的虚拟私有云和子网,其他参数默认设置,更多操作请参考购买终端节点。 图1 购买终端节点 设置完成后,单击“立即购买”。购买成功后,即可完成AOM终端节点的创建。 重复上面步骤,需要再购买1个终端节点,选
告警的XX参数的值。例如设置为:资源类型+正则+host*,表示筛选出metedata字段中资源类型的值包含host字样的告警。 设置规则说明: 分组条件最多可设置10个并行条件,每个并行条件下最多可设置10个串行条件,每个并行条件下可设置一个或多个告警行动规则。 多个串行条件之
登录AOM控制台,在左侧导航栏中选择“告警 > 告警规则”,单击右上角的“添加告警”。 自定义阈值规则。 设置规则的基本信息:在“规则名称”文本框中输入阈值规则名称,并根据需要填写规则的描述信息。 设置阈值规则的详细信息。 设置“规则类型”为“阈值规则”。 选择监控对象。通过以下两种方式选择: 选择资源对象
单击“新建告警行动规则”添加。设置告警行动规则的操作详见创建告警行动规则。 启用告警行动规则后,需要设置是否开启告警恢复通知。开启告警恢复通知后,当满足“高级设置-告警恢复”中设置的告警恢复条件,则按照选择的告警行动规则发送告警恢复通知。 图6 设置直接告警方式 告警降噪:对告警