检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
安装&升级插件、手动安装和远程安装任务提交后,即可在“任务中心”页面的“Agent维护”页签查看。 对于Agent升级的任务,若“任务状态”为“成功”,可通过操作列的“回退”将当前的任务插件将回退到原版本;若“任务状态”为“超时”,可通过操作列的“重试”重新执行该任务。 图4 Agent维护
告警通知系统模板更新记录 云监控服务930版本将短信告警通知系统模板中的告警信息进行了修改,具体变更信息如表1 短信-指标系统通知模板、表2 短信-系统事件系统通知模板和表3 短信-自定义事件系统通知模板所示: 表1 短信-指标系统通知模板 信息 变更操作 告警恢复状态 新增 跳转连接 新增
MAX_VALUE],Number.MAX_VALUE值为1.7976931348623157e+108。具体阈值取值请参见附录中各服务监控指标中取值范围,如支持监控的服务列表中ECS的CPU使用率cpu_util取值范围可配置80。 unit 否 String 数据的单位,最大长度为32位。
直接触发。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击左侧导航栏的“告警 > 一键告警”,进入一键告警界面。 单击需要开启的云服务资源所在行右侧的一键告警开关,开启一键告警。 图1 开启一键告警 单击一键告警左侧的下拉按钮,可查看、修改或重置已开启的告警规则。
Notification objects 告警触发的动作 ok_notifications 否 Array of Notification objects 告警恢复触发的动作 notification_begin_time 否 String 告警通知开启时间 notification_end_time
n内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。Region分为通用Region和专属Region,通用Region指面向公共租户提供通用云服务的Region;专属Region指只承载同一类业务或只面向特定租户提供业务服务的专用Region。 详情请参见区域和可用区。
告警规则适用的告警类型,可选择指标或者事件告警。 指标 资源类型 配置告警规则监控的服务名称。 弹性云服务器 维度 用于指定告警规则对应指标的维度名称 云服务器 监控范围 告警规则适用的资源范围。 指定资源 监控对象 监控对象为当前选择的弹性云服务器,无需配置。 - 触发规则 自定义创建:当告警类型选择事
到客户服务站点的访问情况。 当前支持的监控类型:HTTP、HTTPS、PING、TCP、UDP。 应用场景 广域网质量监控主要用于发送模拟真实用户对远端服务器的访问,从而探测远端服务器的可用性、连通性等问题。 服务可用性监控 通过使用广域网功能配置定时HTTP(S)拨测任务,选择
namespace String 查询服务的命名空间,各服务命名空间请参考支持监控的服务列表。 dimensions Array of objects 指标维度列表。 详细参数请参见表4。 metric_name String 指标ID,例如弹性云服务器的监控指标CPU使用率,对应的m
创建/修改/删除通知策略 通知策略能够配置分级和排班策略,能够在策略中配置接收对象和通知内容模板。 创建通知策略 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击“告警 > 告警通知”,进入告警通知界面。 在“通知策略”页签,单击“创建通知策略”,根据界面提示配置参数。 图1 创建通知策略
告警规则的功能。告警模板关联资源分组后将生成相应告警规则,告警规则中的策略会随模板同步修改。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 选择“告警 > 告警模板”,进入告警模板界面。 单击“自定义告警模板”页签。 在“自定义告警模板”界面,单击告警模板所在行的“关联到分组”。
执行以下命令,即可卸载Agent。 bash /usr/local/uniagent/script/uninstall.sh 用户可手动卸载Agent插件,卸载后云监控服务将不再主动采集主机的监控数据。如需再次使用,请参考操作步骤或操作步骤重新安装。 查看Agent状态(老版本) 以root用户登录ECS或B
监控维度名称,例如弹性云服务器的维度为instance_id。各服务维度请参考支持监控的服务列表,可参考维度中key字段。 必须以字母开头,只能包含0-9/a-z/A-Z/_/-,长度最短为1,最大为32。 value 是 String 维度取值,例如弹性云服务器的ID。 必须以字母
取值样例 告警类型 告警规则适用的告警类型,可选择指标或者事件告警。 指标 资源类型 配置告警规则监控的服务名称。 弹性云服务器 维度 用于指定告警规则对应指标的维度名称。 云服务器 监控范围 告警规则适用的资源范围,可选择全部资源、资源分组或指定资源。 说明: 选择“全部资源”时
SMNAction objects 告警触发的动作 ok_notifications 否 Array of SMNAction objects 告警恢复触发的动作 notification_begin_time 否 String 告警通知开启时间 notification_end_time
namespace String 查询服务的命名空间,各服务命名空间请参考支持监控的服务列表。 dimensions Array of objects 指标维度列表。 详细参数请参见表7。 metric_name String 指标ID,例如弹性云服务器的监控指标CPU使用率,对应的m
Z/_,字符长度最短为1,最大为64;如:弹性云服务器中的监控指标cpu_util,表示弹性服务器的CPU使用率;文档数据库中的指标mongo001_command_ps,表示command执行频率;各服务的指标名称可查看:“服务指标名称”。 period 是 Integer 指标周期,单位是秒;
返回“0”,表示未安装Agent。 问题分析 弹性云服务器或裸金属服务器安装Agent后仍然无操作系统监控数据时,一般考虑有如下几个原因: Agent进程运行状态异常 委托异常 网络问题 问题解决(Linux) 以root用户登录弹性云服务器或裸金属服务器。 执行如下命令,检查telescope进程是否存在:
SMNAction objects 告警触发的动作 ok_notifications 否 Array of SMNAction objects 告警恢复触发的动作 notification_begin_time 否 String 告警通知开启时间 notification_end_time
Agent状态切换或监控面板有断点该如何处理? 问题现象 当云监控服务的Agent进程出现以下现象时,可能是因为Agent负载过高,状态不稳定导致: 管理控制台主机监控页面的“插件状态”参数在“运行中”和“故障”两个状态切换。 监控指标面板中存在断点。 约束与限制 当前章节的修复