检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
图4 主机状态图表 组件状态图表:实时监控组件的状态。 图5 组件状态图表 资源TopN图表 资源TopN图表的统计单位为集群,统计对象为集群下的资源(这里的资源指主机、组件和实例)。资源TopN图表可视化地展示了集群中资源占用最高的N个资源,支持资源Top5、Top15数据的汇报展
0产生的日志转储到“日志采集日期(格式为YYYY-MM-DD) > 00”路径下对应的日志文件中,每天03:00~06:00产生的日志转储到“日志采集日期(格式为YYYY-MM-DD) > 03”路径下对应的日志文件中,其他时间段以此类推。 3小时 目标OBS桶 存储日志的OBS桶。
据源。 全栈一体化监控 覆盖用户端、服务端及云产品所有监控数据,提供从数据发现、数据展示到数据异常告警的全方位、可视化监控服务,实现从上到下、从前端到后端的全栈一体化监控。 关联分析 应用和资源层层自动关联,通过应用、组件、实例、主机和事务等多视角下钻分析指标、日志、告警数据,直击异常。
etheus实例中,实现远程存储。 预聚合 通过配置预聚合规则将计算过程提前到写入端,可减少查询端资源占用,尤其在大规模集群和复杂业务场景下可以有效的降低PromQL的复杂度,从而提高查询性能,解决用户配置以及查询慢的问题。 当前仅Prometheus for CCE 实例支持。
在左侧导航栏中选择“接入中心”。 当前仅华北-北京四、华东-上海一区域菜单路径为:“接入 > 接入中心”。 在右侧“应用层”面板单击“Java”卡片。 在“基础信息”下选择“区域”和“应用”。 如果现有的应用无法满足需要,可以单击“创建应用”添加,详细参数说明请参见表1。 图1 基础信息 表1 创建应用参数说明
0产生的日志转储到“日志采集日期(格式为YYYY-MM-DD) > 00”路径下对应的日志文件中,每天03:00~06:00产生的日志转储到“日志采集日期(格式为YYYY-MM-DD) > 03”路径下对应的日志文件中,其他时间段以此类推。 3小时 目标OBS桶 存储日志的OBS桶。
当您已有服务器安装过ICAgent,且该服务器“/opt/ICAgent/”路径下ICAgent安装包ICProbeAgent.zip存在,通过该方式可对多个远端服务器进行一键式继承批量卸载。 批量卸载的ECS需同属一个VPC下,并在同一个网段中。 前提条件 已收集需要卸载Agent的所有虚拟机IP、密码,按照iplist
在线程分析页面的右上角,单击“查询阻塞源线程”按钮,展示阻塞源线程的具体信息。 单击“重新执行”,重新执行查询操作。 在搜索栏中,输入搜索条件。单击,查看在该站点下满足搜索条件的线程信息。 线程分析展示:线程名称,CPU使用率以及线程数量。 支持按照NEW、BLOCKED、WAITING、TIMED_W
参见虚机场景Exporter接入。 插件安装完成后,即可将指标上报到AOM,并在对应ECS类型的Prometheus实例的“指标管理”界面下查看。 单击“已接入采集任务”,可查看已接入的采集任务,并根据需要删除不需要的采集任务。 (可选)在右侧“已安装”面板选择需要接入的插件卡片
cn-north-1.myhuaweicloud.com”。 project_id 为项目的ID,可在我的凭证中的项目列表里查看。 Auth下Basic auth和Skip TLS Verify的开关必须开启。 accesscode与projectid有对应关系,请在填写时确认匹配关系。
//最小实例数,表示扩容最小限制 "cooldown_time": 60//冷却时间,应用的策略执行完后必须冷却该时间后才能继续执行下条策略 } } 错误码 表5 错误码 错误码 错误信息 处理措施 SVCSTG.PE.4031012 Failed to verify
及时处理潜在风险,保障集群稳定运行。 注意事项 主机状态包含“正常”、“异常”、“亚健康”、“通道静默”、“已删除”。当由于网络异常、主机下电、关机等原因导致的主机异常,或主机产生阈值告警时,主机状态为“异常”。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏中选择“基础设施监控
group by ip语句则不能创建统计规则。 注意事项 统计规则是以日志桶为单位,创建统计规则前需确保至少已创建了一个日志桶,一个日志桶下最多可创建5条统计规则。 创建统计规则 下面以关键词统计为例,创建统计规则: 登录AOM控制台,在左侧导航栏中选择“日志 > 统计规则”。
URL:将URL设置为3获取的HTTP URL信息。 User:将User设置为3获取的用户名信息。 Password:将Password设置为3获取的密码信息。 Auth下Basic auth和Skip TLS Verify的开关必须开启。 图4 配置参数 配置完成后,单击“Save&Test”,验证是否配置成功。
地址。 下面的操作以获取CCE类型Prometheus实例的服务地址为例说明。 单击“内网”或“公网”页签,可以获取对应“内网”或“公网”下的Remote Read和Remote Write Prometheus配置代码。在代码右侧单击可复制该代码到对应文件。 获取Remote Read
后的日志进行SQL查询与分析。 告警 告警是指AOM自身或ServiceStage、CCE、APM等外部服务在异常情况或在可能导致异常情况下上报的信息,告警会引起业务异常,您需要对告警进行处理。 告警清除方式包括自动清除和手动清除两种。 自动清除:产生告警的故障消除后,AOM会自
单击“创建”,或在告警规则列表中选择待修改的某条告警规则,单击“操作”列的。 在告警规则的创建或修改页面,单击“高级设置”。 在“告警标签”或“告警标注”属性下,单击,输入标签键和标签值。 输入完成,单击“确定”,即可完成一个告警标签或告警标注的添加。 添加多个告警标签或告警标注:多次单击,可添加多
实例名称。 在实例详情页面左侧导航栏选择“设置”页签,获取当前实例的服务地址。 单击“内网”或“公网”页签,可以获取对应“内网”或“公网”下的Remote Read Prometheus配置代码。在代码右侧单击可复制该代码到对应文件。 Remote Read配置为: remote_read:
策略授权参考 本章节介绍AOM策略授权场景下支持的策略授权项。 支持的授权项 策略包含系统策略和自定义策略,如果系统策略不满足授权要求,管理员可以创建自定义策略,并通过给用户组授予自定义策略来进行精细的访问控制。策略支持的操作与API相对应,授权项列表说明如下: 权限:允许或拒绝某项操作。
监控对象最多可添加100条指标数据。 选择监控对象时,如果开启了应用到所有开关,将会针对应用或服务下的所有该类型指标创建一条告警规则。例如选择了“CCE / 主机 / 主机 / CPU使用率”指标,开启应用到所有开关,则会为CCE服务下所有主机创建一条告警规则。 单击“修改资源对象”可修改已选择的资源对象。