检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
配置虚拟机异常告警 AppStage支持定义服务的监控模板,然后通过为主机绑定监控模板,采集主机监控数据,并通过模板告警功能对虚拟机监控数据配置告警,及时掌握虚拟机状态。 限制条件 绑定监控模板进行虚拟机监控,支持的主机的操作系统版本包括EulerOS 2.X、HCE、CentO
ERROR - fail to load 问题现象 judge日志中出现ERROR - fail to load错误提示,如下图 可能原因 日志中提示加载模型失败,可能是因为容器在启动时加载模型失败。 解决方法 依次单击“初始化Daemon”、“注册任务”和“启动任务”,重启ju
judge日志无法查看,提示get request error 问题现象 查看judge日志任务时,出现get request error错误提示。 可能原因 judge日志持续日志打印,单个文件过大时,打开或者下载会提示失败。 解决方法 依次单击“初始化Daemon”、“注册任
PSQLException: ERROR: syntax error at or near 问题现象 judge历史的原始详情中出现PSQLException: ERROR: syntax error at or near报错。 可能原因 在judge日志的ad-agent日志中
TypeError: not supported between instances of 'str' and 'float' 问题现象 在judge日志中出现TypeError: not supported between instances of 'str' and 'float'提示。
judge长时间处于SUBMIT状态直至失败 问题现象 judge记录一直处于提交未执行SUBMIT状态,直至失败FAIL。 可能原因 后端任务内存溢出,可以在训练日志中的ad-agent日志找到报错java.lang.OutOfMemoryError:Java heap space。
judge日志大小1KB,且不刷新日志内容 问题现象 judge日志大小1KB,且不刷新日志内容。 可能原因 告警原始表中存在字段值和字段类型不一致,导致解析失败。 解决方法 检查告警原始表中的数据是否有异常数据。 例如:数值类型的字段,值为NAN,可能是没有做除数为0的保护,修复异常,清理元数据,补数据后重新训练。
TypeError("Cannot index by location index with a non-integer key") 问题现象 在judge日志中出现TypeError("Cannot index by location index with a non-integer
PSQLException: ERROR: invalid input syntax for type numeric 问题现象 judge历史的原始详情中出现PSQLException: ERROR: invalid input syntax for type numeric报错。
ers-monitoring是安装监控插件cluster-monitoring所用的命名空间,如果想要监控CCE容器集群状态,需要安装cluster-monitoring监控插件,具体请参见使用插件模板为容器集群安装插件,安装后该插件会采集容器的监控数据,同时生成ers-monit
告警配置 AppStage运维中心支持对虚拟机监控数据或业务数据配置告警,及时掌握虚拟机状态,容器接入并安装监控插件后会自动生成告警。 配置虚拟机告警 配置虚拟机告警前需要先完成主机监控接入,并且已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 进入AppStage运维中心。
接收报文错误率:该指标用于统计监控周期内接收报文中错误报文数量与全部接收报文比值。 接收报文丢包率:该指标用于监控周期内统计接收报文中丢失报文数量与全部接收报文比值。 发送报文错误率:该指标用于监控周期内统计发送报文中错误报文数量与全部发送报文比值。 发送报文丢包率:该指标用于监控周期内统计发送报文中丢失报文数量与全部发送报文比值。
SLB一直同步,心跳异常 通过脚本排错 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务”。 选择左侧导航栏的“EAP&JOB > 脚本执行”,选择“公共工具”页签。 在名称栏中输入“slb”,单击“查询”。 在查询结果列表中,单击“slb_
单指标查询视图/多指标组合查询视图 如果需要在大盘监控单个指标的报表(如折线型报表),可以创建单指标查询视图。 如果需要在大盘同时监控多个指标(如表格型报表),可以创建多指标组合查询视图。 进入运维中心控制台。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“运维数据开发
CPU过载控制OLC(Overload Control)是一种CPU过载调控机制。当CPU过载时,OLC能够对受监控协议报文和任务进行调控,通过不同优先级业务的合理规划和限制报文通过等方式,降低对CPU资源的消耗,并确保设备不会因为某种受监控协议或任务冲击CPU导致的CPU过载而影响对其他业务的正常处理。 本文介绍如何创建OLC服务。
CPU过载控制OLC(Overload Control)是一种CPU过载调控机制。当CPU过载时,OLC能够对受监控协议报文和任务进行调控,通过不同优先级业务的合理规划和限制报文通过等方式,降低对CPU资源的消耗,并确保设备不会因为某种受监控协议或任务冲击CPU导致的CPU过载而影响对其他业务的正常处理。 本文介绍如何创建OLC服务。
接收报文错误率:该指标用于统计监控周期内接收报文中错误报文数量与全部接收报文比值。 接收报文丢包率:该指标用于监控周期内统计接收报文中丢失报文数量与全部接收报文比值。 发送报文错误率:该指标用于监控周期内统计发送报文中错误报文数量与全部发送报文比值。 发送报文丢包率:该指标用于监控周期内统计发送报文中丢失报文数量与全部发送报文比值。
发现与注册、配置管理、负载均衡、数据监控以及分布式调用链等的开发工作。通过Spring Cloud提供的简易框架,开发者能够基于Spring Boot轻松实现微服务项目的构建。 然而,除了开发阶段的便捷性外,我们还需要关注应用的部署、运维和监控等方面,以确保微服务应用在生产环境中
晨3:00尝试一次,直至套餐包到期或者续费成功。 开通自动续费后,还可以手动续费该套餐包。手动续费后,自动续费仍然有效,在新的到期时间前的第7天开始扣款。 自动续费的到期前7日自动扣款属于系统默认配置,您也可以根据需要修改此扣款日,如到期前6日、到期前5日等等。 更多关于自动续费的规则介绍请参见自动续费规则说明。
生的问题。事件可通过监控系统自动生成、客户报障生成或SRE主动巡检生成等。监控系统生成事件首先要采集和分析运行数据,然后根据预定规则判断是否需要生成事件。 HCW HW Cloud Watch,AppStage运维中心提供的监控系统,也称为云眼,可以提供监控、告警功能。 HCW Agent