检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
CES指标接入 云监控服务CES可以收集云服务内置监控指标的数据,可以通过监控这些指标来跟踪对应云服务状态。AppStage运维中心支持将CES收集的监控指标数据采集到运维中心监控服务中进行管理,可以参考支持监控的服务列表查看CES当前已支持的监控指标。 选择服务后首次使用监控服务,会初
ERROR - fail to load 问题现象 judge日志中出现ERROR - fail to load错误提示,如下图 可能原因 日志中提示加载模型失败,可能是因为容器在启动时加载模型失败。 解决方法 依次单击“初始化Daemon”、“注册任务”和“启动任务”,重启ju
配置虚拟机异常告警 AppStage支持定义服务的监控模板,然后通过为主机绑定监控模板,采集主机监控数据,并通过模板告警功能对虚拟机监控数据配置告警,及时掌握虚拟机状态。 限制条件 绑定监控模板进行虚拟机监控,支持的主机的操作系统版本包括EulerOS 2.X、HCE、CentO
TypeError: not supported between instances of 'str' and 'float' 问题现象 在judge日志中出现TypeError: not supported between instances of 'str' and 'float'提示。
judge长时间处于SUBMIT状态直至失败 问题现象 judge记录一直处于提交未执行SUBMIT状态,直至失败FAIL。 可能原因 后端任务内存溢出,可以在训练日志中的ad-agent日志找到报错java.lang.OutOfMemoryError:Java heap space。
judge日志无法查看,提示get request error 问题现象 查看judge日志任务时,出现get request error错误提示。 可能原因 judge日志持续日志打印,单个文件过大时,打开或者下载会提示失败。 解决方法 依次单击“初始化Daemon”、“注册任
PSQLException: ERROR: syntax error at or near 问题现象 judge历史的原始详情中出现PSQLException: ERROR: syntax error at or near报错。 可能原因 在judge日志的ad-agent日志中
judge日志大小1KB,且不刷新日志内容 问题现象 judge日志大小1KB,且不刷新日志内容。 可能原因 告警原始表中存在字段值和字段类型不一致,导致解析失败。 解决方法 检查告警原始表中的数据是否有异常数据。 例如:数值类型的字段,值为NAN,可能是没有做除数为0的保护,修复异常,清理元数据,补数据后重新训练。
ers-monitoring是安装监控插件cluster-monitoring所用的命名空间,如果想要监控CCE容器集群状态,需要安装cluster-monitoring监控插件,具体请参见使用插件模板为容器集群安装插件,安装后该插件会采集容器的监控数据,同时生成ers-monit
TypeError("Cannot index by location index with a non-integer key") 问题现象 在judge日志中出现TypeError("Cannot index by location index with a non-integer
PSQLException: ERROR: invalid input syntax for type numeric 问题现象 judge历史的原始详情中出现PSQLException: ERROR: invalid input syntax for type numeric报错。
告警配置 AppStage运维中心支持对虚拟机监控数据或业务数据配置告警,及时掌握虚拟机状态,容器接入并安装监控插件后会自动生成告警。 配置虚拟机告警 配置虚拟机告警前需要先完成主机监控接入,并且已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 进入AppStage运维中心。
接收报文错误率:该指标用于统计监控周期内接收报文中错误报文数量与全部接收报文比值。 接收报文丢包率:该指标用于监控周期内统计接收报文中丢失报文数量与全部接收报文比值。 发送报文错误率:该指标用于监控周期内统计发送报文中错误报文数量与全部发送报文比值。 发送报文丢包率:该指标用于监控周期内统计发送报文中丢失报文数量与全部发送报文比值。
发现与注册、配置管理、负载均衡、数据监控以及分布式调用链等的开发工作。通过Spring Cloud提供的简易框架,开发者能够基于Spring Boot轻松实现微服务项目的构建。 然而,除了开发阶段的便捷性外,我们还需要关注应用的部署、运维和监控等方面,以确保微服务应用在生产环境中
采取相应的措施进行修复,最大限度地减少停机时间和业务中断,减轻可能出现的业务损失和客户流失。 提供实时监控和报告:AppStage运维中心集成了丰富的监控和报表功能,可以实时监控系统的性能指标、资源利用率和安全状态等。通过可视化的报表和图表,SRE可以随时了解系统的运行情况,进行
SLB一直同步,心跳异常 通过脚本排错 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务”。 选择左侧导航栏的“EAP&JOB > 脚本执行”,选择“公共工具”页签。 在名称栏中输入“slb”,单击“查询”。 在查询结果列表中,单击“slb_
接收报文错误率:该指标用于统计监控周期内接收报文中错误报文数量与全部接收报文比值。 接收报文丢包率:该指标用于监控周期内统计接收报文中丢失报文数量与全部接收报文比值。 发送报文错误率:该指标用于监控周期内统计发送报文中错误报文数量与全部发送报文比值。 发送报文丢包率:该指标用于监控周期内统计发送报文中丢失报文数量与全部发送报文比值。
单指标查询视图/多指标组合查询视图 如果需要在大盘监控单个指标的报表(如折线型报表),可以创建单指标查询视图。 如果需要在大盘同时监控多个指标(如表格型报表),可以创建多指标组合查询视图。 进入运维中心控制台。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“运维数据开发
环境类似标签,使用目的是为了区分同一服务在运维中心部署和监控的实例。一个组织下可以创建多个不同用途的环境,并通过环境配置将服务与环境进行关联。 为服务启用指定环境,并设置环境下服务所使用的云资源归属的华为账号及其region。同一服务可以启用多个环境,同一环境下可以有多个服务。 例如一个服务有1个
台账、SQL变更、数据查询、数据库风险诊断等功能。 功能介绍 数据库管理 WiseDBA为用户提供统一的数据库管理平台,支持用户级的管理、监控、可视化的数据库交互等功能,为用户节省50%以上的管理成本,提高数据库运维效率。 数据查询 数据查询工具可以帮助业务简化现网的SQL查询流程,避免SRE直接操作数据库。