检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
judge_data_size(in):0 问题现象 judge历史的原始详情中出现judge_data_size(in):0提示。 可能原因 judge没有获取到数据。 解决方法 检查告警原始表汇聚任务配置的汇聚提前时间和judge任务的汇聚提前时间,保证对应时间点能够获取到数据即可。
ERROR - fail to load 问题现象 judge日志中出现ERROR - fail to load错误提示,如下图 可能原因 日志中提示加载模型失败,可能是因为容器在启动时加载模型失败。 解决方法 依次单击“初始化Daemon”、“注册任务”和“启动任务”,重启ju
TypeError: not supported between instances of 'str' and 'float' 问题现象 在judge日志中出现TypeError: not supported between instances of 'str' and 'float'提示。
judge长时间处于SUBMIT状态直至失败 问题现象 judge记录一直处于提交未执行SUBMIT状态,直至失败FAIL。 可能原因 后端任务内存溢出,可以在训练日志中的ad-agent日志找到报错java.lang.OutOfMemoryError:Java heap space。
在AppStage开发中心创建版本 版本是服务开发的基本单元,是指软件、应用程序或系统有序开发而特定发布的单元。每个版本都有一个唯一的标识符,通常是一个数字或字母组合,用于区分不同的版本。为所要开发的产品/服务创建版本,在版本管理活动中进行流水线和发布流程等有序版本开发过程管理。
创建版本 版本是服务开发的基本单元,是指软件、应用程序或系统有序开发而特定发布的单元。每个版本都有一个唯一的标识符,通常是一个数字或字母组合,用于区分不同的版本。为开发团队所要开发的产品/服务创建版本,在版本管理活动中进行流水线和发布流程等有序版本开发过程管理。 前提条件 已创建服务,服务方法请参见服务管理。
judge日志无法查看,提示get request error 问题现象 查看judge日志任务时,出现get request error错误提示。 可能原因 judge日志持续日志打印,单个文件过大时,打开或者下载会提示失败。 解决方法 依次单击“初始化Daemon”、“注册任
PSQLException: ERROR: syntax error at or near 问题现象 judge历史的原始详情中出现PSQLException: ERROR: syntax error at or near报错。 可能原因 在judge日志的ad-agent日志中
ers-monitoring是安装监控插件cluster-monitoring所用的命名空间,如果想要监控CCE容器集群状态,需要安装cluster-monitoring监控插件,具体请参见使用插件模板为容器集群安装插件,安装后该插件会采集容器的监控数据,同时生成ers-monit
judge日志大小1KB,且不刷新日志内容 问题现象 judge日志大小1KB,且不刷新日志内容。 可能原因 告警原始表中存在字段值和字段类型不一致,导致解析失败。 解决方法 检查告警原始表中的数据是否有异常数据。 例如:数值类型的字段,值为NAN,可能是没有做除数为0的保护,修复异常,清理元数据,补数据后重新训练。
PSQLException: ERROR: invalid input syntax for type numeric 问题现象 judge历史的原始详情中出现PSQLException: ERROR: invalid input syntax for type numeric报错。
TypeError("Cannot index by location index with a non-integer key") 问题现象 在judge日志中出现TypeError("Cannot index by location index with a non-integer
控制。部署服务按服务管理资源,将微服务作为最小变更单元 ,进行自动化的变更管理。 监控服务 监控服务(ServiceInsight)是一个为开发人员和运维SRE(Site Reliability Engineer)设计的全面监控平台。该平台围绕故障生命周期的各个阶段构建,提供即开
告警配置 AppStage运维中心支持对虚拟机监控数据或业务数据配置告警,及时掌握虚拟机状态,容器接入并安装监控插件后会自动生成告警。 配置虚拟机告警 配置虚拟机告警前需要先完成主机监控接入,并且已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 进入AppStage运维中心。
采取相应的措施进行修复,最大限度地减少停机时间和业务中断,减轻可能出现的业务损失和客户流失。 提供实时监控和报告:AppStage运维中心集成了丰富的监控和报表功能,可以实时监控系统的性能指标、资源利用率和安全状态等。通过可视化的报表和图表,SRE可以随时了解系统的运行情况,进行
接收报文错误率:该指标用于统计监控周期内接收报文中错误报文数量与全部接收报文比值。 接收报文丢包率:该指标用于监控周期内统计接收报文中丢失报文数量与全部接收报文比值。 发送报文错误率:该指标用于监控周期内统计发送报文中错误报文数量与全部发送报文比值。 发送报文丢包率:该指标用于监控周期内统计发送报文中丢失报文数量与全部发送报文比值。
发现与注册、配置管理、负载均衡、数据监控以及分布式调用链等的开发工作。通过Spring Cloud提供的简易框架,开发者能够基于Spring Boot轻松实现微服务项目的构建。 然而,除了开发阶段的便捷性外,我们还需要关注应用的部署、运维和监控等方面,以确保微服务应用在生产环境中
理请求。 推理单元 推理单元是指计算机系统中的一个模块,用于进行逻辑推理和推断。其主要功能是根据已知的事实和规则,推导出新的结论或答案。 推理单元常常被用于解决问题、推理、诊断、规划等任务。它可以帮助计算机系统自动推理出一些结论,从而实现智能化的决策和行为。推理单元通常包括知识表
环境类似标签,使用目的是为了区分同一服务在运维中心部署和监控的实例。一个组织下可以创建多个不同用途的环境,并通过环境配置将服务与环境进行关联。 为服务启用指定环境,并设置环境下服务所使用的云资源归属的华为账号及其region。同一服务可以启用多个环境,同一环境下可以有多个服务。 例如一个服务有1个
控制。部署服务按服务管理资源,将微服务作为最小变更单元 ,进行自动化的变更管理。 监控服务 监控服务(ServiceInsight)是一个为开发人员和运维SRE(Site Reliability Engineer)设计的全面监控平台。该平台围绕故障生命周期的各个阶段构建,提供即开