检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
judge长时间处于SUBMIT状态直至失败 问题现象 judge记录一直处于提交未执行SUBMIT状态,直至失败FAIL。 可能原因 后端任务内存溢出,可以在训练日志中的ad-agent日志找到报错java.lang.OutOfMemoryError:Java heap space。
judge日志无法查看,提示get request error 问题现象 查看judge日志任务时,出现get request error错误提示。 可能原因 judge日志持续日志打印,单个文件过大时,打开或者下载会提示失败。 解决方法 依次单击“初始化Daemon”、“注册任
PSQLException: ERROR: syntax error at or near 问题现象 judge历史的原始详情中出现PSQLException: ERROR: syntax error at or near报错。 可能原因 在judge日志的ad-agent日志中
judge日志大小1KB,且不刷新日志内容 问题现象 judge日志大小1KB,且不刷新日志内容。 可能原因 告警原始表中存在字段值和字段类型不一致,导致解析失败。 解决方法 检查告警原始表中的数据是否有异常数据。 例如:数值类型的字段,值为NAN,可能是没有做除数为0的保护,修复异常,清理元数据,补数据后重新训练。
TypeError("Cannot index by location index with a non-integer key") 问题现象 在judge日志中出现TypeError("Cannot index by location index with a non-integer
PSQLException: ERROR: invalid input syntax for type numeric 问题现象 judge历史的原始详情中出现PSQLException: ERROR: invalid input syntax for type numeric报错。
CES指标接入 云监控服务CES可以收集云服务内置监控指标的数据,可以通过监控这些指标来跟踪对应云服务状态。AppStage运维中心支持将CES收集的监控指标数据采集到运维中心监控服务中进行管理,可以参考支持监控的服务列表查看CES当前已支持的监控指标。 选择服务后首次使用监控服务,会初始
配置虚拟机异常告警 AppStage支持定义服务的监控模板,然后通过为主机绑定监控模板,采集主机监控数据,并通过模板告警功能对虚拟机监控数据配置告警,及时掌握虚拟机状态。 限制条件 绑定监控模板进行虚拟机监控,支持的主机的操作系统版本包括EulerOS 2.X、HCE、CentO
化的可观测性解决方案。 微服务平台:微服务平台(NUWA Runtime,简称NUWA)是一款全代管式微服务计算平台,可快速、安全地部署和扩缩容器化应用,是一个广义的Serverless平台,提供容器级别的完全托管的能力,目标是让业务看不到云。管理平台标准化业务的部署形式,业务只需要提供软件包,NUWA
ers-monitoring是安装监控插件cluster-monitoring所用的命名空间,如果想要监控CCE容器集群状态,需要安装cluster-monitoring监控插件,具体请参见为容器集群安装插件,安装后该插件会采集容器的监控数据,同时生成ers-monitori
数据库诊断服务提供多种性能指标选择,帮助业务在日常巡检、问题定位、压测、大促时,实时确认数据库性能。支持对TaurusDB、GeminiDB(for Cassandra)及GaussDB类型数据库进行性能诊断。 前提条件 已在监控服务中完成数据初始化,具体请参见监控服务使用说明。
输入节点备注信息,方便后续查阅节点功能。 异常监控和处理 异常监控和处理(try-catch),左侧为try,右侧为catch。当左侧try分支出现错误时,会进入右侧catch分支,执行右侧的逻辑,如果左侧try逻辑无错误,则继续向下执行。 图11 异常监控和处理 输入参数 该执行动作无输出参数。
环境类似标签,使用目的是为了区分同一服务在运维中心部署和监控的实例。一个组织下可以创建多个不同用途的环境,并通过环境配置将服务与环境进行关联。 为服务启用指定环境,并设置环境下服务所使用的云资源归属的账号及其region。同一服务可以启用多个环境,同一环境下可以有多个服务。 例如一个服务有1个开发环境
的使用人员。 创建团队:在开发中心进行服务开发前,需要组织管理员先创建一个团队,将团队关联需要开发的服务。 配置服务信息:将团队关联服务后,还需将团队关联的服务关联CodeArts项目,后续的服务开发管理过程中才能正常使用CodeArts服务的代码托管、流水线、编译构建功能。 添
告警配置 AppStage运维中心支持对虚拟机监控数据或业务数据配置告警,及时掌握虚拟机状态,容器接入并安装监控插件后会自动生成告警。 配置虚拟机告警 配置虚拟机告警前需要先完成主机监控接入,并且已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 进入AppStage运维中心。
参数 说明 所属服务 展示所属的服务。 流控服务名称 自定义流控服务的名称。 字符长度0~64,可以由字母、数字、下划线、短横线、点组成,不能包含特殊字符,例:服务_OLC_微服务。 流控服务中文名称 自定义流控服务的中文名称。 认证密钥 单击“获取”,获取密钥并自动填入接入OLC中心接口认证密钥。
参数 说明 所属服务 展示所属的服务。 流控服务名称 自定义流控服务的名称。 字符长度0~64,可以由字母、数字、下划线、短横线、点组成,不能包含特殊字符,例:服务_OLC_微服务。 流控服务中文名称 自定义流控服务的中文名称。 认证密钥 单击“获取”,获取密钥并自动填入接入OLC中心接口认证密钥。
数据库诊断服务提供多种性能指标选择,帮助业务在日常巡检、问题定位、压测、大促时,实时确认数据库性能。支持对TaurusDB、GeminiDB(for Cassandra)及GaussDB类型数据库进行性能诊断。 前提条件 已在监控服务中完成数据初始化,具体请参见初始化监控服务运维资源。
集群纳管参数说明 参数名称 参数说明 站点 选择需要纳管集群的站点。 部门 默认显示当前服务所属的租户名称,不可修改。 产品 默认显示当前服务所属的产品英文名,不可修改。 服务 默认显示当前服务的服务英文名,不可修改。 环境 选择需要纳管集群的环境。 集群 在下拉列表选择需要纳管的集
使用AIOps体系和相配套的工具实施业务运维数仓系统的开发。 前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 步骤一:创建逻辑主体 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“运维数据开发