检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
judge长时间处于SUBMIT状态直至失败 问题现象 judge记录一直处于提交未执行SUBMIT状态,直至失败FAIL。 可能原因 后端任务内存溢出,可以在训练日志中的ad-agent日志找到报错java.lang.OutOfMemoryError:Java heap space。
进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“运维数据采集 > 虚机报表”。 在“虚机报表”页面查看该主机的监控报表。也可以通过hostip切换,查看其它主机的监控报表,如图1所示。 图1 查看报表
单击“新建”,输入键值。 将集群共享给其他服务 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 弹性资源服务(ERS)”。 选择左侧导航栏的“集群列表”。 在集群列表单击集群所在行操作列的“更多 > 共享”。 选择需要共享的服务,单击“确定”。 更多操作 您还可以对已纳管的集群进行以下操作。
单击“新增节点”,配置IP和主机名。 在主机管理服务中,选择“主机列表 > 弹性云服务器”,查看IP地址和主机名称。 单击“保存”。 部署节点 本节介绍如何部署自管理主机节点。 实例节点所在的归属服务需要和实例所在的所属服务一致。在主机管理服务中,选择“主机列表 > 弹性云服务器”,单击主机名称,查看实例节点所在的归属服务。
根据表或任务类型查看数据血缘 监控服务支持查看运维数据的数据血缘、关系及数量等信息。 前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 查看数据血缘 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。
的异常检测。 前提条件 已创建指标。 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 创建单指标查询视图/多指标组合查询视图 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“运维数据开发
judge日志无法查看,提示get request error 问题现象 查看judge日志任务时,出现get request error错误提示。 可能原因 judge日志持续日志打印,单个文件过大时,打开或者下载会提示失败。 解决方法 依次单击“初始化Daemon”、“注册任
PSQLException: ERROR: syntax error at or near 问题现象 judge历史的原始详情中出现PSQLException: ERROR: syntax error at or near报错。 可能原因 在judge日志的ad-agent日志中
AppStage的资源按照服务级隔离,跨服务使用监听时,需要配置共享。 前提条件 需要具备AppStage服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 配置监听共享 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“微服务开发 > 负载均衡”。
些故障问题,暂时无法为您提供服务” 问题现象 图1 Agent报错 解决方法 检查创建Agent时选择的模型是否为模型服务商API,使用模型服务商API时,需要配置模型服务鉴权,新开的租户没有配置模型鉴权,具体操作请参见如何对模型供应商提供的模型服务设置鉴权。 父主题: AI原生应用引擎
在VMS中可以为已纳管的主机新增或扩容云硬盘。 前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 新增磁盘 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 主机管理服务(VMS)”。 选择左侧导航栏的“云服务器管理 > 云硬盘”。 在列表中勾选磁盘,单击“新增磁盘”。
节介绍如何为主机绑定新创建的业务账号。 前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 绑定业务账号 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 主机管理服务(VMS)”。 选择左侧导航栏的“OS管理 > OS列表”,进入“OS列表”页面。
AppStage的资源按照服务级隔离,跨服务使用负载均衡实例时,需要配置共享。 前提条件 需要具备AppStage服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 配置SLB实例共享 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“微服务开发 > 负载均衡”。
配了通知渠道,则值班人员就能收到通知。 前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 创建告警升级规则 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“告警
judge日志大小1KB,且不刷新日志内容 问题现象 judge日志大小1KB,且不刷新日志内容。 可能原因 告警原始表中存在字段值和字段类型不一致,导致解析失败。 解决方法 检查告警原始表中的数据是否有异常数据。 例如:数值类型的字段,值为NAN,可能是没有做除数为0的保护,修复异常,清理元数据,补数据后重新训练。
镜像包、SQL包等进行集中管理,用于升级变更服务的虚拟机。软件仓库不同软件包的说明如表1所示。 同时支持将镜像仓SWR(SoftWare Repository for Container)进行统一管理,可以绑定使用镜像仓中的镜像用于服务的容器升级变更,具体操作请参见录入并绑定华为云镜像仓SWR。
告警,否则按照一条新的告警来处理告警。 前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 创建告警屏蔽规则 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“告警
新建语音值班配置前需要先新增模板。模板是产品级共享,模板列表展示所选服务所属产品下的所有模板配置。 前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 新增模板 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。
敏感配置。 通过IaC分发敏感配置:业务研发人员编写IaC代码,声明业务软件依赖的敏感配置,IaC部署后,敏感配置项生效变成已发布状态,微服务才能获取。 在业务代码中配置敏感配置解密:通过STS SDK获取敏感配置并自动解密。 父主题: 在ACMS中管理敏感配置
(可选)录入HTTPS监听所需的服务器证书 配置HTTPS监听时,涉及服务器身份验证,需要为监听绑定服务器证书。本文介绍如何录入服务器证书。 前提条件 已获取服务器证书。 需要具备AppStage服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 创建证书 进入AppStage运维中心。