检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
按需计费模式下ServiceStage是否支持变更产品版本? ServiceStage提供的产品版本有:基础版、专业版、铂金版,您可以根据实际业务需要按需使用。 如果您当前使用的产品版本不能满足业务需要,ServiceStage支持升级产品版本,例如从“基础版”升级到“专业版”或者铂金版
使用GitLab对接Jenkins自动构建并升级部署到ServiceStage的组件 实践概述 操作前准备 操作步骤 构建验证
请求示例 无 响应示例 { "message": "OK" } 状态码 状态码 描述 200 操作成功 400 错误的请求 404 请求对象不存在 500 内部错误 错误码 错误码格式为:SVCSTG.00100.
启动流程元模板 启动流程是指对流程元模板的一次具体运行。完成创建和发布的流程元模板可以多次启动流程,您可以根据实际业务需求,选择合适自己业务需求的流程元模板启动流程。 启动流程 登录流程引擎。 在左侧导航栏中,选择“流程编排服务 > 流程元模板”,进入“流程元模板”页面。 在流程元模板所在行
管理开发中心系统菜单 AppStage开发中心提供菜单管理,可以修改系统菜单关联的工具链或对系统菜单进行上线下线操作,也可以添加菜单并为菜单关联在“工具链集成配置”页面已集成的页面。 前提条件 已获取组织管理员角色权限,权限申请方法请参见申请权限。 管理系统菜单 在开发中心首页右上角选择
管理开发中心版本活动 添加自定义版本活动 修改系统预置版本活动关联的工具链 添加版本交付件模板 添加版本代码安全检视检查项 管理版本标准发布准入配置 父主题: 管理AppStage开发中心系统配置
ACMS敏感配置管理使用流程 由于业务的敏感配置不能明文地存放在版本包、配置中心、IaC代码中,因此业务可以借助STS敏感配置项的功能,存放业务的敏感配置。 敏感配置管理使用流程 在ACMS中录入敏感配置:业务研发人员登录ACMS管理台录入敏感配置。 通过IaC分发敏感配置:业务研发人员编写
使用插件模板为容器集群安装插件 ERS提供通过插件模板为集群安装插件的功能,本章节介绍如何为集群安装插件。 前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 为集群安装插件 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 >
订阅BaaS服务已共享指标 服务想要获取BaaS服务的横向数据,比如说音乐或视频业务想实时查看SLB、ELB的指标监控,可以通过指标共享的方式获取指标,支持按照标签或指标级进行共享。 BaaS服务数据开发人员创建并共享指标后,服务运维和开发人员在标签查询中可以按标签查询指标的定义,
查看注册到CloudMap的服务信息 查看注册到CloudMap的服务列表 为微服务配置告警策略 父主题: 管理Cloud Map中的服务资源
分布式训练功能介绍 ModelArts提供了如下能力: 丰富的官方预置镜像,满足用户的需求。 支持基于预置镜像自定义制作专属开发环境,并保存使用。 丰富的教程,帮助用户快速适配分布式训练,使用分布式训练极大减少训练时间。 分布式训练调测的能力,可在PyCharm/VSCode/JupyterLab
创建Workflow节点 创建Workflow数据集节点 创建Workflow数据集标注节点 创建Workflow数据集导入节点 创建Workflow数据集版本发布节点 创建Workflow训练作业节点 创建Workflow模型注册节点 创建Workflow服务部署节点 父主题:
扩缩容Standard专属资源池 场景介绍 当专属资源池创建完成,使用一段时间后,由于用户AI开发业务的变化,对于资源池资源量的需求可能会产生变化,面对这种场景,ModelArts Standard专属资源池提供了扩缩容功能,用户可以根据自己的需求动态调整。 使用扩容功能时,可以增加资源池已有规格的实例数量
管理和查看数据处理任务 删除数据处理任务 当已有的数据处理任务不再使用时,您可以删除数据处理任务。 请注意,数据处理任务删除后不可恢复,请谨慎操作。 处于“完成”、“失败”、“已停止”、“运行失败”、“部署中”状态的训练作业,您可以单击操作列的“删除”,删除对应的数据处理任务。 查看数据处理任务详情
通过JupyterLab在线使用Notebook实例进行AI开发 使用JupyterLab在线开发和调试代码 JupyterLab常用功能介绍 在JupyterLab使用Git克隆代码仓 在JupyterLab中创建定时任务 上传文件至JupyterLab 下载JupyterLab
使用纳管资源配置模式创建Kubernetes环境 在使用容器部署方式基于界面配置创建并部署组件、使用容器部署方式基于YAML配置创建并部署组件、使用导入CCE工作负载创建组件之前,您需要先创建Kubernetes类型的环境。 使用纳管资源配置模式创建Kubernetes环境 登录ServiceStage
Lite Server资源配置流程 在开通Lite Server资源后,需要完成相关配置才能使用,配置流程如下图所示。 图1 Lite Server资源配置流程图 表1 Server资源配置流程 配置顺序 配置任务 场景说明 1 配置Lite Server网络 Server资源开通后
训练网络迁移总结 确保算法在GPU训练时,持续稳定可收敛。避免在迁移过程中排查可能的算法问题,并且要有好的对比标杆。如果是NPU上全新开发的网络,请参考PyTorch迁移精度调优排查溢出和精度问题。 理解GPU和NPU的构造以及运行的差别,有助于在迁移过程中分析问题并发挥NPU的优势
上传数据和算法至OBS(首次使用时需要) 前提条件 已经在OBS上创建好并行文件系统,请参见创建并行文件系统。 已经在obsutil安装和配置,请参见obsutils安装和配置。 准备数据 单击下载动物数据集至本地,并解压。 通过obsutil将数据集上传至OBS桶中。 ./obsutil
创建训练任务 调试代码 创建训练任务之前,建议先调试代码。 由于Notebook的/cache目录只能支持500G的存储,超过后会导致实例重启,ImageNet数据集大小超过该限制,因此建议用线下资源调试、或用小批量数据集在Notebook调试(Notebook调试方法与使用Notebook