-
启动DevServer实例 - AI开发平台ModelArts
启动DevServer实例 功能介绍 启动DevServer实例。 接口约束 暂无约束 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI PUT /v1/{projec
-
精度问题处理 - AI开发平台ModelArts
精度问题处理 设置高精度并重新转换模型 在转换模型时,默认采用的精度模式是fp16,如果转换得到的模型和标杆数据的精度差异比较大,可以使用fp32精度模式提升模型的精度(这块无需全换成fp32,fp32相对于fp16性能较差,所以一般检测出来哪个模型精度有问题时,再尝试是否用fp
-
删除DevServer实例 - AI开发平台ModelArts
删除DevServer实例 功能介绍 删除DevServer实例。 接口约束 暂无约束 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI DELETE /v1/{pro
-
停止DevServer实例 - AI开发平台ModelArts
停止DevServer实例 功能介绍 停止DevServer实例。 接口约束 暂无约束 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI PUT /v1/{projec
-
SFT全参微调 - AI开发平台ModelArts
SFT全参微调 SFT全参微调数据处理 SFT全参微调权重转换 SFT全参微调超参配置 SFT全参微调任务 查看性能 父主题: Baichuan2-13B基于DevServer适配PyTorch NPU训练指导(6.3.904)
-
退订包年/包月的DevServer资源 - AI开发平台ModelArts
弹性裸金属”,进入“弹性裸金属”列表页面。 复制需要退订的实例ID。 图4 复制实例ID DevServer购买订单里绑定的资源ID为DevServer ID,与DevServer产品所封装的BMS/ECS ID不同,若要退订DevServer,需要在ModelArts控制台的“专属资源池 > 弹性裸金属”中查询对应ID。
-
弹性裸金属DevServer - AI开发平台ModelArts
弹性裸金属DevServer DevServer简介 DevServer资源开通 DevServer资源配置 DevServer资源使用 释放DevServer资源 FAQ
-
查询DevServer实例详情 - AI开发平台ModelArts
查询DevServer实例详情 功能介绍 查询DevServer实例详情。 接口约束 暂无约束 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI GET /v1/{pr
-
SDXL基于DevServer适配PyTorch NPU的Finetune训练指导(6.3.905) - AI开发平台ModelArts
训练资源需要使用单机8卡。 确保容器可以访问公网。 Step1 检查环境 请参考DevServer资源开通,购买DevServer资源,并确保机器已开通,密码已获取,能通过SSH登录,不同机器之间网络互通。 购买DevServer资源时如果无可选资源规格,需要联系华为云技术支持申请开通。 当
-
SDXL基于DevServer适配PyTorch NPU的LoRA训练指导(6.3.905) - AI开发平台ModelArts
Lora训练使用单机单卡资源。 确保容器可以访问公网。 Step1 检查环境 请参考DevServer资源开通,购买DevServer资源,并确保机器已开通,密码已获取,能通过SSH登录,不同机器之间网络互通。 购买DevServer资源时如果无可选资源规格,需要联系华为云技术支持申请开通。 当
-
常见问题 - AI开发平台ModelArts
常见问题 ML Studio错误码 父主题: ML Studio
-
开发环境提示空间不足,如何解决? - AI开发平台ModelArts
当提示空间不足时,推荐使用EVS类型的Notebook实例。 参考如何在Notebook中上传下载OBS文件?操作指导,针对原有的Notebook,首先将代码和数据上传至OBS桶中。然后创建一个EVS类型的Notebook,将此OBS中的文件下载至Notebook本地(指新建的EVS类型Notebook)。
-
PyTorch迁移性能调优 - AI开发平台ModelArts
PyTorch迁移性能调优 性能调优总体原则和思路 自动诊断工具MA-Advisor使用指导 性能调优五板斧 训练profiling工具使用 优化算子下发 优化算子执行 父主题: 训练业务昇腾迁移通用指导
-
GP Vnt1裸金属服务器EulerOS 2.9安装NVIDIA 515+CUDA 11.7 - AI开发平台ModelArts
9使用的yum源是“http://repo.huaweicloud.com”,该源可用。若执行“yum update”时报错, 显示有软件包冲突等问题, 可通过“yum remove xxx软件包”解决该问题。 父主题: GPU裸金属服务器环境配置
-
本地IDE操作流程 - AI开发平台ModelArts
云上开发环境。 不大于500MB数据量直接复制至本地IDE中即可。 创建训练作业大于500MB数据量请先上传到OBS中,从OBS上传到云硬盘EVS。 将调试好的训练脚本和用于训练的数据集上传至OBS目录。 提交训练作业。提交训练作业方式如下: 在本地IDE中提交训练作业 可以通过
-
实时同步用户所有DevServer实例状态 - AI开发平台ModelArts
实时同步用户所有DevServer实例状态 功能介绍 实时同步用户所有DevServer实例状态。 接口约束 暂无约束 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI
-
SD1.5基于DevServer适配PyTorch NPU的Finetune训练指导(6.3.T041) - AI开发平台ModelArts
3110-ca68771 SWR上拉取 Step1 检查环境 请参考DevServer资源开通,购买DevServer资源,并确保机器已开通,密码已获取,能通过SSH登录,不同机器之间网络互通。 购买DevServer资源时如果无可选资源规格,需要联系华为云技术支持申请开通。 当
-
DevServer简介 - AI开发平台ModelArts
DevServer简介 ModelArts Lite DevServer提供不同型号的xPU裸金属服务器,您可以通过弹性公网IP进行访问,在给定的操作系统镜像上可以自行安装加速卡相关的驱动和其他软件,使用SFS或OBS进行数据存储和读取相关的操作,满足算法工程师进行日常训练的需要。
-
性能调优五板斧 - AI开发平台ModelArts
通常可简单地基于性能优化五板斧先尝试做性能调优: NPU融合算子API和亲和优化器 算子二进制调优 AOE自动性能调优 多进程绑核 优化数据处理 NPU融合算子API和亲和优化器 可对训练代码中的部分API替换成NPU融合算子API和亲和优化器,从而提升训练性能。但需要注意的是,
-
单模型性能调优AOE - AI开发平台ModelArts
同时会在aoe_output路径下输出对应的mindir模型,由于当前模型并没有吸收知识库信息,所以性能不佳,因此需要在保留AOE知识库的情况下,再次进行转换,以达到较优性能。 删除编译缓存atc_data。 注意相比第一次清除缓存操作,本次保留了AOE知识库。 #shell #