正在生成
详细信息:
检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
常见问题 报错提示RuntimeError: Default process group has not been initialized, please make sure to call init_process_group 训练运行报错AttributeError: 'torch_npu
单机多卡 线下容器镜像构建及调试 上传镜像 上传数据和算法至SFS(首次使用时需要) 使用Notebook进行代码调试 创建训练任务 父主题: 调试与训练
自动诊断工具MA-Advisor使用指导 自动诊断工具MA-Advisor简介 MA-Advisor使用指导 昇腾迁移融合算子API替换样例 AI CPU 算子替换样例 父主题: PyTorch迁移性能调优
权限控制方式 IAM 依赖和委托 工作空间 父主题: Standard权限管理
FAQ 使用ModelArts时提示“权限不足”,如何解决? 父主题: Standard权限管理
准备工作 准备环境 准备代码 准备数据 准备镜像 父主题: 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导(6.3.907)
准备工作 准备资源 准备数据 准备权重 准备代码 准备镜像 准备Notebook(可选) 父主题: 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导(6.3.908)
主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导(6.3.908) 场景介绍 准备工作 预训练 SFT全参微调训练 LoRA微调训练 查看日志和性能 训练脚本说明 常见错误原因和解决方法 父主题: LLM大语言模型训练推理
Lite Server使用前必读 Lite Server使用流程 Lite Server高危操作一览表 Lite Server算力资源和镜像版本配套关系
一般性问题 什么是ModelArts ModelArts与其他服务的关系 ModelArts与DLS服务的区别? 如何购买或开通ModelArts? 支持哪些型号的Ascend芯片? 如何获取访问密钥? 如何上传数据至OBS? 提示“上传的AK/SK不可用”,如何解决? 使用Mo
报错“The VS Code Server failed to start”如何解决? 问题现象 解决方法 检查VS Code版本是否为1.78.2或更高版本,如果是,请查看Remote-SSH版本,如果Remote-SSH版本低于v0.76.1,请升级Remote-SSH。 打开命令面板(Windows:
模型训练 创建图像分类自动学习项目并完成图片标注,训练按钮显示灰色,无法开始训练? 自动学习项目中,如何进行增量训练? 自动学习训练后的模型是否可以下载? 自动学习为什么训练失败? 自动学习模型训练图片异常? 自动学习使用子账号单击开始训练出现错误Modelarts.0010 自
准备数据 自动学习的每个项目对数据有哪些要求? 创建预测分析自动学习项目时,对训练数据有什么要求? 使用从OBS选择的数据创建表格数据集如何处理Schema信息? 物体检测或图像分类项目支持对哪些格式的图片进行标注和训练? 父主题: Standard自动学习
代码运行常见错误 Notebook无法执行代码,如何处理? 运行训练代码,出现dead kernel,并导致实例崩溃 如何解决训练过程中出现的cudaCheckError错误? 开发环境提示空间不足,如何解决? 如何处理使用opencv.imshow造成的内核崩溃? 使用Wind
创建项目 创建自动学习项目有个数限制吗? 创建项目的时候,数据集输入位置没有可选数据 父主题: Standard自动学习
LLM大语言模型训练推理 在ModelArts Studio基于Llama3-8B模型实现新闻自动分类 主流开源大模型基于DevServer适配PyTorch NPU推理指导(6.3.908) 主流开源大模型基于Standard适配PyTorch NPU推理指导(6.3.908)
GPU业务迁移至昇腾训练推理 ModelArts昇腾迁移调优工具总览 基于LLM模型的GPU训练业务迁移至昇腾指导 GPU训练业务迁移至昇腾的通用指导 基于AIGC模型的GPU推理业务迁移至昇腾指导 GPU推理业务迁移至昇腾的通用指导
GPU训练业务迁移至昇腾的通用指导 训练业务迁移到昇腾设备场景介绍 训练迁移快速入门案例 迁移环境准备 训练代码迁移 PyTorch迁移精度调优 PyTorch迁移性能调优 训练网络迁移总结 父主题: GPU业务迁移至昇腾训练推理
GLM3-6B模型基于DevServer适配PyTorch NPU训练指导(6.3.904) 场景介绍 准备工作 预训练 SFT全参微调训练 LoRA微调训练 推理前的权重合并转换 父主题: LLM大语言模型训练推理
预训练 预训练数据处理 预训练任务 断点续训练 查看日志和性能 父主题: Qwen系列模型基于DevServer适配PyTorch NPU训练指导(6.3.904)