搜索_华为云

mc2融合算子报错 - AI开发平台ModelArts

任务时产生mc2融合算子错误。图1 mc2融合算子错误解决方法修改代码文件：AscendFactory/scripts_modellink/{model_name}/3_training.sh文件，去除以下mc2融合算子--mc2 父主题：常见错误原因和解决方法

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912） > 常见错误原因和解决方法
准备文本分类数据 - AI开发平台ModelArts

如不需要提前上传训练数据，请创建一个空文件夹用于存放工程后期生成的文件。如需要提前上传待标注的文件，请创建一个空文件夹，然后将文本文件保存在该文件夹下，文本文件的目录结构如：“/bucketName/data/text.csv”。标签名是由中文、大小写字母、数字、中划线或下划线组成，且不超过32位的字符串。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现文本分类
从0制作自定义镜像用于创建训练作业（MindSpore+Ascend） - AI开发平台ModelArts

sh，下载Miniconda3-py37-4.10.3安装文件（对应python 3.7.10）。将上述pip源文件、*.run文件、*.whl文件、Miniconda3安装文件放置在context文件夹内，context文件夹内容如下。 context ├── Ascend-cann-nnae_6

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
ModelArts中常用概念 - AI开发平台ModelArts

开发、训练和部署。支持公共资源池和专属资源池两种，分别为共享资源池和独享资源池。 ModelArts Standard默认提供公共资源池。ModelArts Standard专属资源池需单独创建，专属使用，不与其他用户共享。 ModelArts Lite Server和ModelArts

帮助中心 > AI开发平台ModelArts > 产品介绍 > AI开发基础知识
以PyTorch框架创建训练作业（新版训练） - AI开发平台ModelArts

代码目录和代码启动文件。代码目录为代码启动文件的一级目录。 “job_config”字段下的“inputs”和“outputs”分别为算法的输入输出管道。可以按照实例指定“data_url”和“train_url”，在代码中解析超参分别指定训练所需要的数据文件本地路径和训练生成的模型输出本地路径。

帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
在ModelArts中如何将Notebook A的数据复制到Notebook B中？ - AI开发平台ModelArts

B，如果需要复制数据，可参考如下步骤操作：将Notebook A的数据上传至OBS；下载OBS中的数据至Notebook B。文件的上传下载详细操作请参考如何在ModelArts的Notebook中上传下载OBS文件？。父主题： Standard Notebook

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
报错“Bad owner or permissions on C:\Users\Administrator/.ssh/config”如何解决？ - AI开发平台ModelArts

ssh/config”。原因分析文件夹“.ssh”的权限不仅是Windows当前用户拥有，或者当前用户权限不足，故修改权限即可。解决方案找到.ssh文件夹。一般位于“C:\Users”，例如“C:\Users\xxx”。 “C:\Users”目录下的文件名必须和Windows登录用户名完全一致。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
日志提示“ValueError: Invalid endpoint: obs.xxxx.com” - AI开发平台ModelArts

obs. xxxx.com”。原因分析出现该问题的可能原因：直接在OBS上写tensorboard文件，存在不稳定的风险。处理方法建议先将Tensorboard文件写到本地，然后再复制回OBS。建议与总结在创建训练作业前，推荐您先使用ModelArts开发环境调试训练代码，避免代码迁移过程中的错误。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
使用Advisor工具分析生成调优建议 - AI开发平台ModelArts

py中修改优化器为apex混合精度模式下的DDP优化方式（修改点：注释第161和167行，增加第168~170行）。二进制调优使能，减少算子编译耗时，在train.py头文件导入之后添加（修改点：增加第37行）。 torch_npu.npu.set_compile_mode(jit_compile=False)

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > Dit模型Pytorch迁移与精度性能调优 > 性能调优
查询训练作业参数详情 - AI开发平台ModelArts

volumes属性列表参数参数类型说明 nfs Object 共享文件系统类型的存储卷。仅支持运行于已联通共享文件系统网络的资源池的训练作业。具体请参见表6。 host_path Object 主机文件系统类型的存储卷。仅支持运行于专属资源池中的训练作业。具体请参见表7。表6

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业参数配置
Notebook提示磁盘空间已满 - AI开发平台ModelArts

执行如下命令，排查回收站占用内存（回收站文件默认在/home/ma-user/work/.Trash-1000/files下）。 cd /home/ma-user/work/.Trash-1000/ du -ah 根据实际删除回收站不需要的大文件。（注：请谨慎操作，文件删除后不可恢复） rm {文件路径} 如

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 环境配置故障
在ModelArts上如何获得RANK_TABLE_FILE用于分布式训练？ - AI开发平台ModelArts

在ModelArts上如何获得RANK_TABLE_FILE用于分布式训练？ ModelArts会帮用户生成RANK_TABLE_FILE文件，可通过环境变量查看文件位置。在Notebook中打开terminal，可以运行如下命令查看RANK_TABLE_FILE： 1 env | grep

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
在ModelArts的Notebook中使用VS Code调试代码无法进入源码怎么办？ - AI开发平台ModelArts

在ModelArts的Notebook中使用VS Code调试代码无法进入源码怎么办？如果已有launch.json文件，请直接看步骤三。步骤一：打开launch.json文件方法一：单击左侧菜单栏的Run（Ctrl+Shift+D）按钮，再单击create a launch.json

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
报错“Failed to install the VS Code Server.”或“tar: Error is not recoverable: exiting now.”如何解决？ - AI开发平台ModelArts

问题现象或原因分析可能为/home/ma-user/work磁盘空间不足。解决方法删除/home/ma-user/work路径下无用文件。父主题： VS Code连接开发环境失败故障处理

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
DockerFile构建镜像（可选） - AI开发平台ModelArts

DockerFile构建镜像（可选）本章节主要介绍通过DockerFile文件构建训练镜像，将训练过程中依赖包封装使用，过程中需要连接互联网git clone，请确保环境可以访问公网，详解操作如下：进入代码包Dockerfile文件同级目录： cd /home/ma-user/ws/llm_train/LLaMAFactory

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 准备工作
DockerFile构建镜像（可选） - AI开发平台ModelArts

DockerFile构建镜像（可选）本章节主要介绍通过DockerFile文件构建训练镜像，将训练过程中依赖包封装使用，过程中需要连接互联网git clone，请确保环境可以访问公网，详解操作如下：进入代码包Dockerfile文件同级目录： cd /home/ma-user/ws/llm_train/AscendFactory

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 准备工作
DockerFile构建镜像（可选） - AI开发平台ModelArts

DockerFile构建镜像（可选）本章节主要介绍通过DockerFile文件构建训练镜像，将训练过程中依赖包封装使用，过程中需要连接互联网git clone，请确保环境可以访问公网，详解操作如下：进入代码包Dockerfile文件同级目录： cd /home/ma-user/ws/llm_train/LLaMAFactory

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 准备工作
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

DevServer资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906） > 准备工作
如何通过docker镜像启动容器？ - AI开发平台ModelArts

图1。Entrypoint参数中指定的可执行文件或命令会覆盖镜像的默认启动命令，Entrypoint中指定的执行命令内容不在镜像中预置，在本地环境通过docker run启动通过Notebook保存的镜像，报错创建容器任务失败，启动文件或目录不存在，如图2。因此需要设置--en

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard镜像相关
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

仅支持313T、376T、400T 训练支持的模型列表本方案支持以下模型的训练，如表1所示。表1 支持的模型列表及权重文件地址支持模型支持模型参数量权重文件获取地址 Llama2 llama2-7b https://huggingface.co/meta-llama/Llama-2-7b-chat-hf

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.909）

总条数： 1684

上一页
1
...
49
50
51
...
85
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

mc2融合算子报错 - AI开发平台ModelArts

准备文本分类数据 - AI开发平台ModelArts

从0制作自定义镜像用于创建训练作业（MindSpore+Ascend） - AI开发平台ModelArts

ModelArts中常用概念 - AI开发平台ModelArts

以PyTorch框架创建训练作业（新版训练） - AI开发平台ModelArts

在ModelArts中如何将Notebook A的数据复制到Notebook B中？ - AI开发平台ModelArts

报错“Bad owner or permissions on C:\Users\Administrator/.ssh/config”如何解决？ - AI开发平台ModelArts

日志提示“ValueError: Invalid endpoint: obs.xxxx.com” - AI开发平台ModelArts

使用Advisor工具分析生成调优建议 - AI开发平台ModelArts

查询训练作业参数详情 - AI开发平台ModelArts

Notebook提示磁盘空间已满 - AI开发平台ModelArts

在ModelArts上如何获得RANK_TABLE_FILE用于分布式训练？ - AI开发平台ModelArts

在ModelArts的Notebook中使用VS Code调试代码无法进入源码怎么办？ - AI开发平台ModelArts

报错“Failed to install the VS Code Server.”或“tar: Error is not recoverable: exiting now.”如何解决？ - AI开发平台ModelArts

DockerFile构建镜像（可选） - AI开发平台ModelArts

DockerFile构建镜像（可选） - AI开发平台ModelArts

DockerFile构建镜像（可选） - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

如何通过docker镜像启动容器？ - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线