搜索_华为云

开发环境 - AI开发平台ModelArts
开发环境 - AI开发平台ModelArts

开发环境环境配置故障实例故障代码运行故障 JupyterLab插件故障 VS Code连接开发环境失败故障处理自定义镜像故障其他故障

 帮助中心 > AI开发平台ModelArts > 故障排除
准备工作 - AI开发平台ModelArts
准备工作 - AI开发平台ModelArts

准备工作准备资源准备数据准备权重准备代码准备镜像准备Notebook（可选）父主题：主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907）
准备工作 - AI开发平台ModelArts
准备工作 - AI开发平台ModelArts

准备工作准备资源准备数据准备权重准备代码准备镜像准备Notebook（可选）父主题：主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.909）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.909）
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

co/datasets/tatsu-lab/alpaca/resolve/main/data/train-00000-of-00001-a09b74b3ef9c3b56.parquet，数据大小：24M左右。 SFT和LoRA微调使用的Alpaca数据集下载：https://huggingface.

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.908） > 准备工作
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

co/datasets/tatsu-lab/alpaca/resolve/main/data/train-00000-of-00001-a09b74b3ef9c3b56.parquet，数据大小：24M左右。 SFT和LoRA微调使用的Alpaca数据集下载：https://huggingface.

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.908） > 准备工作
推理精度测试 - AI开发平台ModelArts

els at Evaluation）。步骤一：配置精度测试环境获取精度测试代码。精度测试代码存放在代码包AscendCloud-LLM的llm_tools/llm_evaluation目录中，代码目录结构如下。目前使用的opencompass版本是0.2.6 benchmark_eval

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909）
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

co/datasets/tatsu-lab/alpaca/resolve/main/data/train-00000-of-00001-a09b74b3ef9c3b56.parquet，数据大小：24M左右。 SFT和LoRA微调使用的Alpaca数据集下载：https://huggingface.

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.909） > 准备工作
模型管理 - AI开发平台ModelArts
模型管理 - AI开发平台ModelArts

模型管理模型调试导入模型查询模型列表查询模型对象列表查询模型详情删除模型

 帮助中心 > AI开发平台ModelArts > SDK参考
Standard Notebook - AI开发平台ModelArts

Standard Notebook 规格限制文件上传下载数据存储环境配置相关 Notebook实例常见错误代码运行常见错误 CodeLab PyCharm Toolkit使用 VS Code使用技巧 VS Code连接开发环境失败常见问题在Notebook中使用自定义镜像常见问题

 帮助中心 > AI开发平台ModelArts > 常见问题
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

co/datasets/tatsu-lab/alpaca/resolve/main/data/train-00000-of-00001-a09b74b3ef9c3b56.parquet，数据大小：24M左右。 SFT和LoRA微调使用的Alpaca数据集下载：https://huggingface.

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.909） > 准备工作
专属资源池训练 - AI开发平台ModelArts

专属资源池训练资源选择推荐步骤总览资源购买基本配置调试与训练 FAQ 父主题：历史待下线案例

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

1.0-cann_8.0.rc2-py_3.9-hce_2.0.2312-aarch64-snt9b-20240727152329-0f2c29a CANN：cann_8.0.rc2 PyTorch：2.1.0 Step1 创建ECS 下文中介绍如何在ECS中构建一个推理镜像，请

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907） > 准备工作
昇腾迁移快速入门案例 - AI开发平台ModelArts

克隆ModelArts Ascend代码库。新建Terminal，执行下述命令将对应的repo克隆到Notebook实例。 git clone https://gitee.com/ModelArts/modelarts-ascend.git 图5 下载示例代码昇腾迁移案例在“~/wor

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
查看模型评估结果 - AI开发平台ModelArts

PyTorch-1.4.0-python3.6 下文将介绍如何在训练中使用评估代码。对训练代码做一定的适配和修正，分为三个方面：添加输出目录、复制数据集到本地、映射数据集路径到OBS。添加输出目录添加输出目录的代码比较简单，即在代码中添加一个输出评估结果文件的目录，被称为train_url，也

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
部署推理服务 - AI开发平台ModelArts

建议使用官方提供的镜像部署推理服务。镜像地址{image_url}获取请参见表1。 docker pull {image_url} Step3 上传代码包和权重文件上传安装依赖软件推理代码AscendCloud-LLM-6.3.907-xxx.zip和算子包AscendCloud-OPP-6.3.907-xxx

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.907）
训练作业 - AI开发平台ModelArts
训练作业 - AI开发平台ModelArts

训练作业 OBS操作相关故障云上迁移适配故障硬盘限制故障外网访问限制权限问题 GPU相关问题业务代码问题预置算法运行故障训练作业卡死训练作业运行失败专属资源池创建训练作业训练作业性能问题 Ascend相关问题

 帮助中心 > AI开发平台ModelArts > 故障排除
训练作业容错检查 - AI开发平台ModelArts

使用reload ckpt恢复中断的训练在容错机制下，如果因为硬件问题导致训练作业重启，用户可以在代码中读取预训练模型，恢复至重启前的训练状态。用户需要在代码里加上reload ckpt的代码，使能读取训练中断前保存的预训练模型。具体请参见断点续训练。父主题：模型训练高可靠性

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
FAQ - AI开发平台ModelArts
FAQ - AI开发平台ModelArts

CUDA和CUDNN run.sh脚本测试ModelArts训练整体流程 ModelArts环境挂载目录说明 infiniband驱动的安装如何保证训练和调试时文件路径保持一致父主题：专属资源池训练

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练
Qwen-VL基于DevServer适配Pytorch NPU的Finetune训练指导(6.3.906) - AI开发平台ModelArts

动容器默认使用ma-user用户。 docker exec -it ${container_name} bash Step3 获取代码并上传上传代码AscendCloud-AIGC-6.3.906-xxx.zip到容器的工作目录${container_work_dir}中，包获取路径请参见表2。

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
如何安装第三方包，安装报错的处理方法 - AI开发平台ModelArts

supported wheel on this platform”报错，具体解决方法请参见2。处理方法安装第三方包 pip中存在的包，使用如下代码： import os os.system('pip install xxx') pip源中不存在的包，此处以“apex”为例，请您用如下方式将安装包上传到OBS桶中。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障

总条数： 1232

上一页
1
...
47
48
49
...
62
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

开发环境 - AI开发平台ModelArts

准备工作 - AI开发平台ModelArts

准备工作 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

模型管理 - AI开发平台ModelArts

Standard Notebook - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

专属资源池训练 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

昇腾迁移快速入门案例 - AI开发平台ModelArts

查看模型评估结果 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

训练作业 - AI开发平台ModelArts

训练作业容错检查 - AI开发平台ModelArts

FAQ - AI开发平台ModelArts

Qwen-VL基于DevServer适配Pytorch NPU的Finetune训练指导(6.3.906) - AI开发平台ModelArts

如何安装第三方包，安装报错的处理方法 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线