搜索_华为云

ModelArts中创建的数据集，如何在Notebook中使用 - AI开发平台ModelArts

ModelArts中创建的数据集，如何在Notebook中使用 ModelArts上创建的数据集存放在OBS中，可以将OBS中的数据下载到Notebook中使用。 Notebook中读取OBS数据方式请参见如何在Notebook中上传下载OBS文件？。父主题：更多功能咨询

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 更多功能咨询
安装ModelArts SDK报错“ERROR: Could not install packages due to an OSError” - AI开发平台ModelArts

安装ModelArts SDK报错“ERROR: Could not install packages due to an OSError” 问题现象安装ModelArts SDK报错，完整报错信息“ERROR: Could not install packages due to

帮助中心 > AI开发平台ModelArts > 故障排除 > API/SDK
监控Lite Cluster资源 - AI开发平台ModelArts

监控Lite Cluster资源使用AOM看Lite Cluster监控指标使用Prometheus查看Lite Cluster监控指标父主题： Lite Cluster资源管理

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
迁移评估 - AI开发平台ModelArts
迁移评估 - AI开发平台ModelArts

迁移评估推理迁移包括模型迁移、业务迁移、精度性能调优等环节，是否能满足最终的迁移效果需要进行系统的评估。如果您仅需要了解迁移过程，可以先按照本文档的指导进行操作并熟悉迁移流程。如果您有实际的项目需要迁移，建议填写附录中的推理业务迁移评估表，并将该调研表提供给华为云技术支持人员进行迁移评估，以确保迁移项目能顺利实施。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
多机多卡 - AI开发平台ModelArts
多机多卡 - AI开发平台ModelArts

多机多卡线下容器镜像构建及调试上传镜像上传数据至OBS（首次使用时需要）上传算法至SFS 使用Notebook进行代码调试创建训练任务父主题：调试与训练

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

B或Qwen-72B ├── training_data #原始数据目录 ├── pretrain #预训练加载的数据 ├── train-00000-of-00001-a09b74b3ef9c3b56

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Qwen系列模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 准备工作
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

下。创建目录“training_data”，将原始数据存放在/mnt/sfs_turbo/training_data目录下。通过拖拽文件的方式，上传文件。使用CloudShell或者其它SSH远程工具。数据存放参考目录： /mnt/sfs_turbo/training_data

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.908） > 准备工作
分离部署推理服务 - AI开发平台ModelArts

${dir}:${container_work_dir} 代表需要在容器中挂载宿主机的目录。宿主机和容器使用不同的大文件系统，dir为宿主机中文件目录，${container_work_dir}为要挂载到的容器中的目录。为方便两个地址可以相同。容器不能挂载到/home/ma-u

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908） > 部署推理服务
部署推理服务 - AI开发平台ModelArts

${dir}:${container_work_dir} 代表需要在容器中挂载宿主机的目录。宿主机和容器使用不同的大文件系统，dir为宿主机中文件目录，${container_work_dir}为要挂载到的容器中的目录。为方便两个地址可以相同。容器不能挂载到/home/ma-u

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

场景介绍 Llama2（Large Language Model Meta AI）是由Meta AI发布的新一代大语言系列模型，上下文长度由Llama的2048扩展到了4096，可以理解和生成更长的文本。Llama2包含了70亿、130亿和700亿参数的模型，即：Llama2-7

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > LLama2系列模型基于DevServer适配PyTorch NPU训练指导（6.3.904）
预训练数据处理 - AI开发平台ModelArts

/llm_train/AscendSpeed/ModelLink/ #执行以下命令 python ./tools/preprocess_data.py \ --input /home/ma-user/ws/training_data/pretrain/train-00000

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Qwen系列模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 预训练
创建和管理团队 - AI开发平台ModelArts

IAM用户ID”、“角色”、“描述”，单击左下角“添加账号ID”。填写完成之后，然后单击“确定”。邮箱作为团队管理中的唯一标识，不同成员不能使用同一个邮箱。您填写的邮箱地址将被记录并保存在ModelArts中，仅用于ModelArts团队标注功能，当成员删除后，其填写的邮箱信息也将被一并删除。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过团队标注方式标注数据
昇腾迁移快速入门案例 - AI开发平台ModelArts

9-euler_2.10.7-aarch64-snt9b”。类型：Ascend。规格：选择snt9b资源。存储配置：云硬盘EVS。磁盘规格：按照对应的存储使用情况可选择存储大小。 SSH远程开发：如果需通过VS Code远程连接Notebook实例，可打开SSH远程开发，并选择自己的密钥对。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
训练的权重转换说明 - AI开发平台ModelArts

输出转换后权重文件保存路径：权重转换完成后，在/home/ma-user/work/llm_train/saved_dir_for_output/llama2-13b/saved_models/pretrain_hf/目录下查看转换后的权重文件。用户自定义执行权重转换参数修改说明同样以 llama2

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明
部署推理服务 - AI开发平台ModelArts

${dir}:${container_work_dir} 代表需要在容器中挂载宿主机的目录。宿主机和容器使用不同的大文件系统，dir为宿主机中文件目录，${container_work_dir}为要挂载到的容器中的目录。为方便两个地址可以相同。容器不能挂载到/home/ma-u

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.907）
LoRA微调训练 - AI开发平台ModelArts

考表1按照实际需求修改。表1 必须修改的训练超参配置参数示例值参数说明 ORIGINAL_TRAIN_DATA_PATH /home/ma-user/work/training_data/alpaca_gpt4_data.json 必须修改。训练时指定的输入数据路径。请根据实际规划修改。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906）
网卡名称错误 - AI开发平台ModelArts

网卡名称错误当训练开始时提示网卡名称错误。或者通信超时。可以使用ifconfig命令检查网卡名称配置是否正确。比如，ifconfig看到当前机器IP对应的网卡名称为enp67s0f5，则可以设置环境变量指定该值。 export GLOO_SOCKET_IFNAME=enp67s0f5

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.908） > 常见错误原因和解决方法
LoRA微调训练 - AI开发平台ModelArts

考表1按照实际需求修改。表1 必须修改的训练超参配置参数示例值参数说明 ORIGINAL_TRAIN_DATA_PATH /home/ma-user/work/training_data/alpaca_gpt4_data.json 必须修改。训练时指定的输入数据路径。请根据实际规划修改。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905）
JupyterLab目录的文件、Terminal的文件和OBS的文件之间的关系 - AI开发平台ModelArts

是从OBS目录中同步的文件。挂载OBS存储的Notebook，JupyterLab目录的文件可以与OBS的文件进行同步，使用JupyterLab文件上传下载功能。Terminal的文件与JupyterLab目录的文件相同。挂载EVS存储的Notebook，JupyterLab

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 更多功能咨询
上传算法至SFS - AI开发平台ModelArts

--nproc_per_node=1 --master_addr localhost --master_port=$MASTER_PORT main.py --data-path $IMAGE_DATA_PATH --cfg ./configs/swin/swin_base_patch4_window7_224_22k

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 多机多卡

总条数： 2293

上一页
1
...
88
89
90
...
115
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ModelArts中创建的数据集，如何在Notebook中使用 - AI开发平台ModelArts

安装ModelArts SDK报错“ERROR: Could not install packages due to an OSError” - AI开发平台ModelArts

监控Lite Cluster资源 - AI开发平台ModelArts

迁移评估 - AI开发平台ModelArts

多机多卡 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

预训练数据处理 - AI开发平台ModelArts

创建和管理团队 - AI开发平台ModelArts

昇腾迁移快速入门案例 - AI开发平台ModelArts

训练的权重转换说明 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

网卡名称错误 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

JupyterLab目录的文件、Terminal的文件和OBS的文件之间的关系 - AI开发平台ModelArts

上传算法至SFS - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线