搜索_华为云

准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

载链接下载数据集。在创建OBS桶创建的桶下创建文件夹用以存放数据，例如在桶standard-llama2-13b中创建文件夹training_data。利用OBS Browser+工具将步骤1下载的数据集上传至步骤2创建的文件夹目录下。得到OBS下数据集结构： obs://<

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.909） > 准备工作
使用MoXing时，如何进行增量训练？ - AI开发平台ModelArts

save_summary_steps=save_summary_steps, save_model_secs=save_model_secs, checkpoint_path=flags.checkpoint_url, export_model=mox

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 更多功能咨询
多机多卡 - AI开发平台ModelArts
多机多卡 - AI开发平台ModelArts

多机多卡上传数据至OBS（首次使用时需要）上传算法至SFS 创建训练任务父主题：调试与训练

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

如果使用DevServer资源，请参考DevServer资源开通，购买DevServer资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.2

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906） > 准备工作
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

载链接下载数据集。在创建OBS桶创建的桶下创建文件夹用以存放数据，例如在桶standard-llama2-13b中创建文件夹training_data。利用OBS Browser+工具将步骤1下载的数据集上传至步骤2创建的文件夹目录下。得到OBS下数据集结构： obs://<

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.910） > 准备工作
创建数据集标注版本 - AI开发平台ModelArts

with_column_header 否 Boolean 发布时是否将列名写到CSV文件的第一行，对于表格数据集有效。可选值如下： true：发布时将列名写到CSV文件的第一行（默认值） false：发布时不将列名写到CSV文件的第一行响应参数状态码： 201 表3 响应Body参数参数参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
自动学习的每个项目对数据有哪些要求？ - AI开发平台ModelArts

率和采样精度保持一致。标注质量对于最终的模型精度有极大的影响，标注过程中尽量不要出现误标情况。文本分类对数据集的要求文件格式要求为txt或者csv，文件大小不能超过8MB。以换行符作为分隔符，每行数据代表一个标注对象。文本分类目前只支持中文。父主题：准备数据

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习 > 准备数据
创建工作空间 - AI开发平台ModelArts

”时才会生效。 auth_type 否 String 授权类型。可选值有PUBLIC、PRIVATE、INTERNAL。默认值为PUBLIC。 PUBLIC：租户内部公开访问。 PRIVATE：仅创建者和主账号可访问。 INTERNAL：创建者、主账号、指定IAM子账号可访问，需要与grants参数配合使用。

帮助中心 > AI开发平台ModelArts > API参考 > 工作空间管理
修改工作空间 - AI开发平台ModelArts

id同时使用。 auth_type 否 String 授权类型。可选值有PUBLIC、PRIVATE、INTERNAL。默认值为PUBLIC。 PUBLIC：租户内部公开访问。 PRIVATE：仅创建者和主账号可访问。 INTERNAL：创建者、主账号、指定IAM子账号可访问，需要与grants参数配合使用。

帮助中心 > AI开发平台ModelArts > API参考 > 工作空间管理
人工标注视频数据 - AI开发平台ModelArts

钮继续播放，在需要标注处暂停，然后重复执行步骤3完成整个视频的标注。单击界面右上角的“标注列表”，在“当前文件标签”的详情页将呈现当前视频带标注的时间点。图3 当前文件标签信息单击页面左上角“返回数据标注预览”，页面将自动返回标注作业详情页面，同时，标注好的视频将呈现在“已标注”页签下。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过人工标注方式标注数据
管理Lite Cluster节点池 - AI开发平台ModelArts

个节点池时不支持删除。查看节点池的存储配置在节点池管理的更新页面，可以查看该节点池配置的系统盘、容器盘或数据盘的磁盘类型、大小、数量、写入模式、容器引擎空间大小、挂载路径磁盘配置等参数。在Lite资源池的扩缩容页面，也可以查看节点池的存储配置信息。查找搜索节点池在节点池

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
查看日志和性能 - AI开发平台ModelArts

节点打印。图1 打印训练日志训练完成后，如果需要单独获取训练日志文件，日志存放在第一个的Rank节点中；日志存放路径为：对应表1表格中output_dir参数值路径下的trainer_log.jsonl文件查看性能训练性能主要通过训练日志中的2个指标查看，吞吐量和loss收敛情况。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907）
示例：从 0 到 1 制作自定义镜像并用于训练（MindSpore+Ascend） - AI开发平台ModelArts

使用自定义镜像创建训练作业时，需要您熟悉docker软件的使用，并具备一定的开发经验。详细步骤如下所示： Step1 创建OBS桶和文件夹 Step2 准备脚本文件并上传至OBS中 Step3 制作自定义镜像 Step4 上传镜像至SWR Step5 在ModelArts上创建Notebook并调试

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
查看日志和性能 - AI开发平台ModelArts

节点打印。图1 打印训练日志训练完成后，如果需要单独获取训练日志文件，日志存放在第一个的Rank节点中；日志存放路径为：对应表1表格中output_dir参数值路径下的trainer_log.jsonl文件查看性能训练性能主要通过训练日志中的2个指标查看，吞吐量和loss收敛情况。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908）
资源池 - AI开发平台ModelArts
资源池 - AI开发平台ModelArts

资源池创建资源池失败 Standard资源池节点故障定位资源池推理服务一直初始化中如何解决专属资源池关联SFS Turbo显示异常

 帮助中心 > AI开发平台ModelArts > 故障排除
训练脚本说明 - AI开发平台ModelArts

训练脚本说明训练启动脚本说明和参数配置训练数据集预处理说明训练权重转换说明训练tokenizer文件说明父主题：主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907）
昇腾云服务6.3.904版本说明 - AI开发平台ModelArts

昇腾云服务6.3.904版本说明昇腾云服务6.3.904版本发布支持的软件包和能力说明如下，软件包获取路径：Support-E网站。发布包软件包特性说明配套说明备注昇腾云模型代码三方大模型，包名：AscendCloud-3rdLLM PyTorch框架下支持如下模型训练：

帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
训练脚本说明 - AI开发平台ModelArts

训练脚本说明训练启动脚本说明和参数配置训练的数据集预处理说明训练的权重转换说明训练tokenizer文件说明父主题：主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.910）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.910）
训练脚本说明 - AI开发平台ModelArts

训练脚本说明训练启动脚本说明和参数配置训练的数据集预处理说明训练的权重转换说明训练tokenizer文件说明父主题：主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.909）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.909）
FAQ - AI开发平台ModelArts
FAQ - AI开发平台ModelArts

run.sh脚本测试ModelArts训练整体流程 ModelArts环境挂载目录说明 infiniband驱动的安装如何保证训练和调试时文件路径保持一致父主题：专属资源池训练

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练

总条数： 1495

上一页
1
...
62
63
64
...
75
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备数据 - AI开发平台ModelArts

使用MoXing时，如何进行增量训练？ - AI开发平台ModelArts

多机多卡 - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

创建数据集标注版本 - AI开发平台ModelArts

自动学习的每个项目对数据有哪些要求？ - AI开发平台ModelArts

创建工作空间 - AI开发平台ModelArts

修改工作空间 - AI开发平台ModelArts

人工标注视频数据 - AI开发平台ModelArts

管理Lite Cluster节点池 - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

示例：从 0 到 1 制作自定义镜像并用于训练（MindSpore+Ascend） - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

资源池 - AI开发平台ModelArts

训练脚本说明 - AI开发平台ModelArts

昇腾云服务6.3.904版本说明 - AI开发平台ModelArts

训练脚本说明 - AI开发平台ModelArts

训练脚本说明 - AI开发平台ModelArts

FAQ - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线