搜索_华为云

场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

需的模型文件、训练数据等，再将OBS中的数据文件导入到SFS Turbo，然后在训练作业中挂载SFS Turbo到容器对应ckpt目录，实现分布式读取训练数据文件。约束限制如果要使用自动重启功能，资源规格必须选择八卡规格。本案例仅支持在专属资源池上运行。支持的模型列表本方案支持以下模型的训练，如表1所示。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907）
查看日志和性能 - AI开发平台ModelArts

查看日志和性能查看日志训练过程中，训练日志会在第一个的Rank节点打印。图1 打印训练日志训练完成后，如果需要单独获取训练日志文件，日志存放在第一个的Rank节点中；日志存放路径为：对应表1表格中output_dir参数值路径下的trainer_log.jsonl文件查看性能

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.909）
分析ModelArts数据集中的数据特征 - AI开发平台ModelArts

成。查看数据特征分析结果。 “版本选择”：在右侧下拉框中选择进行对比的版本。也可以只选择一个版本。 “类型”：选择需要分析的类型。支持“all”、“train”、“eval”和“inference”。 “数据特征指标”：在右侧下拉框中勾选需要展示的指标。详细指标说明请参见支持分析指标及其说明。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理
Open-Sora-Plan1.0基于DevServer适配PyTorch NPU训练推理指导（6.3.907） - AI开发平台ModelArts

${container_name} bash Step6 安装Decord Decord是一个高性能的视频处理库，在昇腾环境中安装需要修改一些源码进行适配。 Decord建议安装在 /home/ma-user/lib中。安装x264 mkdir /home/ma-user/lib && cd /home/ma-user/lib

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
在Notebook中使用Moxing命令 - AI开发平台ModelArts

在Notebook中使用Moxing命令 MoXing Framework功能介绍 Notebook中快速使用MoXing mox.file与本地接口的对应关系和切换 MoXing常用操作的样例代码 MoXing进阶用法的样例代码父主题：使用Notebook进行AI开发调试

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
训练中的权重转换说明 - AI开发平台ModelArts

--tensor-model-parallel-size：${TP}张量并行数，需要与训练脚本中的TP值配置一样。 --pipeline-model-parallel-size：${PP}流水线并行数，需要与训练脚本中的PP值配置一样。 --load-dir：加载转换模型权重路径。 --save-dir

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906） > 训练脚本说明
训练中的权重转换说明 - AI开发平台ModelArts

--tensor-model-parallel-size：${TP}张量并行数，需要与训练脚本中的TP值配置一样。 --pipeline-model-parallel-size：${PP}流水线并行数，需要与训练脚本中的PP值配置一样。 --load-dir：加载转换模型权重路径。 --save-dir

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907） > 训练脚本说明
训练中的权重转换说明 - AI开发平台ModelArts

--tensor-model-parallel-size：${TP}张量并行数，需要与训练脚本中的TP值配置一样。 --pipeline-model-parallel-size：${PP}流水线并行数，需要与训练脚本中的PP值配置一样。 --load-dir：加载转换模型权重路径。 --save-dir

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.908） > 训练脚本说明参考
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

华为方技术支持下载获取。模型软件包结构说明 AscendCloud-6.3.909代码包中AscendCloud-LLM代码包结构介绍如下，训练脚本以分类的方式集中在scripts文件夹中： |──llm_train # 模型训练代码包

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.909） > 准备工作
训练过程读取数据 - AI开发平台ModelArts

训练过程读取数据在ModelArts上训练模型，输入输出数据如何配置？如何提升训练效率，同时减少与OBS的交互？大量数据文件，训练过程中读取数据效率低？使用Moxing时如何定义路径变量？父主题： Standard训练作业

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业
GP Vnt1裸金属服务器用PyTorch报错CUDA initialization:CUDA unknown error - AI开发平台ModelArts

nvidia-modprobe是一个Linux工具，用于在系统中加载NVIDIA驱动程序及其相关的内核模块。在Linux系统上安装NVIDIA显卡驱动后，需要通过“nvidia-modprobe”命令来加载相应的内核模块，以便让显卡驱动正常工作。通常情况下，在安装NVIDIA驱动时，会自动执行“n

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
准备Notebook - AI开发平台ModelArts

snt9b，显存规格建议选择64G以上的规格，磁盘规格建议选择500GB及以上。创建完Notebook后，待Notebook状态变为“运行中”时，打开Notebook，在Notebook调试环境中部署推理服务。父主题：准备工作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905） > 准备工作
日志提示“Out of bounds nanosecond timestamp” - AI开发平台ModelArts

最大时间：2262-04-11 23:47:16.854775807，需注意上下界限。建议与总结在创建训练作业前，推荐您先使用ModelArts开发环境调试训练代码，避免代码迁移过程中的错误。直接使用线上notebook环境调试请参考使用JupyterLab开发模型。配置本地

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
训练中的权重转换说明 - AI开发平台ModelArts

--tensor-model-parallel-size：${TP}张量并行数，需要与训练脚本中的TP值配置一样。 --pipeline-model-parallel-size：${PP}流水线并行数，需要与训练脚本中的PP值配置一样。 --load-dir：加载转换模型权重路径。 --save-dir

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.909） > 训练脚本说明参考
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

华为方技术支持下载获取。模型软件包结构说明 AscendCloud-6.3.908代码包中AscendCloud-LLM代码包结构介绍如下，训练脚本以分类的方式集中在scripts文件夹中： |──llm_train # 模型训练代码包

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.908） > 准备工作
基本配置 - AI开发平台ModelArts
基本配置 - AI开发平台ModelArts

基本配置权限配置创建网络专属资源池VPC打通 ECS服务器挂载SFS Turbo存储在ECS中创建ma-user和ma-group obsutil安装和配置（可选）工作空间配置父主题：专属资源池训练

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练
Open-Clip基于DevServer适配PyTorch NPU训练指导 - AI开发平台ModelArts

chown -R ma-user:ma-group open_clip exit 在步骤2打开的终端中，使用默认用户ma-user安装源码。 cd open_clip make install 在步骤2打开的终端中，使用默认用户ma-user安装依赖。 pip install -r requirements-training

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
ModelArts - AI开发平台ModelArts
ModelArts - AI开发平台ModelArts

创建Notebook实例后无法打开页面，如何处理？如何在Notebook中安装外部库？开发环境中不同Notebook规格资源“/cache”目录的大小在Notebook中，如何使用昇腾多卡进行调试？更多 AI应用管理导入模型时，模型配置文件中的安装包依赖参数如何编写？使用自定义镜像创建在线服务，如何修改默认端口？

帮助中心 > AI开发平台ModelArts > 成长地图
资源选择推荐 - AI开发平台ModelArts

点创建训练任务开始到变成运行中的时间（资源充足、镜像已缓存）。 20秒训练列表页打开已有50条训练作业，单击训练模块后的时间。 6秒日志加载作业运行中，已经输出1兆的日志文本，单击训练详情页面需要多久加载出日志。 2.5秒训练详情页作业运行中，没有用户日志情况下，在ModelArt

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练
使用kv-cache-int8量化 - AI开发平台ModelArts

使用kv-cache-int8量化 kv-cache-int8是实验特性，在部分场景下性能可能会劣于非量化。当前支持per-tensor静态量化，支持kv-cache-int8量化和FP16、BF16、AWQ、smoothquant的组合。 kv-cache-int8量化支持的模型请参见支持的模型列表和权重文件。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909） > 推理模型量化

总条数： 1458

上一页
1
...
62
63
64
...
73
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

场景介绍 - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

分析ModelArts数据集中的数据特征 - AI开发平台ModelArts

Open-Sora-Plan1.0基于DevServer适配PyTorch NPU训练推理指导（6.3.907） - AI开发平台ModelArts

在Notebook中使用Moxing命令 - AI开发平台ModelArts

训练中的权重转换说明 - AI开发平台ModelArts

训练中的权重转换说明 - AI开发平台ModelArts

训练中的权重转换说明 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

训练过程读取数据 - AI开发平台ModelArts

GP Vnt1裸金属服务器用PyTorch报错CUDA initialization:CUDA unknown error - AI开发平台ModelArts

准备Notebook - AI开发平台ModelArts

日志提示“Out of bounds nanosecond timestamp” - AI开发平台ModelArts

训练中的权重转换说明 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

基本配置 - AI开发平台ModelArts

Open-Clip基于DevServer适配PyTorch NPU训练指导 - AI开发平台ModelArts

ModelArts - AI开发平台ModelArts

资源选择推荐 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线