搜索_华为云

训练tokenizer文件说明 - AI开发平台ModelArts

训练tokenizer文件说明在训练开始前，有些模型需要对模型的tokenizer文件，或者模型配置文件进行修改，具体的修改如下： Qwen-VL 修改文件modeling_qwen.py： # 将36 37 两行注释部分 36 SUPPORT_BF16 = SUPPORT_CUDA

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 训练脚本说明
创建和保存Pascal VOC文件 - AI开发平台ModelArts

创建和保存Pascal VOC文件需要先创建包含Pascal VOC信息的对象，然后保存。Pascal VOC信息请见表2。路径支持本地和OBS，如果是OBS，需要Session信息。 pascal_voc.save_xml(xml_file_path, save_mode='w'

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > Manifest管理
如何查看ModelArts训练作业资源占用情况？ - AI开发平台ModelArts

如何查看ModelArts训练作业资源占用情况？在ModelArts管理控制台，选择“模型训练>训练作业”，进入训练作业列表页面。在训练作业列表中，单击目标作业名称，查看该作业的详情。您可以在“资源占用情况”页签查看到如下指标信息。 CPU：CPU使用率（cpuUsage）百分比（Percent）。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
在ModelArts的Notebook中使用VS Code如何查看远端日志？ - AI开发平台ModelArts

在ModelArts的Notebook中使用VS Code如何查看远端日志？在VS Code环境中执行Ctrl+Shift+P 搜show logs 选择Remote Server。也可在如下截图的红框处切换至其他的Log 父主题： Standard Notebook

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
Notebook中无法打开“checkpoints”文件夹 - AI开发平台ModelArts

ints文件夹的数据到新建的文件夹下。执行mkdir xxx命令，新建一个文件夹，例如“xxx”（不要用checkpoints关键字命名）然后移动checkpoints文件夹的数据到新建的文件夹下，删除根目录下checkpoints文件夹即可。 mv checkpoints/*

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 其他故障
附录：rank_table_file.json文件 - AI开发平台ModelArts

附录：rank_table_file.json文件 rank_table_file.json文件样例如下，需要根据实际修改device_ip，server_id，container_ip参数，4台机器上的rank_table_file.json文件内容一致。在步骤三：创建rank_table_file

帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek系列模型推理 > DeepSeek模型基于ModelArts Lite Server适配MindIE推理部署指导
下载或读取文件报错，提示超时、无剩余空间 - AI开发平台ModelArts

on device”。同一目录下创建较多文件，为了加快文件检索速度，内核会创建一个索引表，短时间内创建较多文件时，会导致索引表达到上限，进而报错。触发条件和下面的因素有关：文件名越长，文件数量的上限越小 blocksize越小，文件数量的上限越小。（ blocksize，系统默认

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
用户创建模型时构建镜像或导入文件失败 - AI开发平台ModelArts

用户创建模型时构建镜像或导入文件失败问题现象用户创建模型时，构建镜像失败，失败日志中提示下载obs文件失败（Get object size from OBS failed！）。图1 下载obs文件失败用户创建模型时，事件提示：复制模型文件失败，请检查OBS权限是否正常（Failed

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
导入模型提示单个模型文件超过5G限制 - AI开发平台ModelArts

导入模型提示单个模型文件超过5G限制问题现象在导入模型时，提示单个模型文件大小超过5G限制。原因分析在不使用动态加载的情况下，系统对单个模型文件的限制大小为5G，超过时无法进行导入。处理方法精简模型文件后，重新导入。使用动态加载功能进行导入。图1 使用动态加载父主题：

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
从容器镜像中导入模型文件创建模型 - AI开发平台ModelArts

为Image类型，且不再需要用配置文件中的“swr_location”来指定您的镜像位置。制作自定义镜像的操作指导及规范要求，请参见模型镜像规范。说明：您选择的模型镜像将共享给系统管理员，请确保具备共享该镜像的权限（不支持导入其他账户共享给您的镜像），部署上线时，Model

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
给子账号配置文件夹级的SFS Turbo访问权限 - AI开发平台ModelArts

给子账号配置文件夹级的SFS Turbo访问权限场景描述本文介绍如何配置文件夹级的SFS Turbo访问权限，实现在ModelArts中访问挂载的SFS Turbo时，只允许子账号访问特定的SFS Turbo文件夹内容。给子账号配置文件夹级的SFS Turbo访问权限为白名

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
训练过程中无法找到so文件 - AI开发平台ModelArts

uda/lib64 执行如下命令，查看训练环境的cuda版本，确认当前cuda版本是否支持so文件。 os.system("cat /usr/local/cuda/version.txt") 支持。当前cuda版本无so文件，需外部导入so文件（自行在浏览器下载），再设置LD_LIBRARY_PATH，具体见2。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
从OBS中导入模型文件创建模型 - AI开发平台ModelArts

文档。单击“添加模型说明”，设置“文档名称”及其“URL”。模型说明支持增加3条。 “配置文件” 系统默认关联您存储在OBS中的配置文件。打开开关，您可以直接在当前界面查看或编辑模型配置文件。说明：该功能即将下线，后续请根据“AI引擎”、“运行时依赖”和“apis定义”修改模型的配置信息。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
Notebook运行代码报错，在'/tmp'中到不到文件 - AI开发平台ModelArts

-sh *，查看该目录下的空间占用情况。 sh-4.3$cd /tmp sh-4.3$du -sh * 4.0K core-js-banners 0 npm-19-41ed4c62 6.7M v8-compile-cache-1000 请删除不用的大文件。删除示例文件“test

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 代码运行故障
创建模型成功后，部署服务报错，如何排查代码问题 - AI开发平台ModelArts

创建模型成功后，部署服务报错，如何排查代码问题问题现象创建模型成功后，部署服务失败，如何定位是模型代码编写有问题。原因分析用户自定义镜像或者通过基础镜像导入的模型时，用户自己编写了很多自定义的业务逻辑，这些逻辑有问题将会导致服务部署或者预测失败，需要能够排查出哪里有问题。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
在Notebook中使用tensorboard命令打开日志文件报错Permission denied - AI开发平台ModelArts

建议用户新建一个文件夹（例如：tb_logs），将tensorboard的日志文件（例如：tb.events）放到新建的文件夹下，然后执行tensorboard命令。示例命令如下： mkdir -p ./tb_logs mv tb.events ./tb_logs tensorboard

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 其他故障
Yaml配置文件参数配置说明 - AI开发平台ModelArts

Yaml配置文件参数配置说明本小节主要详细描述demo_yaml配置文件、配置参数说明，用户可根据实际自行选择其需要的参数。表1 模型训练脚本参数参数示例值参数说明 model_name_or_path /home/ma-user/ws/tokenizers/Qwen2-72B

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练脚本说明
Yaml配置文件参数配置说明 - AI开发平台ModelArts

Yaml配置文件参数配置说明本小节主要详细描述demo_yaml配置文件、配置参数说明，用户可根据实际自行选择其需要的参数。表1 模型训练脚本参数参数示例值参数说明 model_name_or_path /home/ma-user/ws/tokenizers/Qwen2-72B

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 训练脚本说明
Yaml配置文件参数配置说明 - AI开发平台ModelArts

Yaml配置文件参数配置说明本小节主要详细描述demo_yaml配置文件、配置参数说明，用户可根据实际自行选择其需要的参数。表1 模型训练脚本参数参数示例值参数说明 model_name_or_path /home/ma-user/ws/tokenizers/Qwen2-72B

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 训练脚本说明
Yaml配置文件参数配置说明 - AI开发平台ModelArts

Yaml配置文件参数配置说明本小节主要详细描述demo_yaml配置文件、配置参数说明，用户可根据实际自行选择其需要的参数。表1 模型训练脚本参数参数示例值参数说明 model_name_or_path /home/ma-user/ws/tokenizers/Qwen2-72B

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.909） > 训练脚本说明

总条数： 1982

上一页
1
...
4
5
6
...
100
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练tokenizer文件说明 - AI开发平台ModelArts

创建和保存Pascal VOC文件 - AI开发平台ModelArts

如何查看ModelArts训练作业资源占用情况？ - AI开发平台ModelArts

在ModelArts的Notebook中使用VS Code如何查看远端日志？ - AI开发平台ModelArts

Notebook中无法打开“checkpoints”文件夹 - AI开发平台ModelArts

附录：rank_table_file.json文件 - AI开发平台ModelArts

下载或读取文件报错，提示超时、无剩余空间 - AI开发平台ModelArts

用户创建模型时构建镜像或导入文件失败 - AI开发平台ModelArts

导入模型提示单个模型文件超过5G限制 - AI开发平台ModelArts

从容器镜像中导入模型文件创建模型 - AI开发平台ModelArts

给子账号配置文件夹级的SFS Turbo访问权限 - AI开发平台ModelArts

训练过程中无法找到so文件 - AI开发平台ModelArts

从OBS中导入模型文件创建模型 - AI开发平台ModelArts

Notebook运行代码报错，在'/tmp'中到不到文件 - AI开发平台ModelArts

创建模型成功后，部署服务报错，如何排查代码问题 - AI开发平台ModelArts

在Notebook中使用tensorboard命令打开日志文件报错Permission denied - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线