搜索_华为云

训练作业访问OBS时，日志提示“stat:403 reason:Forbidden” - AI开发平台ModelArts

CCAC445CAA1A71019C9D0 retry:0 原因分析出现该问题的可能原因如下: OBS服务的权限出现问题，导致无法正常读取数据处理方法请检查OBS权限配置，如未解决问题可参考OBS文档的已配置OBS权限，仍然无法访问OBS（403 AccessDenied）。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 权限问题
日志提示“pandas.errors.ParserError: Error tokenizing data. C error: Expected .* fields” - AI开发平台ModelArts

ParserError: Error tokenizing data. C error: Expected .* fields” 问题现象使用pandas读取csv数据表时，日志报出如下错误导致训练作业失败： pandas.errors.ParserError: Error tokenizing

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
快速配置ModelArts委托授权 - AI开发平台ModelArts

场景描述为了完成AI计算的各种操作，AI平台ModelArts在任务执行过程中需要访问用户的其他服务，典型的就是训练过程中，需要访问OBS读取用户的训练数据。在这个过程中，就出现了ModelArts“代表”用户去访问其他云服务的情形。从安全角度出发，ModelArts代表用户访问

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard准备工作 > 配置ModelArts Standard访问授权
在ModelArts上训练模型如何配置输入输出数据？ - AI开发平台ModelArts

算法请参考开发用于预置框架训练的代码。创建训练作业请参考创建训练作业指导。解析输入路径参数、输出路径参数运行在ModelArts的模型读取存储在OBS服务的数据，或者输出至OBS服务指定路径，输入和输出数据需要配置3个地方：训练代码中需解析输入路径参数和输出路径参数。ModelArts推荐以下方式实现参数解析。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
创建模型时，OBS文件目录对应镜像里面的目录结构是什么样的？ - AI开发平台ModelArts

是什么样的？问题现象创建模型时，元模型来源指定的OBS目录下存放了自定义的文件和文件夹，都会复制到镜像中去。复制进去的路径是什么，怎么读取对应的文件或者文件夹里面的内容？原因分析通过OBS导入模型时，ModelArts会将指定的OBS目录下的所有文件和文件夹复制到镜像中的指定路径下，镜像内路径可以通过self

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
配置SWR组织权限 - AI开发平台ModelArts

配置SWR组织权限 IAM用户创建后，需要管理员在组织中为用户添加授权，使IAM用户对组织内所有镜像享有读取/编辑/管理的权限。只有具备“管理”权限的账号和IAM用户才能添加授权。登录容器镜像服务控制台。在左侧菜单栏选择“组织管理”，单击组织名称。在“用户”页签下单击“添

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置 > 权限配置
迁移评估 - AI开发平台ModelArts
迁移评估 - AI开发平台ModelArts

2.6，PyTorch 1.10，可以接受切换MindSpore。 - 业务编程语言、框架、版本。 C++/Python/JAVA等。例如：业务逻辑使用JAVA，推理服务模块使用C++自定义实现推理框架，Python 3.7等。 - CPU使用率业务中是否有大量使用CPU的代码

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
使用SFS盘出现报错rpc_check_timeout:939 callbacks suppressed - AI开发平台ModelArts

练。但有时候会出现读取速度变慢的现象，并且SFS提示报错"rpc_check_timeout:939 callbacks suppressed"。原因分析根据SFS客户端日志分析出现问题的时间点发现，SFS盘连接的客户端个数较多，在问题的时间点并发读取数据，I/O超高；当前

 帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
查看训练作业资源占用情况 - AI开发平台ModelArts

h_YLLsize过大导致内存溢出。提升数据读取的效率：如果读取一个batch数据的时间要长于GPU/NPU计算一个batch的时间，就有可能出现GPU/NPU利用率上下浮动的情况。建议优化数据读取和数据增强的性能，例如将数据读取并行化，或者使用NVIDIA Data Loading

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
管理训练容器环境变量 - AI开发平台ModelArts

TensorFlow为ps，worker “MA_TASK_NAME=worker” MA_NUM_HOSTS 实例数。系统自动从资源参数的“实例数”中读取。 “MA_NUM_HOSTS=4” VC_TASK_INDEX 当前容器索引，容器从0开始编号。单机训练的时候，该字段无意义。在多机作业

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
从OBS目录导入数据规范说明 - AI开发平台ModelArts

其中，“表格”类型的数据集，支持从OBS、DWS、DLI和MRS等数据源导入数据。从OBS目录导入数据时，当前操作用户需具备此OBS路径的读取权限。同时确保数据存储的OBS桶与ModelArts在同一区域。图像分类图像分类的数据支持两种格式： ModelArts imageNet

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导入数据到ModelArts数据集 > 从OBS导入数据到ModelArts数据集
训练tokenizer文件说明 - AI开发平台ModelArts

(0)[0] >= 7 修改文件tokenization_qwen.py： # tonkenization_qwen.py会在cache中读取SimSun.ttf 文件，如果没有，就会联网下载，ModelArts作业在执行过程中可能不能请求网络，会遇到报错。 # 直接手动下载 https://qianwen-res

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 训练脚本说明
训练tokenizer文件说明 - AI开发平台ModelArts

(0)[0] >= 7 修改文件tokenization_qwen.py： # tonkenization_qwen.py会在cache中读取SimSun.ttf 文件，如果没有，就会联网下载，ModelArts作业在执行过程中可能不能请求网络，会遇到报错。 # 直接手动下载 https://qianwen-res

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912） > 训练脚本说明
MoXing - AI开发平台ModelArts
MoXing - AI开发平台ModelArts

oint进行本地Fine Tune？训练作业使用MoXing复制数据较慢，重复打印日志 MoXing如何访问文件夹并使用get_size读取文件夹大小？

帮助中心 > AI开发平台ModelArts > 故障排除
硬盘限制故障 - AI开发平台ModelArts

硬盘限制故障下载或读取文件报错，提示超时、无剩余空间复制数据至容器中空间不足 Tensorflow多节点作业下载数据到/cache显示No space left 日志文件的大小达到限制日志提示"write line error" 日志提示“No space left on device”

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业
在ModelArts Standard上运行GPU单机多卡训练作业 - AI开发平台ModelArts

选择左侧导航栏的“总览”，单击页面右上角的“登录指令”，在弹出的页面中单击复制登录指令。此处生成的登录指令有效期为24小时，如果需要长期有效的登录指令，请参见获取长期有效登录指令。获取了长期有效的登录指令后，在有效期内的临时登录指令仍然可以使用。登录指令末尾的域名为镜像仓库地址，请记录该地址，后面会使用到。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
保存模型时出现Unable to connect to endpoint错误 - AI开发平台ModelArts

处理方法对于OBS连接不稳定的现象，通过增加代码来解决。您可以在代码最前面增加如下代码，让TensorFlow对ckpt和summary的读取和写入可以通过本地缓存的方式中转解决： import moxing.tensorflow as mox mox.cache() 父主题：

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
在ModelArts的Notebook中JupyterLab的目录、Terminal的文件和OBS的文件之间的关系是什么？ - AI开发平台ModelArts

JupyterLab目录的文件相同。挂载EVS存储的Notebook，JupyterLab目录的文件可使用Moxing接口或SDK接口，读取OBS中的文件。Terminal的文件与JupyterLab目录的文件相同。父主题： Standard Notebook

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
训练作业容错检查 - AI开发平台ModelArts

使用reload ckpt恢复中断的训练在容错机制下，如果因为硬件问题导致训练作业重启，用户可以在代码中读取预训练模型，恢复至重启前的训练状态。用户需要在代码里加上reload ckpt的代码，使能读取训练中断前保存的预训练模型。具体请参见断点续训练。父主题：模型训练高可靠性

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
云上迁移适配故障 - AI开发平台ModelArts

retCode=0x91, [the model stream execute failed]” 使用moxing适配OBS路径，pandas读取文件报错日志提示“Please upgrade numpy to >= xxx to use this pandas version” 重装的包与镜像装CUDA版本不匹配

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业

总条数： 228

上一页
1
2
3
4
5
...
12
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练作业访问OBS时，日志提示“stat:403 reason:Forbidden” - AI开发平台ModelArts

日志提示“pandas.errors.ParserError: Error tokenizing data. C error: Expected .* fields” - AI开发平台ModelArts

快速配置ModelArts委托授权 - AI开发平台ModelArts

在ModelArts上训练模型如何配置输入输出数据？ - AI开发平台ModelArts

创建模型时，OBS文件目录对应镜像里面的目录结构是什么样的？ - AI开发平台ModelArts

配置SWR组织权限 - AI开发平台ModelArts

迁移评估 - AI开发平台ModelArts

使用SFS盘出现报错rpc_check_timeout:939 callbacks suppressed - AI开发平台ModelArts

查看训练作业资源占用情况 - AI开发平台ModelArts

管理训练容器环境变量 - AI开发平台ModelArts

从OBS目录导入数据规范说明 - AI开发平台ModelArts

训练tokenizer文件说明 - AI开发平台ModelArts

训练tokenizer文件说明 - AI开发平台ModelArts

MoXing - AI开发平台ModelArts

硬盘限制故障 - AI开发平台ModelArts

在ModelArts Standard上运行GPU单机多卡训练作业 - AI开发平台ModelArts

保存模型时出现Unable to connect to endpoint错误 - AI开发平台ModelArts

在ModelArts的Notebook中JupyterLab的目录、Terminal的文件和OBS的文件之间的关系是什么？ - AI开发平台ModelArts

训练作业容错检查 - AI开发平台ModelArts

云上迁移适配故障 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线