搜索_华为云

日志提示“label - AI开发平台ModelArts

generate a tmp label_map.pbtxt。原因分析算法要求标注框为矩形标注框，提供的数据标注为非矩形，因此导致该错误发生。处理方法请您将数据的标注改为矩形的标注框。建议与总结在训练作业前，推荐您检查数据的标注是否符合算法要求（如物体检测类算法的标注框为矩形标注框）。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 预置算法运行故障
删除DevServer实例 - AI开发平台ModelArts

charging_mode String 计费模式。 COMMON：同时支持包周期和按需 POST_PAID：按需模式 PRE_PAID：包周期 cloud_server CloudServer object 云服务信息。 endpoints_response Array of Endpoints

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
停止DevServer实例 - AI开发平台ModelArts

charging_mode String 计费模式。 COMMON：同时支持包周期和按需 POST_PAID：按需模式 PRE_PAID：包周期 cloud_server CloudServer object 云服务信息。 endpoints_response Array of Endpoints

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
执行训练任务（推荐） - AI开发平台ModelArts

ath、model_name_or_path根据实际要求选择，示例如下。输入数据集参数：是否使用已处理好数据集；是，设置以下超参 processed_data_dir:已处理好数据路径目录否，使用原始数据集，设置以下超参 dataset：训练时指定的输入原始数据集路径。输

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
服务部署失败，报错No Module named XXX - AI开发平台ModelArts

服务部署失败，报错：No Module named XXX 原因分析 No Module named XXX，表示模型中没有导入对应依赖模块。处理方法依赖模块没有导入，需要您在模型推理代码中导入缺失依赖模块。例如您的模型是Pytorch框架，部署为在线服务时出现告警：ModuleNotFoundError:

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
导入模型提示该账号受限或者没有操作权限 - AI开发平台ModelArts

导入模型账号欠费导致被冻结；导入模型账号没有对应工作空间的权限；导入模型账号为子账号，主账号没有给子账号赋予模型相关权限。权限说明请参见：策略及授权项说明；处理方法确认是账号欠费冻结，补交对应欠费，等待账号解冻即可；如果是导入模型没有对应的工作权限，可以参考创建自定义策略对相应账号赋予导入模型相关权限。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
创建模型时，OBS文件目录对应镜像里面的目录结构是什么样的？ - AI开发平台ModelArts

通过OBS导入模型时，ModelArts会将指定的OBS目录下的所有文件和文件夹复制到镜像中的指定路径下，镜像内路径可以通过self.model_path获取。处理方法获取镜像内的路径方法见模型推理代码编写说明。父主题：模型管理

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
ModelArts的Notebook是否支持Keras引擎？ - AI开发平台ModelArts

Keras是一个用Python编写的高级神经网络API，它能够以TensorFlow、CNTK或者Theano作为后端运行。Notebook开发环境支持“tf.keras”。如何查看Keras版本在ModelArts管理控制台，创建一个Notebook实例，镜像选择“TensorFlow-1.13”或“TensorFlow-1

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
日志提示“root: XXX valid number is 0” - AI开发平台ModelArts

该日志表示数据集中的有效样本量为0，可能有如下原因：数据未标注。标注的数据是不符合规格的（如目标检测算法要求标注为矩形框，但是提供数据标注为非矩形框）。处理方法请您检查数据是否已标注，或检查数据标注是否符合算法要求。父主题：预置算法运行故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 预置算法运行故障
时序预测-time_series_v2算法部署在线服务预测报错 - AI开发平台ModelArts

当预测的数据行数小于window超参值时，日志中有报错信息：ERROR: data is shorter than windows 。处理方法增加预测数据行数大于训练作业window超参值。重建训练作业，修改window超参值。父主题：服务预测

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
专属资源池关联SFS Turbo显示异常 - AI开发平台ModelArts

Turbo按钮置灰不可操作。图3 关联SFS Turbo状态原因分析 ModelArts缺少SFS Turbo委托权限导致关联或解除关联失败。处理方法需要您给ModelArts配置SFS Turbo委托权限，配置步骤请参考最佳实践的“委托授权ModelArts云服务使用SFS Turbo”章节。

帮助中心 > AI开发平台ModelArts > 故障排除 > 资源池
日志提示“ValueError: Invalid endpoint: obs.xxxx.com” - AI开发平台ModelArts

endpoint: obs. xxxx.com”。原因分析出现该问题的可能原因：直接在OBS上写tensorboard文件，存在不稳定的风险。处理方法建议先将Tensorboard文件写到本地，然后再复制回OBS。建议与总结在创建训练作业前，推荐您先使用ModelArts开发环

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
订阅算法物体检测YOLOv3 - AI开发平台ModelArts

该报错信息表示验证集中有label在训练集中不存在，可能由于在发布数据集版本进行数据切分时，训练集比例填写为0导致发布的数据全部为验证集，所以出现上述报错。处理方法重新发布数据，切分比例为0.8 或者0.9重新创建训练作业进行训练。父主题：训练作业运行失败

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败
训练作业性能降低 - AI开发平台ModelArts

使用ModelArts平台训练算法训练耗时增加。原因分析可能存在如下原因：平台上的代码经过修改优化、训练参数有过变更。训练的GPU硬件工作出现异常。处理方法请您对作业代码进行排查分析，确认是否对训练代码和参数进行过修改。检查资源分配情况（cpu/mem/gpu/snt9/infiniband）是否符合预期。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业性能问题
创建Qwen2-0.5B或Qwen2-1.5B模型的LoRA微调类型的调优任务，显示创建失败 - AI开发平台ModelArts

attribute 'main_grad' 原因分析 Qwen2-0.5B或Qwen2-1.5B模型不支持也不建议PP切分。问题影响训练无法进行。处理方法对于Qwen2-0.5B或Qwen2-1.5B模型，LoRA微调时不支持PP切分。请将切分策略PP设置为1。父主题： Studio

帮助中心 > AI开发平台ModelArts > 常见问题 > Studio
日志提示“AttributeError: 'NoneType' object has no attribute 'dtype'” - AI开发平台ModelArts

'NoneType' object has no attribute 'dtype'。原因分析训练镜像的numpy版本与Notebook中不一致。处理方法在代码中打印出numpy的版本，查看是否为1.18.5版本，如果非该版本号则在代码开始处执行： import os os.system('pip

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
推理业务迁移评估表 - AI开发平台ModelArts

使用了哪个huggingface的模型（例如digiplay/majicMIX_realistic_v6）。如果有预处理，后处理，对应的模型是什么（例如后处理的超分模型）。 - Lora/TextInversion 是否有动态加载Lora的需求，可否接受把Lora固定到模型内。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
日志提示“ '(slice(0, 13184, None), slice(None, None, None))' is an invalid key” - AI开发平台ModelArts

slice(None, None, None))' is an invalid key 原因分析出现该问题的可能原因如下：切分数据时，选择的数据不对。处理方法尝试如下代码： X = dataset.iloc[:,:-1].values 建议与总结在创建训练作业前，推荐您先使用ModelA

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
不同机型的对应的软件配套版本 - AI开发平台ModelArts

集群转发模式：iptables|ipvs huawei-npu npu-driver volcano 插件版本匹配关系请见表3。 RoCE 操作系统：Huawei Cloud EulerOS 2.0 64bit 内核版本：5.10.0-60.18.0.50.r865_35.hce2.aarch64 架构类型：aarch64

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster使用前必读
执行训练任务【新】 - AI开发平台ModelArts

【必修改】训练时指定的输入数据路径。请根据实际规划修改。用户根据训练情况二选一； processed_data_dir /home/ma-user/ws/xxx 已处理好数据路径目录，如有处理完成数据可设置此参数 scirpts_dir /home/ma-user/ws/llm_train/AscendFactory/scripts_modellink

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务

总条数： 1212

上一页
1
...
42
43
44
...
61
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

日志提示“label - AI开发平台ModelArts

删除DevServer实例 - AI开发平台ModelArts

停止DevServer实例 - AI开发平台ModelArts

执行训练任务（推荐） - AI开发平台ModelArts

服务部署失败，报错No Module named XXX - AI开发平台ModelArts

导入模型提示该账号受限或者没有操作权限 - AI开发平台ModelArts

创建模型时，OBS文件目录对应镜像里面的目录结构是什么样的？ - AI开发平台ModelArts

ModelArts的Notebook是否支持Keras引擎？ - AI开发平台ModelArts

日志提示“root: XXX valid number is 0” - AI开发平台ModelArts

时序预测-time_series_v2算法部署在线服务预测报错 - AI开发平台ModelArts

专属资源池关联SFS Turbo显示异常 - AI开发平台ModelArts

日志提示“ValueError: Invalid endpoint: obs.xxxx.com” - AI开发平台ModelArts

订阅算法物体检测YOLOv3 - AI开发平台ModelArts

训练作业性能降低 - AI开发平台ModelArts

创建Qwen2-0.5B或Qwen2-1.5B模型的LoRA微调类型的调优任务，显示创建失败 - AI开发平台ModelArts

日志提示“AttributeError: 'NoneType' object has no attribute 'dtype'” - AI开发平台ModelArts

推理业务迁移评估表 - AI开发平台ModelArts

日志提示“ '(slice(0, 13184, None), slice(None, None, None))' is an invalid key” - AI开发平台ModelArts

不同机型的对应的软件配套版本 - AI开发平台ModelArts

执行训练任务【新】 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线