搜索_华为云

保存ckpt时超时报错 - AI开发平台ModelArts

分钟时，会发生超时的错误。图1 报错提示解决方法 1. 需要保证磁盘IO带宽正常，可以在36分钟内将文件保存到磁盘。单个节点内，最大只有60G（实际应该在40G以下）的文件内容，只要在36分钟内保存完成，就不会报超时错误。 2. 忽略该报错，因为报错不影响实际报错的权重。父主题：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） > 常见错误原因和解决方法
moondream2基于DevServer适配PyTorch NPU推理指导 - AI开发平台ModelArts

当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。检查环境。 SSH登录机器后，检查NPU设备检查。运行如下命令，返回NPU设备信息。

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

准备AscendFactory训练代码、分词器Tokenizer和推理代码。准备数据准备训练数据，可以用本案使用的数据集，也可以使用自己准备的数据集。准备镜像准备训练模型适用的容器镜像。训练预训练/微调介绍如何进行训练，包括训练数据处理、超参配置、训练任务、性能查看。父主题：主流开源大模型基于Lite

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912）
第三方推理框架迁移到ModelArts Standard推理自定义引擎 - AI开发平台ModelArts

率，改善推理服务的性能。当从第三方推理框架迁移到使用ModelArts推理的模型管理和服务管理时，需要对原生第三方推理框架镜像的构建方式做一定的改造，以使用ModelArts推理平台的模型版本管理能力和动态加载模型的部署能力。本案例将指导用户完成原生第三方推理框架镜像到Mode

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
MindSpore日志提示“ retCode=0x91, [the model stream execute failed]” - AI开发平台ModelArts

failed] 原因分析出现该问题的可能原因如下：数据读入的速度跟不上模型迭代的速度。处理方法减少预处理shuffle操作。 dataset = dataset.shuffle(buffer_size=x) 关闭数据预处理开关，可能会影响性能。 NPURunConfig(

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
服务部署、启动、升级和修改时，拉取镜像失败如何处理？ - AI开发平台ModelArts

服务部署、启动、升级和修改时，拉取镜像失败。原因分析节点磁盘不足，镜像大小过大。解决方法首先考虑优化镜像，减小节点磁盘的占用。优化镜像无法解决问题，请联系系统管理员处理。父主题：服务部署

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
使用AI市场物体检测YOLOv3 - AI开发平台ModelArts

'feat_2': 'feat_2:0', 'feat_3': 'feat_3:0'} 不做数据集切分操作。如果选择未切分的数据集，算法将做纯训练场景；父主题：服务部署

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
训练作业日志中提示“No module named .*” - AI开发平台ModelArts

txt”的文件，并且在文件中指定此whl包的包名。依赖包必须为“.whl”格式的文件。例如，“代码目录”对应的OBS路径下，包含模型文件、whl包，同时还存在“pip-requirements.txt”文件。“代码目录”的结构如下所示： |---模型启动文件所在OBS文件夹

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
使用MaaS部署模型服务 - AI开发平台ModelArts

示为0。 “事件”：可以查看服务的事件信息。事件保存周期为1个月，1个月后自动清理数据。 “日志”：可以搜索和查看服务日志。删除部署任务删除操作无法恢复，请谨慎操作。登录ModelArts管理控制台。在左侧导航栏中，选择“ModelArts Studio”进入ModelArts

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
联网下载SimSun.ttf时可能会遇到网络问题 - AI开发平台ModelArts

Sun.ttf 2. 将文件 /home/ma-user/work/model-dir/Qwen-VL-Chat/tokenization_qwen.py 中的 30-35 行注释 3. 然后增加一行直接读取本地的Simsun.ttf文件，写绝对路径 # FONT_PATH

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 常见错误原因和解决方法
联网下载SimSun.ttf时可能会遇到网络问题 - AI开发平台ModelArts

Sun.ttf 2. 将文件 /home/ma-user/work/model-dir/Qwen-VL-Chat/tokenization_qwen.py 中的 30-35 行注释 3. 然后增加一行直接读取本地的Simsun.ttf文件，写绝对路径 # FONT_PATH

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912） > 常见错误原因和解决方法
运行训练作业时提示URL连接超时 - AI开发平台ModelArts

timed out> 原因分析由于安全性问题在ModelArts上不能联网下载。处理方法如果在运行训练作业时提示连接超时，请您将需要联网下载的数据提前下载至本地，并上传至OBS中。父主题：外网访问限制

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 外网访问限制
在线服务预测报错DL.0105 - AI开发平台ModelArts

0105，报错日志：“TypeError:‘float’object is not subscriptable”。原因分析根据报错日志分析，是因为一个float数据被当做对象下标访问了。处理方法将模型推理代码中的x[0][i]修改为x[i]，重新部署服务进行预测。父主题：服务预测

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
日志提示“No module name 'unidecode'” - AI开发平台ModelArts

module name 'unidecode'” 问题现象从mindspore开源gitee中master分支下载的tacotron2模型，修改配置文件后上传ModelArts准备训练，日志报错提示：No module name 'unidecode'。原因分析 requirements

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
使用Qwen2.5-72B-1K、Qwen2.5-32B调优的Checkpoint创建模型时，权重校验失败 - AI开发平台ModelArts

threshold. Reduce the disk usage or mount a larger disk.; 原因分析 Checkpoint文件过大。问题影响权重校验失败。处理方法使用Qwen2.5-72B-1K或Qwen2.5-32B模型的Checkpoint创建模型时，建议关闭权重校验。

帮助中心 > AI开发平台ModelArts > 常见问题 > Studio
计算规格说明 - AI开发平台ModelArts

户在宽限期内充值，则华为云会自动扣取欠费金额（含宽限期内产生的费用）保留期到期时仍未支付欠款（含宽限期内产生的费用），则付费资源将释放，数据无法恢复。宽限期和保留期的详细规则请参见宽限期保留期。父主题： AI Gallery（新版）

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

e policy”原则。该设计原则更推荐直接复制粘贴代码，而不是进行抽象处理。因此，与模型前向运算相关的所有源代码都被直接复制粘贴到同一个文件中，而不是调用某些抽象提取出的模块化库。Diffusers的这种设计原则的好处是代码简单易用、对代码贡献者友好。然而，这种反软件结构化的设

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
JupyterLab常用功能介绍 - AI开发平台ModelArts

在JupyterLab中编辑文件 JupyterLab可以在同一个窗口同时打开几个Notebook或文件（如HTML、TXT、Markdown等），以页签形式展示。 JupyterLab的一大优点是，可以任意排版多个文件。在右侧文件展示区，您可以拖动打开文件，随意调整文件展示位置，可以同时打开多个文件。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
如何在ModelArts的Notebook的CodeLab上安装依赖？ - AI开发平台ModelArts

install在Notebook或Terminal中安装依赖包。在Notebook中安装在总览页面进入CodeLab。在“Notebook”区域下，新建一个ipynb文件。在新建的Notobook中，在代码输入栏输入如下命令。 !pip install xxx 在Terminal中安装在Terminal里激活需要的anaconda

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
开发Workflow的核心概念介绍 - AI开发平台ModelArts

flow节点。 Data 数据对象用于节点的输入，主要可分为以下三种类型：真实的数据对象，在工作流构建时直接指定： Dataset：用于定义已有的数据集，常用于数据标注，模型训练等场景 LabelTask: 用于定义已有的标注任务，常用于数据标注，数据集版本发布等场景 OBSP

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考

总条数： 2149

上一页
1
...
90
91
92
...
108
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

保存ckpt时超时报错 - AI开发平台ModelArts

moondream2基于DevServer适配PyTorch NPU推理指导 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

第三方推理框架迁移到ModelArts Standard推理自定义引擎 - AI开发平台ModelArts

MindSpore日志提示“ retCode=0x91, [the model stream execute failed]” - AI开发平台ModelArts

服务部署、启动、升级和修改时，拉取镜像失败如何处理？ - AI开发平台ModelArts

使用AI市场物体检测YOLOv3 - AI开发平台ModelArts

训练作业日志中提示“No module named .*” - AI开发平台ModelArts

使用MaaS部署模型服务 - AI开发平台ModelArts

联网下载SimSun.ttf时可能会遇到网络问题 - AI开发平台ModelArts

联网下载SimSun.ttf时可能会遇到网络问题 - AI开发平台ModelArts

运行训练作业时提示URL连接超时 - AI开发平台ModelArts

在线服务预测报错DL.0105 - AI开发平台ModelArts

日志提示“No module name 'unidecode'” - AI开发平台ModelArts

使用Qwen2.5-72B-1K、Qwen2.5-32B调优的Checkpoint创建模型时，权重校验失败 - AI开发平台ModelArts

计算规格说明 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

JupyterLab常用功能介绍 - AI开发平台ModelArts

如何在ModelArts的Notebook的CodeLab上安装依赖？ - AI开发平台ModelArts

开发Workflow的核心概念介绍 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线