搜索_华为云

创建模型失败，如何定位和处理问题？ - AI开发平台ModelArts

exec format error”。这种报错一般是因为所用镜像系统引擎和构建镜像的系统引擎不一致引起的，例如使用的是x86的镜像却标记的是arm的系统架构。可以通过查看模型详情看到配置的系统运行架构。基础镜像的系统架构详情可以参考推理基础镜像列表。父主题：模型管理

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
托管模型到AI Gallery - AI开发平台ModelArts

托管模型到AI Gallery AI Gallery上每个资产的文件都会存储在线上的AI Gallery存储库（简称AI Gallery仓库）里面。每一个模型实例视作一个资产仓库，模型实例与资产仓库之间是一一对应的关系。例如，模型名称为“Test”，则AI Gallery仓库有个

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型
通过patch操作对服务进行更新 - AI开发平台ModelArts

通过patch操作对服务进行更新功能介绍通过patch操作对服务进行更新。patch的格式可以参照json patch。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
使用AI Gallery微调大师训练模型 - AI开发平台ModelArts

lora_dropout float Lora dropout概率。 lora_rank int Lora attention维度。 per_device_train_batch_size int 用于训练的每个GPU/TPU core/CPU的批处理大小。 gradient_accumulation_steps

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
在推理生产环境中部署推理服务 - AI开发平台ModelArts

模型来源选择“从对象存储服务（OBS）中选择”，元模型选择转换后模型的存储路径，AI引擎选择“Custom”，引擎包选择准备镜像中上传的推理镜像。系统运行架构选择“ARM”。图3 设置AI应用单击“立即创建”开始AI应用创建，待应用状态显示“正常”即完成AI应用创建。首次创建AI应

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
昇腾云服务6.3.907版本说明 - AI开发平台ModelArts

MindSpore：MindSpore 2.3.0 FrameworkPTAdapter：6.0.RC2 如果用到CCE，版本要求是CCE Turbo v1.25及以上软件包获取地址软件包名称软件包说明获取地址 AscendCloud-6.3.907-xxx.zip 包含三

 帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
AIGC工具tailor使用指导 - AI开发平台ModelArts

2/use/downloads.html 需要下载的安装包与操作系统有关，请根据需要选择合适的安装包。如果操作系统为Linux aarch64，请下载mindspore-lite-2.2.10-linux-aarch64.tar.gz。如果操作系统为Linux x86_64，请下载mindspore-lite-2

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
ModelArts - AI开发平台ModelArts
ModelArts - AI开发平台ModelArts

ModelArts训练好后的模型如何获取？如何查看训练作业的资源占用情况？更多 Lite Server 哪里可以了解Atlas800训练服务器硬件相关内容 GPU A系列裸金属服务器如何更换NVIDIA和CUDA？更多开发环境在ModelArts的Notebook中使用不同的资源规格训练时为什么训练速度差不多？

帮助中心 > AI开发平台ModelArts > 成长地图
GPU A系列裸金属服务器如何更换NVIDIA和CUDA？ - AI开发平台ModelArts

当裸金属服务器预置的NVIDIA版本和业务需求不匹配时，需要更换NVIDIA驱动和CUDA版本。本文介绍华为云A系列GPU裸金属服务器（Ubuntu20.04系统）如何从“NVIDIA 525+CUDA 12.0”更换为“NVIDIA 515+CUDA 11.7”。操作步骤卸载原有版本的NVIDIA和CUDA。

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
管理训练容器环境变量 - AI开发平台ModelArts

Library）环境变量 OBS环境变量 PIP源环境变量 API网关地址环境变量作业元信息环境变量约束限制为了避免新设置的环境变量与系统环境变量冲突，而引起作业运行异常或失败，请在定义自定义环境变量时，不要使用“MA_”开头的名称。如何修改环境变量用户可以在创建训练作业

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
运行训练代码，出现dead kernel，并导致实例崩溃 - AI开发平台ModelArts

在Notebook实例中运行训练代码，如果数据量太大或者训练层数太多，亦或者其他原因，导致出现“内存不够”问题，最终导致该容器实例崩溃。出现此问题后，系统将自动重启Notebook，来修复实例崩溃的问题。此时只是解决了崩溃问题，如果重新运行训练代码仍将失败。如果您需要解决“内存不够”的问题

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 代码运行故障
GPU A系列裸金属服务器使用CUDA cudaGetDeviceCount()提示CUDA initializat失败 - AI开发平台ModelArts

A系列裸金属服务器使用CUDA cudaGetDeviceCount()提示CUDA initializat失败问题现象在A系列GPU裸金属服务器上，系统环境是ubuntu20.04+nvidia515+cuda11.7，使用Pytorch2.0时出现如下错误： CUDA initialization:

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
离线训练安装包准备说明 - AI开发平台ModelArts

机器或资源池无法连通网络，并无法git clone下载代码、安装python依赖包的情况下，用户则需要找到已联网的机器（本章节以Linux系统机器为例）提前下载资源，以实现离线安装。用户可遵循以下步骤操作。步骤一：资源下载 Python依赖包下载：进入 scripts/install

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.910） > 训练脚本说明参考
基于MaaS DeepSeek API和Dify快速构建网站智能客服 - AI开发平台ModelArts

MaaS部署模型服务。背景介绍客服系统是企业与消费者沟通的重要桥梁，然而传统的人工客服存在着人工成本高昂、数据收集和分析困难、难以24小时提供服务等痛点。随着AI大模型的崛起，如何利用先进的大语言模型构建AI智能体并应用于智能客服系统，提供更加自然、流畅的对话体验，提高用户

 帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek系列模型推理
在ModelArts上如何创建引用第三方依赖包的训练作业？ - AI开发平台ModelArts

ModelArts支持训练模型过程中安装第三方依赖包。在训练代码目录下放置“pip-requirements.txt”文件后，在训练启动文件被执行前系统会执行如下命令，以安装用户指定的Python Packages。 pip install -r pip-requirements.txt

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
SFT全参微调训练 - AI开发平台ModelArts

使用预训练的alpaca数据集。 GeneralInstructionHandler：使用微调的alpaca数据集。 MOSSMultiTurnHandler：使用微调的moss数据集。 MBS 4 表示流水线并行中一个micro batch所处理的样本量。在流水线并行中，为了减

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.908）
昇腾云服务6.3.908版本说明 - AI开发平台ModelArts

MindSpore：MindSpore 2.3.0 FrameworkPTAdapter：6.0.RC3 如果用到CCE，版本要求是CCE Turbo v1.28及以上软件包获取地址软件包名称软件包说明获取地址 AscendCloud-6.3.908-xxx.zip 包含三

 帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
MoXing进阶用法的样例代码 - AI开发平台ModelArts

read_hdf_origin(local_file, key, mode, **kwargs) mox.file.remove(local_file) return result setattr(NDFrame, 'to_hdf', to_hdf_override) setattr(pytables

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 在Notebook中使用Moxing命令
查询处理任务详情 - AI开发平台ModelArts

"create_time" : 1606373999627, "result" : "xxx", "version_id" : "XwTuRqI9En7xuZskW70", "is_current" : true } 状态码状态码描述 200 OK 401 Unauthorized

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
报错“Permissions for 'x:/xxx.pem' are too open”如何解决？ - AI开发平台ModelArts

问题现象原因分析原因分析一：密钥文件未放在指定路径，详情请参考安全限制或VS Code文档。请参考解决方法一处理。原因分析二：当操作系统为macOS/Linux时，可能是密钥文件或放置密钥的文件夹权限问题，请参考解决方法二处理。解决方法解决方法一：请将密钥放在如下路径或其子路径下：

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理

总条数： 875

上一页
1
...
30
31
32
...
44
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建模型失败，如何定位和处理问题？ - AI开发平台ModelArts

托管模型到AI Gallery - AI开发平台ModelArts

通过patch操作对服务进行更新 - AI开发平台ModelArts

使用AI Gallery微调大师训练模型 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

昇腾云服务6.3.907版本说明 - AI开发平台ModelArts

AIGC工具tailor使用指导 - AI开发平台ModelArts

ModelArts - AI开发平台ModelArts

GPU A系列裸金属服务器如何更换NVIDIA和CUDA？ - AI开发平台ModelArts

管理训练容器环境变量 - AI开发平台ModelArts

运行训练代码，出现dead kernel，并导致实例崩溃 - AI开发平台ModelArts

GPU A系列裸金属服务器使用CUDA cudaGetDeviceCount()提示CUDA initializat失败 - AI开发平台ModelArts

离线训练安装包准备说明 - AI开发平台ModelArts

基于MaaS DeepSeek API和Dify快速构建网站智能客服 - AI开发平台ModelArts

在ModelArts上如何创建引用第三方依赖包的训练作业？ - AI开发平台ModelArts

SFT全参微调训练 - AI开发平台ModelArts

昇腾云服务6.3.908版本说明 - AI开发平台ModelArts

MoXing进阶用法的样例代码 - AI开发平台ModelArts

查询处理任务详情 - AI开发平台ModelArts

报错“Permissions for 'x:/xxx.pem' are too open”如何解决？ - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线