搜索_华为云

使用AI Gallery微调大师训练模型 - AI开发平台ModelArts

“任务类型”是除“文本问答”和“文本生成”之外的类型（即自定义模型），则模型文件必须满足自定义模型规范（训练）才支持模型自定义训练。当使用自定义镜像进行模型微调时，要确认镜像是否满足自定义镜像规范，否则无法成功完成自定义训练。进入模型微调登录AI Gallery。单击“模型”进入模型列表。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
设置断点续训练 - AI开发平台ModelArts

训练输出设置断点续训练建议和训练容错检查（即自动重启）功能同时使用。在创建训练作业页面，开启“自动重启”开关。训练环境预检测失败、或者训练容器硬件检测故障、或者训练作业失败时会自动重新下发并运行训练作业。 PyTorch版reload ckpt PyTorch模型保存有两种方式。仅保存模型参数

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
自定义引擎创建模型规范 - AI开发平台ModelArts

8080:8080 -v model:/home/mind/model custom_engine:v1 该指令无法完全模拟线上，主要是由于-v挂载进去的目录是root权限。在线上，模型文件从OBS下载到/home/mind/model目录之后，文件owner将统一修改为ma-user。在

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
错误码 - AI开发平台ModelArts
错误码 - AI开发平台ModelArts

FailureAnalysisNotPossible 无法对未失败的作业进行失败分析请对运行失败的训练作业进行失败分析 400 ModelArts.2828 FailureAnalysisFailed 训练作业失败原因获取失败未知失败，请联系技术支持 400 ModelArts.2829

帮助中心 > AI开发平台ModelArts > API参考 > 公共参数
常见问题 - AI开发平台ModelArts
常见问题 - AI开发平台ModelArts

常见问题模型转换失败怎么办？常见的模型转换失败原因可以通过查询转换失败错误码来确认具体导失败的原因。Stable Diffusion新推出的模型在转换中可能会遇到算子不支持的问题，您可以到华为云管理页面上提交工单来寻求帮助。图片大Shape性能劣化严重怎么办？在昇腾设备上

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
数据集版本发布失败 - AI开发平台ModelArts

数据集版本发布失败出现此问题时，表示数据不满足数据管理模块的要求，导致数据集发布失败，无法执行自动学习的下一步流程。请根据如下几个要求，检查您的数据，将不符合要求的数据排除后再重新启动自动学习的训练任务。 ModelArts.4710 OBS权限问题 ModelArts在跟O

帮助中心 > AI开发平台ModelArts > 故障排除 > 自动学习 > 准备数据
创建数据集 - AI开发平台ModelArts

“/桶名称/文件路径”，例如“/obs-bucket/flower/rose/”（使用目录作为路径）。不能直接使用桶作为路径。输出位置不能与输入位置相同或者是输入位置的子目录。长度限制：不少于3字符，不能超过700个字符。字符限制：不允许出现的特殊字符有换行符(\n)、回车符(\r)、制表符(\t)。

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > 数据集管理
服务部署、启动、升级和修改时，资源不足如何处理？ - AI开发平台ModelArts

服务部署、启动、升级和修改时，资源不足如何处理？问题现象启动服务失败，报错：资源不足，服务调度失败。（Schedule failed due to insufficient resources. Retry later.或ModelArts.3976：No resources

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
在MaaS中创建模型 - AI开发平台ModelArts

区域，可以查看权重校验任务。图1 查看权重校验任务当状态显示运行失败时，鼠标悬停在状态即可查看失败信息，根据失败信息处理问题。常见的权限校验失败信息及其处理建议请参见表4。表4 权重校验常见的失败信息失败信息信息解释处理建议 Unknown error, please

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
在推理生产环境中部署推理服务 - AI开发平台ModelArts

在推理生产环境中部署推理服务本章节介绍如何在ModelArts的推理生产环境（ModelArts控制台的在线服务功能）中部署推理服务。 Step1 准备模型文件和权重文件在OBS桶中，创建文件夹，准备模型权重文件、推理启动脚本run_vllm.sh及SSL证书。此处以chatglm3-6b为例。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
训练模型时引用依赖包，如何创建训练作业？ - AI开发平台ModelArts

包时，由于系统无法自动下载并安装，因此需要在“代码目录”放置此whl包，同时创建一个命名为“pip-requirements.txt”的文件，并且在文件中指定此whl包的包名。依赖包必须为“.whl”格式的文件。例如，“代码目录”对应的OBS路径下，包含模型文件、whl包，同时

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 编写训练代码
pipeline应用准备 - AI开发平台ModelArts

mv stable-diffusion-v1-5 pytorch_models 此处由于Huggingface网站的限制以及模型文件的大小原因，很可能会下载失败。您可以登录Huggingface网站，从浏览器下载模型后，再手动上传到物理机/home/pytorch_models目录下。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
在推理生产环境中部署推理服务 - AI开发平台ModelArts

在推理生产环境中部署推理服务本章节介绍如何在ModelArts的推理生产环境（ModelArts控制台的在线服务功能）中部署推理服务。 Step1 准备模型文件和权重文件在OBS桶中，创建文件夹，准备模型权重文件、推理启动脚本run_vllm.sh及SSL证书。此处以chatglm3-6b为例。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
服务预测 - AI开发平台ModelArts
服务预测 - AI开发平台ModelArts

服务预测服务预测失败服务预测失败，报错APIG.XXXX 在线服务预测报错ModelArts.4206 在线服务预测报错ModelArts.4302 在线服务预测报错ModelArts.4503 在线服务预测报错MR.0105 Method Not Allowed 请求超时返回Timeout

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

Storage Service）与SFS Turbo文件系统联动，可以实现数据灵活管理、高性能读取数据等。通过OBS上传训练所需的模型文件、训练数据等，再将OBS中的数据文件导入到SFS Turbo，然后在训练作业中挂载SFS Turbo到容器对应ckpt目录，实现分布式读取训练数据文件。约束限制

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907）
使用自定义引擎在ModelArts Standard创建模型 - AI开发平台ModelArts

8080:8080 -v model:/home/mind/model custom_engine:v1 该指令无法完全模拟线上，主要是由于-v挂载进去的目录是root权限。在线上，模型文件从OBS下载到/home/mind/model目录之后，文件owner将统一修改为ma-user。在

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
如何将两个数据集合并？ - AI开发平台ModelArts

”获得此文件。创建一个空数据集C，即无任何输出，其输入位置选择一个空的OBS文件夹。在数据集C中，执行导入数据操作，将数据集A和数据集B的Manifest文件导入。导入完成后，即将数据集A和数据集B的数据分别都合并至数据集C中。如需使用合并后的数据集，再针对数据集C执行发布操作即可。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据管理
ModelArts中常用概念 - AI开发平台ModelArts

ModelArts中常用概念自动学习自动学习功能可以根据标注数据自动设计模型、自动调参、自动训练、自动压缩和部署模型，不需要代码编写和模型开发经验。只需三步，标注数据、自动训练、部署模型，即可完成模型构建。端-边-云端-边-云分别指端侧设备、智能边缘设备、公有云。推理

 帮助中心 > AI开发平台ModelArts > 产品介绍 > AI开发基础知识
使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

推理部署：训练结束后，将生成的模型导入ModelArts用于创建模型，并将模型部署为在线服务。 Step6 预测结果：上传一张手写数字图片，发起预测请求获取预测结果。 Step7 清除资源：运行完成后，停止服务并删除OBS中的数据，避免不必要的扣费。准备工作已注册华为账号并开通华为云，且

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练
在推理生产环境中部署推理服务 - AI开发平台ModelArts

在推理生产环境中部署推理服务本章节介绍如何在ModelArts的推理生产环境（ModelArts控制台的在线服务功能）中部署推理服务。 Step1 准备模型文件和权重文件在OBS桶中，创建文件夹，准备模型权重文件、推理启动脚本run_vllm.sh及SSL证书。此处以chatglm3-6b为例。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）

总条数： 1604

上一页
1
...
7
8
9
...
81
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用AI Gallery微调大师训练模型 - AI开发平台ModelArts

设置断点续训练 - AI开发平台ModelArts

自定义引擎创建模型规范 - AI开发平台ModelArts

错误码 - AI开发平台ModelArts

常见问题 - AI开发平台ModelArts

数据集版本发布失败 - AI开发平台ModelArts

创建数据集 - AI开发平台ModelArts

服务部署、启动、升级和修改时，资源不足如何处理？ - AI开发平台ModelArts

在MaaS中创建模型 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

训练模型时引用依赖包，如何创建训练作业？ - AI开发平台ModelArts

pipeline应用准备 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

服务预测 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

使用自定义引擎在ModelArts Standard创建模型 - AI开发平台ModelArts

如何将两个数据集合并？ - AI开发平台ModelArts

ModelArts中常用概念 - AI开发平台ModelArts

使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线