搜索_华为云

训练日志失败分析 - AI开发平台ModelArts

odelArts会自动识别导致作业失败的原因，在训练日志界面上给出提示。提示包括三部分：失败的可能原因、推荐的解决方案以及对应的日志（底色标红部分）。图1 训练故障识别 ModelArts Standard会对部分常见训练错误给出分析建议，目前还不能识别所有错误，提供的失败可能

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
Qwen-VL基于DevServer适配Pytorch NPU的Finetune训练指导（6.3.909） - AI开发平台ModelArts

Qwen-VL是规模视觉语言模型，可以以图像、文本、检测框作为输入，并以文本和检测框作为输出。具有强大的性能、多语言对话、多图交错对话、支持中文开放域定位、细粒度识别和理解等特点。本文档主要介绍如何利用训练框架PyTorch_npu + 华为自研Ascend Snt9B硬件，完成Qwen-VL Finetune训练。

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
Qwen-VL基于DevServer适配Pytorch NPU的Finetune训练指导(6.3.906) - AI开发平台ModelArts

Qwen-VL是规模视觉语言模型，可以以图像、文本、检测框作为输入，并以文本和检测框作为输出。具有强大的性能、多语言对话、多图交错对话、支持中文开放域定位、细粒度识别和理解等特点。本文档主要介绍如何利用训练框架PyTorch_npu + 华为自研Ascend Snt9B硬件，完成Qwen-VL Finetune训练。

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
使用ModelArts Standard自动学习实现口罩检测 - AI开发平台ModelArts

运行完成的工作流会自动部署为相应的在线服务，您只需要在相应的服务详情页面进行预测即可。在服务部署节点单击“实例详情”直接跳转进入在线服务详情页，或者在ModelArts管理控制台，选择“模型部署 > 在线服务”，单击生成的在线服务名称，即可进入在线服务详情页。在服务详情页，选择“预测”页签。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard自动学习
在开发环境中部署本地服务进行调试 - AI开发平台ModelArts

tor，其运行环境就是cpu.2u。部署在线服务Predictor，即将存储在OBS中的模型文件部署到线上服务管理模块提供的容器中运行，其环境规格（如CPU规格，GPU规格）由表3 predictor configs结构决定。部署在线服务Predictor需要线上服务端根据A

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
使用TMS标签实现资源分组管理 - AI开发平台ModelArts

可以在创建训练作业页面添加标签，也可以在已经创建完成的训练作业详情页面的“标签”页签中添加标签。在ModelArts的在线服务中添加标签。可以在创建在线服务页面添加标签，也可以在已经创建完成的在线服务详情页面的“标签”页签中添加标签。在ModelArts的专属资源池中添加标签。可以在创建ModelArts

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
在Standard上部署SD WebUI推理服务 - AI开发平台ModelArts

当AI应用状态变为正常时，表示创建完成。图6 AI应用创建完成步骤五部署服务单击AI应用名称，进入AI应用详情页，单击部署在线服务。图7 部署在线服务填写如下服务部署参数。名称：服务的名称，按照实际需要填写是否自动停止：如果配置自动停止，服务会按照配置的时间自动停止。如果需要常驻的服务，建议关掉该按钮。

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理 > SD WEBUI套件适配PyTorch NPU的推理指导（6.3.908）
配置授权 - AI开发平台ModelArts
配置授权 - AI开发平台ModelArts

配置授权功能介绍配置ModelArts授权。若没有授权，ModelArts训练管理、开发环境、数据管理、在线服务等功能将不能正常使用。该API支持管理员给IAM子用户设置委托，支持设置当前用户的访问密钥。调用该API需要在IAM系统里配置Security Administrator权限。

帮助中心 > AI开发平台ModelArts > API参考 > 授权管理
训练作业卡死检测 - AI开发平台ModelArts

时发现，就会导致无法及时释放资源，从而造成极大的资源浪费。为了节省训练资源成本，提高使用体验，ModelArts提供了卡死检测功能，能自动识别作业是否卡死，并在日志详情界面上展示，同时能配置通知及时提醒用户作业卡死。检测规则卡死检测主要是通过监控作业进程的状态和资源利用率来判

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
Cluster资源池节点故障如何定位 - AI开发平台ModelArts

NodeCondtition中。同时，节点故障指标默认会上报到AOM，您可在AOM配置告警通知。当发生节点异常时，在故障初步分析阶段，您可先按表1识别是否为亚健康并自助进行处理，若不是，则为故障，请联系客户经理发起维修流程（若无客户经理可提交工单）。表1 节点故障类型定义 NodeCondition

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
添加资源标签 - AI开发平台ModelArts

添加资源标签功能介绍给指定服务添加标签（目前只支持在线服务），当添加的标签key已存在，则覆盖该标签的value。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
ModelArts入门实践 - AI开发平台ModelArts

ModelArts Standard推理部署使用Standard一键完成商超商品识别模型部署本案例以“商超商品识别”模型为例，介绍从AI Gallery订阅模型，一键部署到ModelArts Standard，并进行在线推理预测的体验过程。面向AI开发零基础的用户从0-1制作自定义镜像并创建AI应用

 帮助中心 > AI开发平台ModelArts > 快速入门
Qwen-VL基于DevServer适配Pytorch NPU的推理指导(6.3.906) - AI开发平台ModelArts

Qwen-VL是规模视觉语言模型，可以以图像、文本、检测框作为输入，并以文本和检测框作为输出。具有强大的性能、多语言对话、多图交错对话、支持中文开放域定位、细粒度识别和理解等特点。本文档主要介绍如何利用训练框架PyTorch_npu + 华为自研Ascend Snt9B硬件，完成Qwen-VL推理。资源规格要求

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
Qwen-VL基于DevServer适配Pytorch NPU的Finetune训练指导(6.3.910) - AI开发平台ModelArts

Qwen-VL是规模视觉语言模型，可以以图像、文本、检测框作为输入，并以文本和检测框作为输出。具有强大的性能、多语言对话、多图交错对话、支持中文开放域定位、细粒度识别和理解等特点。本文档主要介绍如何利用训练框架PyTorch_npu + 华为自研Ascend Snt9B硬件，完成Qwen-VL Finetune训练。

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
Qwen-VL基于DevServer适配Pytorch NPU的推理指导（6.3.909） - AI开发平台ModelArts

Qwen-VL是规模视觉语言模型，可以以图像、文本、检测框作为输入，并以文本和检测框作为输出。具有强大的性能、多语言对话、多图交错对话、支持中文开放域定位、细粒度识别和理解等特点。本文档主要介绍如何利用训练框架PyTorch_npu + 华为自研Ascend Snt9B硬件，完成Qwen-VL推理。资源规格要求

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
服务预测失败 - AI开发平台ModelArts

出现ModelArts.XXXX类型的报错，表示请求在Dispatcher出现问题而被拦截。常见报错：在线服务预测报错ModelArts.4302 在线服务预测报错ModelArts.4206 在线服务预测报错ModelArts.4503 当使用推理的镜像并且出现MR.XXXX类型的错误时

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
（可选）本地服务器安装ModelArts SDK - AI开发平台ModelArts

SDK，则需要在本地环境中安装ModelArts SDK，安装后可直接调用ModelArts SDK轻松管理数据集、创建ModelArts训练作业及创建AI应用，并将其部署为在线服务。 ModelArts SDK使用限制本地ModelArts SDK不支持进行训练作业调测、模型调试和在开发环境中部署本地服务进行调

 帮助中心 > AI开发平台ModelArts > SDK参考
在推理生产环境中部署推理服务 - AI开发平台ModelArts

若权重文件大于60G，创建AI应用会报错，提示模型大于60G，请提工单扩容。 Step3 部署在线服务将Step2 部署模型中创建的AI应用部署为一个在线服务，用于推理调用。在ModelArts控制台，单击“模型部署 > 在线服务 > 部署”，开始部署在线服务。设置部署服务名称，选择Step2 部署模型中创建的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
迁移环境准备 - AI开发平台ModelArts

迁移环境准备迁移环境准备有以下两种方式：方式一 ModelArts Notebook：该环境为在线调试环境，主要面向演示、体验和快速原型调试场景。优点：可快速、低成本地搭建环境，使用标准化容器镜像，官方notebook示例可直接运行。缺点：由于是容器化环境因此不如裸机方式

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
更新模型服务的单个属性 - AI开发平台ModelArts

更新模型服务的单个属性功能介绍更新模型服务的单个属性，目前只支持instance_count(更新模型服务实例数量)，仅运行中、告警、异常状态下的在线服务可以执行该操作。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理

总条数： 382

上一页
1
...
6
7
8
...
20
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练日志失败分析 - AI开发平台ModelArts

Qwen-VL基于DevServer适配Pytorch NPU的Finetune训练指导（6.3.909） - AI开发平台ModelArts

Qwen-VL基于DevServer适配Pytorch NPU的Finetune训练指导(6.3.906) - AI开发平台ModelArts

使用ModelArts Standard自动学习实现口罩检测 - AI开发平台ModelArts

在开发环境中部署本地服务进行调试 - AI开发平台ModelArts

使用TMS标签实现资源分组管理 - AI开发平台ModelArts

在Standard上部署SD WebUI推理服务 - AI开发平台ModelArts

配置授权 - AI开发平台ModelArts

训练作业卡死检测 - AI开发平台ModelArts

Cluster资源池节点故障如何定位 - AI开发平台ModelArts

添加资源标签 - AI开发平台ModelArts

ModelArts入门实践 - AI开发平台ModelArts

Qwen-VL基于DevServer适配Pytorch NPU的推理指导(6.3.906) - AI开发平台ModelArts

Qwen-VL基于DevServer适配Pytorch NPU的Finetune训练指导(6.3.910) - AI开发平台ModelArts

Qwen-VL基于DevServer适配Pytorch NPU的推理指导（6.3.909） - AI开发平台ModelArts

服务预测失败 - AI开发平台ModelArts

（可选）本地服务器安装ModelArts SDK - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

迁移环境准备 - AI开发平台ModelArts

更新模型服务的单个属性 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线