搜索_华为云

约束与限制 - AI开发平台ModelArts

业优先级。公共资源池和旧版专属资源池均不支持设置训练作业优先级。仅支持PyTorch和MindSpore框架的分布式训练和调测，如果MindSpore要进行多机分布式训练调试，则每台机器上都必须有8张卡。使用自定义镜像创建训练作业时，镜像大小推荐15GB以内，最大不要超过资源

 帮助中心 > AI开发平台ModelArts > 产品介绍
资源选择推荐 - AI开发平台ModelArts

多机多卡：大数据量（1T训练数据）、高算力场景（4台8卡Vnt1），存储方案使用“SFS（存放数据）+普通OBS桶（存放代码）”，采用分布式训练。表1 不同场景所需服务及购买推荐场景 OBS SFS SWR DEW ModelArts VPC ECS EVS 单机单卡按需购买。（并行文件系统）

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练
如何处理使用opencv.imshow造成的内核崩溃？ - AI开发平台ModelArts

而matplotlib不存在这个问题。解决方法参考如下示例进行图片显示。注意opencv加载的是BGR格式，而matplotlib显示的是RGB格式。 Python语言： 1 2 3 4 5 6 from matplotlib import pyplot as plt import cv2 img = cv2

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 代码运行故障
在ModelArts Standard上运行GPU训练作业的场景介绍 - AI开发平台ModelArts

多机多卡：大数据量（1T训练数据）、高算力场景（4台8卡Vnt1），存储方案推荐使用“SFS（存放数据）+普通OBS桶（存放代码）”，采用分布式训练。当使用SFS+OBS的存储方案可以实现存储加速，该方案的端到端实践案例请参见面向AI场景使用OBS+SFS Turbo的存储加速实践。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
集成在线服务API至生产环境中应用 - AI开发平台ModelArts

I，SDK调用方式请参见《SDK参考》>“场景1：部署在线服务Predictor的推理预测”。除此之外，您还可以使用常见的开发工具及开发语言调用此接口，建议通过互联网搜索并获取调用标准Restful API的指导。父主题：管理同步在线服务

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
ModelArts入门实践 - AI开发平台ModelArts

Standard专属资源池提供的计算资源，结合SFS和OBS存储，在ModelArts Standard的训练环境中开展单机单卡、单机多卡、多机多卡分布式训练。面向熟悉代码编写和调测的AI工程师，同时了解SFS和OBS云服务从 0 制作自定义镜像并用于训练（Pytorch+CPU/GPU）

帮助中心 > AI开发平台ModelArts > 快速入门
Standard模型部署 - AI开发平台ModelArts

Standard模型部署 ModelArts Standard提供模型、服务管理能力，支持多厂商多框架多功能的镜像和模型统一纳管。通常AI模型部署和规模化落地非常复杂。例如，智慧交通项目中，在获得训练好的模型后，需要部署到云、边、端多种场景。如果在端侧部署，需要一次性部署到不

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
模型训练使用流程 - AI开发平台ModelArts

参见以PyTorch框架创建训练作业。训练作业进阶功能 ModelArts Standard还支持以下训练进阶功能，例如：增量训练分布式训练训练加速训练高可靠性查看训练结果和日志查看训练作业详情训练作业运行中或运行结束后，可以在训练作业详情页面查看训练作业的参数设置，训练作业事件等。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
通过APP认证的方式访问在线服务 - AI开发平台ModelArts

方式一：使用Python语言通过AppKey+AppSecret认证鉴权方式发送预测请求方式二：使用Java语言通过AppKey+AppSecret认证鉴权方式发送预测请求方式三：使用Python语言通过AppCode认证鉴权方式发送预测请求方式四：使用Java语言通过AppCode认证鉴权方式发送预测请求

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的认证方式
简介 - AI开发平台ModelArts
简介 - AI开发平台ModelArts

移，目前推荐使用MindSpore-Lite推理路线，可以利用MindSpore提供的图编译和自动调优能力，达到更好的模型性能。 LLM大语言模型场景，在GPU下通常会使用vLLM等大模型推理框架，因此迁移到昇腾时，推荐使用PyTorch + ascend-vllm技术路线进行迁移。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

S Turbo存储联动，可以将最新的训练数据导入到SFS Turbo，然后在训练作业中挂载SFS Turbo到容器对应ckpt目录，实现分布式读取训练数据文件。创建SFS Turbo文件系统前提条件：创建SFS Turbo文件系统前，确认已有可用的VPC。需要由IAM用户设置SFS

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 准备工作
使用MaaS调优模型 - AI开发平台ModelArts

规格选择规格，规格中描述了服务器类型、型号等信息，仅显示模型支持的资源。计算节点个数当计算节点个数大于1，将启动多节点分布式训练。详细信息，请参见分布式训练功能介绍。更多选项永久保存日志选择是否打开“永久保存日志”开关。开关关闭（默认关闭）：表示不永久保存日志，则任务

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
使用PyCharm ToolKit创建并调试训练作业 - AI开发平台ModelArts

显示专属资源池规格。 Compute Nodes 计算资源节点个数。数量设置为1时，表示单机运行；数量设置大于1时，表示后台的计算模式为分布式。 Available/Total Nodes 当“Specifications”选择专属资源池规格时，显示专属资源池的可用实例数和总实例数，用户选择“Compute

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 创建调试训练作业
通过AK/SK认证的方式访问在线服务 - AI开发平台ModelArts

IG SDK访问在线服务，具体操作流程如下：获取AK/SK 获取在线服务信息发送预测请求方式一：使用Python语言发送预测请求方式二：使用Java语言发送预测请求 AK/SK签名认证方式，仅支持Body体12M以内，12M以上的请求，需使用Token认证。客户端须注意

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的认证方式
创建Standard专属资源池 - AI开发平台ModelArts

选择多个规格的CPU架构必须相同。例如都是X86，或者都是ARM。如果选择了多个GPU或NPU规格，由于不同规格的参数网络平面不互通，分布式训练时训练速度会受到影响。如果您要做分布式训练，建议您只选择一个GPU或NPU规格。一个资源池中，最多可添加10种规格。资源调度与切分自定义驱动默认关

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理
切换Lite Server服务器操作系统 - AI开发平台ModelArts

图2 切换操作系统在切换操作系统界面，选择上一步接收到的共享镜像即可。使用BMS Go SDK的方式切换操作系统以下为BMS使用Go语言通过SDK方式切换操作系统的示例代码。 package main import ( "fmt" "os" "github

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理
通过Token认证的方式访问在线服务 - AI开发平台ModelArts

Postman。方式二：使用curl命令发送预测请求。Linux系统建议使用curl命令。方式三：使用Python语言发送预测请求。方式四：使用Java语言发送预测请求。约束限制调用API访问在线服务时，对预测请求体大小和预测时间有限制：请求体的大小不超过12MB，超过后请求会被拦截。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的认证方式
训练迁移快速入门案例 - AI开发平台ModelArts

torch_npu初始化后，原则上需要用户将原来代码中CUDA相关的内容迁移到NPU相关的接口上，包含算子API、显存操作、数据集操作、分布式训练的参数面通信nccl等，手动操作修改点较多且较为分散，因此昇腾提供了自动迁移工具transfer_to_npu帮助用户快速迁移。自动

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导
发布和管理AI Gallery项目 - AI开发平台ModelArts

更吸引人。也可以修改资产的可见性。编辑Notebook介绍在Notebook详情页，单击“项目介绍”。在基础设置中设置“许可证”、“语言”、“框架”、“任务类型”和“硬件资源”等信息。单击“确定”。编辑设置基本设置单击右侧的，可以更改Notebook名称和描述。编辑完成之后单击“确定”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
终止训练作业 - AI开发平台ModelArts

表36 flavor_info 参数参数类型描述 max_num Integer 可以选择的最大节点数量（max_num，为1代表不支持分布式）。 cpu cpu object cpu规格信息。 gpu gpu object gpu规格信息。 npu npu object Ascend规格信息。

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业

总条数： 1181

上一页
1
...
53
54
55
...
60
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

约束与限制 - AI开发平台ModelArts

资源选择推荐 - AI开发平台ModelArts

如何处理使用opencv.imshow造成的内核崩溃？ - AI开发平台ModelArts

在ModelArts Standard上运行GPU训练作业的场景介绍 - AI开发平台ModelArts

集成在线服务API至生产环境中应用 - AI开发平台ModelArts

ModelArts入门实践 - AI开发平台ModelArts

Standard模型部署 - AI开发平台ModelArts

模型训练使用流程 - AI开发平台ModelArts

通过APP认证的方式访问在线服务 - AI开发平台ModelArts

简介 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

使用MaaS调优模型 - AI开发平台ModelArts

使用PyCharm ToolKit创建并调试训练作业 - AI开发平台ModelArts

通过AK/SK认证的方式访问在线服务 - AI开发平台ModelArts

创建Standard专属资源池 - AI开发平台ModelArts

切换Lite Server服务器操作系统 - AI开发平台ModelArts

通过Token认证的方式访问在线服务 - AI开发平台ModelArts

训练迁移快速入门案例 - AI开发平台ModelArts

发布和管理AI Gallery项目 - AI开发平台ModelArts

终止训练作业 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线