搜索_华为云

创建训练作业 - AI开发平台ModelArts

from modelarts.estimatorV2 import Estimator session = Session() #训练脚本里接收的参数，请根据实际情况填写 parameters = [{"name": "mod", "value":"gpu"},

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

quit) Step4 请求推理服务另外启动一个terminal，使用命令测试推理服务是否正常启动，端口请修改为启动服务时指定的端口。使用命令测试推理服务是否正常启动。服务启动命令中的参数设置请参见表1。方式一：通过OpenAI服务API接口启动服务使用以下推理测试命令。${d

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
【下线公告】华为云ModelArts服务模型转换下线公告 - AI开发平台ModelArts

om格式的模型转换能力，在ModelArts中逐步增加.mindir格式的支持能力。下线模型转换后是否有替代功能？您可以通过链接下载ATC模型转换工具，按照指导，在线下转换成.om格式模型。 ModelArts中是否还会增加模型转换的能力？ ModelArts开发环境中在贵阳一Region，支持将ONNX或PyTorch模型转换到

 帮助中心 > AI开发平台ModelArts > 服务公告 > 下线公告
迁移环境准备 - AI开发平台ModelArts

迁移环境准备迁移环境准备有以下两种方式：表1 方式说明序号名称说明方式一 ModelArts Notebook 该环境为在线调试环境，主要面向演示、体验和快速原型调试场景。优点：可快速、低成本地搭建环境，使用标准化容器镜像，官方Notebook示例可直接运行。缺点

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
使用AWQ量化 - AI开发平台ModelArts

/home/ma-user/Qwen1.5-72B-Chat-AWQ 参数说明： model：模型路径。 Step3 启动AWQ量化服务参考Step6 启动推理服务，在启动服务时添加如下命令。 -q awq 或者--quantization awq 父主题：推理模型量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
使用AWQ量化 - AI开发平台ModelArts

/home/ma-user/Qwen1.5-72B-Chat-AWQ 参数说明： model：模型路径。 Step3 启动AWQ量化服务参考Step6 启动推理服务，在启动服务时添加如下命令。 -q awq 或者--quantization awq 父主题：推理模型量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
训练作业运行失败，出现NCCL报错 - AI开发平台ModelArts

Connection refused, retrying”。原因分析 NCCL是一个提供GPU间通信原语的库，实现集合通信和点对点发送/接收原语。当训练作业出现NCCL的报错时，可以通过调整NCCL的环境变量尝试解决问题。处理步骤进入状态“运行失败”的训练作业详情页，单击“日志”页签，查看NCCL报错。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败
推理精度测试 - AI开发平台ModelArts

1:${port}/v1/completions"；若服务部署在生产环境中，该地址由API接口公网地址与"/v1/completions"拼接而成，部署成功后的在线服务详情页中可查看API接口公网地址。图1 API接口公网地址 few_shot：开启少量样本测试后添加示例样本的个数。默认为3，取值范围为0~5整数。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
服务启动失败 - AI开发平台ModelArts

e.py编写有误，可以通过查看服务运行日志，定位具体原因进行修复。拉取镜像失败服务启动失败，提示拉取镜像失败，请参考服务部署、启动、升级和修改时，拉取镜像失败如何处理？资源不足，服务调度失败服务启动失败，提示资源不足，服务调度失败，请参考服务部署、启动、升级和修改时，资源不足如何处理？

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
管理Workflow Execution - AI开发平台ModelArts

dataset：数据集 obs：OBS swr：SWR model_list：AI应用列表 label_task：标注任务 service：在线服务 conditions 否 Array of Constraint objects 数据约束条件。 value 否 Map<String

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
获取APP列表 - AI开发平台ModelArts

需要明文展示的app_id集合。请求参数表3 请求Header参数参数是否必选参数类型描述 Content-Type 否 String 消息体的类型。设置为text/plain，返回临时预览链接。设置为application/octet-stream，返回临时下载链接。 X-Auth-Token

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
分离部署推理服务 - AI开发平台ModelArts

USE_OPENAI：仅在服务入口实例生效，用于配置api-server服务是否使用openai服务，默认为1。当配置为1时，启动服务为openai服务；当配置为0时，启动服务为vllm服务。其中常见的参数如下： --host：服务部署的IP --port：服务部署的端口，注意如果不

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.911） > 部署推理服务
使用AWQ量化工具转换权重 - AI开发平台ModelArts

/home/ma-user/Qwen1.5-72B-Chat-AWQ 参数说明： model：模型路径。 Step3 启动AWQ量化服务参考Step3 启动推理服务，在启动服务时添加如下命令。 --q awq 或者--quantization awq 父主题：推理模型量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
产品优势 - AI开发平台ModelArts
产品优势 - AI开发平台ModelArts

理统一管理 AI 开发全流程，提升开发效率，记录模型构建实验全流程多场景部署，灵活满足业务需求支持云端/边端部署等多种生产环境支持在线推理、批量推理、边缘推理多形态部署 AI工程化能力，支持AI全流程生命周期管理支持MLOps能力，提供数据诊断、模型监测等分析能力，训练智能日志分析与诊断

 帮助中心 > AI开发平台ModelArts > 产品介绍
精度调优总体思路 - AI开发平台ModelArts

向信息，通过工具构造相应的API单元测试，将NPU输出与标杆比对，从而检测出精度有差异的API。更多介绍请参考Msprobe工具离线预检和在线预检介绍。父主题： PyTorch迁移精度调优

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
更新资源池 - AI开发平台ModelArts

X-ModelArts-User-ID 否 String 实际的外部租户ID，如果有的话，工作空间鉴权以该ID为准。 Content-Type 是 String 消息体的类型（格式），取值为application/merge-patch+json。表3 请求Body参数参数是否必选参数类型描述

 帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
MA-Advisor使用指导 - AI开发平台ModelArts

MA-Advisor使用指导工具安装下载ma-advisor安装包至开发环境中。（可选）完成软件包签名校验。下载软件包签名校验文件。安装openssl并进行软件一致性验证，具体签名校验命令如下： openssl cms -verify -binary -in ma_ad

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > MA-Advisor自动诊断工具使用指导
订阅算法物体检测YOLOv3 - AI开发平台ModelArts

订阅算法物体检测YOLOv3_ResNet18(Ascend)训练失败报错label_map.pbtxt cannot be found 问题现象使用订阅算法物体检测YOLOv3_ResNet18(Ascend) 进行训练作业，训练失败报错label_map.pbtxt cannot

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败
NPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

中，以确保所有用户的新会话都不会因为空闲而断开。但是在生产环境或多人使用的公共服务器上，不建议设置TMOUT=0，关闭自动注销功能会带来一定的安全风险。磁盘合并挂载。成功购买裸金属服务器后，服务器上可能会有多个未挂载的nvme磁盘。因此在首次配置环境前，需要完成磁盘合并挂载

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置 > 配置Lite Server软件环境
AI Gallery功能介绍 - AI开发平台ModelArts

开发者快速了解并学习大模型。构建零门槛线上模型体验，零基础开发者开箱即用，初学者三行代码使用所有模型通过AI Gallery的AI应用在线模型体验，可以实现模型服务的即时可用性，开发者无需经历繁琐的环境配置步骤，即可直观感受模型效果，快速尝鲜大模型，真正达到“即时接入，即时体验”的效果。

帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍

总条数： 1361

上一页
1
...
16
17
18
...
69
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建训练作业 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

【下线公告】华为云ModelArts服务模型转换下线公告 - AI开发平台ModelArts

迁移环境准备 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

训练作业运行失败，出现NCCL报错 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

服务启动失败 - AI开发平台ModelArts

管理Workflow Execution - AI开发平台ModelArts

获取APP列表 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

产品优势 - AI开发平台ModelArts

精度调优总体思路 - AI开发平台ModelArts

更新资源池 - AI开发平台ModelArts

MA-Advisor使用指导 - AI开发平台ModelArts

订阅算法物体检测YOLOv3 - AI开发平台ModelArts

NPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

AI Gallery功能介绍 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线