搜索_华为云

创建IAM用户并授权使用MaaS - AI开发平台ModelArts

SWR OperateAccess 必选 CES云监控授予子用户使用CES云监控服务的权限。通过CES云监控可以查看ModelArts的在线服务和对应模型负载运行状态的整体情况，并设置监控告警。 CES FullAccess 必选 SMN消息服务授予子用户使用SMN消息服务的

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 配置MaaS访问授权
发布数据 - AI开发平台ModelArts
发布数据 - AI开发平台ModelArts

“指定用户”：表示仅特定用户可以查看及使用该资产。 “仅自己可见”：表示只有当前账号可以查看并使用该资产。阅读并同意《华为云AI Gallery数字内容发布协议》和《华为云AI Gallery服务协议》。单击“发布”。发布数据时，数据集文件所在的OBS文件夹不能增加或删除文件，否则

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 发布分享
创建处理任务 - AI开发平台ModelArts

DATASET：数据集 version_id 否 String 数据集的版本。 version_name 否 String 数据集的版本名称，名称仅包含数字、字母、中划线和下划线，长度是0-32位。响应参数状态码： 200 表7 响应Body参数参数参数类型描述 task_id String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
昇腾云服务6.3.912版本说明 - AI开发平台ModelArts

Llmma-3.2-11b CogVideoX1.5 5b MiniCPM-V2.6 文生图模型训练推理文生视频模型训练推理多模态模型训练推理数字人模型训练推理 CV，包名：AscendCloud-CV 支持如下模型适配MindSpore Lite的推理： Yolov8 Bert 支持如下模型适配PyTorch

帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
昇腾云服务6.3.911版本说明 - AI开发平台ModelArts

LLaVA MiniCPM-V2.0 FLUX.1 Llmma-3.2-11b 文生图模型训练推理文生视频模型训练推理多模态模型训练推理数字人模型训练推理 CV，包名：AscendCloud-CV 支持如下模型适配MindSpore Lite的推理： Yolov8 Bert 支持如下模型适配PyTorch

帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
创建DevServer - AI开发平台ModelArts

用于登录服务器密码。注意admin_pass和key_pair_name必须二选一。密码规则：长度为8至26个至少包含大写字母、小写字母、数字及特殊符号(!@%-_=+[{}]:,./?)中的3种不能与用户名或倒序的用户名相同不能包含root或administrator及其逆序

 帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
查询算法详情 - AI开发平台ModelArts

metadata 参数参数类型描述 id Integer 算法uuid，创建算法时无需填写。 name String 算法名称。限制为1-64位只含数字、字母、下划线和中划线的名称。 description String 对算法的描述，默认为“NULL”，字符串的长度限制为[0, 256]。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
使用MaaS部署模型服务 - AI开发平台ModelArts

部署模型服务参数说明服务设置服务名称自定义部署模型服务的名称。支持1~64位，以中文、大小写字母开头，只包含中文、大小写字母、数字、中划线、下划线的名称。描述自定义部署模型服务的简介。支持256字符。模型设置部署模型单击“选择模型”，选择“模型广场”或“我的模型”下面的模型。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
创建生产训练作业 - AI开发平台ModelArts

名称必填，训练作业的名称。系统会自动生成一个名称，可以根据业务需求重新命名，命名规则如下：支持1~64位字符。可以包含大小写字母、数字、中划线（-）或下划线（_）。描述训练作业的简介，便于在训练作业列表了解作业信息。选择创建方式（使用我的算法）如果选择使用已有算法

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
使用AWQ量化 - AI开发平台ModelArts

Step3 权重格式离线转换（可选） AutoAWQ量化完成后，使用int32对int4的权重进行打包。昇腾上使用int8对权重进行打包，在线转换会增加启动时间，可以提前对权重进行转换以减少启动时间，转换步骤如下：进入llm_tools/AutoAWQ代码目录下执行以下脚本：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
使用AWQ量化 - AI开发平台ModelArts

Step3 权重格式离线转换（可选） AutoAWQ量化完成后，使用int32对int4的权重进行打包。昇腾上使用int8对权重进行打包，在线转换会增加启动时间，可以提前对权重进行转换以减少启动时间，转换步骤如下：进入llm_tools/AutoAWQ代码目录下执行以下脚本：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
投机推理使用说明 - AI开发平台ModelArts

平均可以生成3个有效token，即用1.5倍的时间代价，生成了3倍的token数量，性能提升了100%。投机推理参数设置在启动离线或在线推理服务时参考表1所示配置参数，使用投机推理功能。表1 投机推理相关参数服务启动方式配置项取值类型配置说明 offline speculative_model

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 投机推理
使用AWQ量化 - AI开发平台ModelArts

Step3 权重格式离线转换（可选） AutoAWQ量化完成后，使用int32对int4的权重进行打包。昇腾上使用int8对权重进行打包，在线转换会增加启动时间，可以提前对权重进行转换以减少启动时间，转换步骤如下：进入llm_tools/AutoAWQ代码目录下执行以下脚本：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
MiniCPM-V2.0推理及LoRA微调基于Lite Server适配PyTorch NPU指导（6.3.910） - AI开发平台ModelArts

-V2.0。该模型基于MiniCPM 2.4B和SigLip-400M构建，共拥有2.8B参数。MiniCPM-V2.0具有领先的光学字符识别（OCR）和多模态理解能力。该模型在综合性OCR能力评测基准OCRBench上达到开源社区的最佳水平，甚至在场景文字理解方面实现接近 Gemini

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
配置Workflow的输入输出目录 - AI开发平台ModelArts

= wf.steps.JobStep( name="training_job", # 训练节点的名称，命名规范(只能包含英文字母、数字、下划线（_）、中划线（-），并且只能以英文字母开头，长度限制为64字符)，一个Workflow里的两个step名称不能重复 title="图像分类训练"

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
依赖和委托 - AI开发平台ModelArts

业务场景依赖的服务委托授权项说明在线服务 LTS lts:groups:create lts:groups:list lts:topics:create lts:topics:delete lts:topics:list 建议配置，在线服务配置LTS日志上报。批量服务 OBS

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 权限控制方式
查询AI应用详情 - AI开发平台ModelArts

doc_name String 文档名称，支持1-48位可见字符（含中文），只能以英文大小写字母或者中文字符开头，名称可以包含字母、中文、数字、中划线、下划线。表5 ModelHealth 参数参数类型描述 protocol String 健康检查接口请求协议，当前仅支持http。

帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
查询处理任务列表 - AI开发平台ModelArts

DATASET：数据集 version_id String 数据集的版本。 version_name String 数据集的版本名称，名称仅包含数字、字母、中划线和下划线，长度是0-32位。请求示例查询某个数据集的特征分析任务历史列表 GET https://{endpoint}/

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
运行第一条Workflow - AI开发平台ModelArts

测试推理服务：工作流运行完成后，在服务部署节点右侧单击“实例详情”跳转至推理服务详情页。或者在ModelArts管理控制台，选择“部署上线>在线服务”，找到部署的推理服务，单击服务名称，进入服务详情页。单击“预测”，右边可查看预测结果。图6 预测样例图图7 预测结果父主题：使用Workflow实现低代码AI开发

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

若需要部署量化模型，需在Notebook中进行模型权重转换后再部署推理服务。在推理生产环境中部署推理服务介绍如何创建AI应用，部署模型并启动推理服务，在线预测服务。父主题：主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）

总条数： 489

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建IAM用户并授权使用MaaS - AI开发平台ModelArts

发布数据 - AI开发平台ModelArts

创建处理任务 - AI开发平台ModelArts

昇腾云服务6.3.912版本说明 - AI开发平台ModelArts

昇腾云服务6.3.911版本说明 - AI开发平台ModelArts

创建DevServer - AI开发平台ModelArts

查询算法详情 - AI开发平台ModelArts

使用MaaS部署模型服务 - AI开发平台ModelArts

创建生产训练作业 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

投机推理使用说明 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

MiniCPM-V2.0推理及LoRA微调基于Lite Server适配PyTorch NPU指导（6.3.910） - AI开发平台ModelArts

配置Workflow的输入输出目录 - AI开发平台ModelArts

依赖和委托 - AI开发平台ModelArts

查询AI应用详情 - AI开发平台ModelArts

查询处理任务列表 - AI开发平台ModelArts

运行第一条Workflow - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线