搜索_华为云

查询训练作业列表 - AI开发平台ModelArts

String 作业状态的查询，默认为所有状态，例如查看创建失败的作业，可选的“status”为“3”|“5”|“6”|“13”，详细作业状态列表请参见作业状态参考。 per_page 否 Integer 指定每一页展示作业的总量，默认为10，“per_page”可选的范围为[1，1000]。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
Hunyuan-DiT基于DevServer部署适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

909软件包中的AscendCloud-AIGC-6.3.909-xxx.zip 文件名中的xxx表示具体的时间戳，以包名发布的实际时间为准。获取路径：Support-E 说明：如果上述软件获取路径打开后未显示相应的软件信息，说明您没有下载权限，请联系您所在企业的华为方技术支持下载获取。

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
使用AWQ量化 - AI开发平台ModelArts

per-channel Step1 模型量化可以在Huggingface开源社区获取AWQ量化后的模型权重；或者获取FP16/BF16的模型权重之后，通过autoAWQ工具进行量化。方式一：从开源社区下载发布的AWQ量化模型。 https://huggingface.co/models?so

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
通过patch操作对服务进行更新 - AI开发平台ModelArts

String 操作路径，符合标准的Json PATCH格式，代表以服务详情的Json返回体为基准，想要执行替换的值的目标路径（Json PATH）。当前支持且仅支持对模型相关所有参数的替换更新，因此前缀固定为“/config/”。例如，当期望更新第一个模型中的实例数量，则路径为“/co

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
Step2 为用户配置云服务使用权限 - AI开发平台ModelArts

配置CES云监控和SMN消息通知使用权限。ModelArts推理部署的在线服务详情页面内有调用次数详情，单击可查看该在线服务的调用次数随时间详细分布的情况。如果想进一步通过CES云监控查看ModelArts的在线服务和对应模型负载运行状态的整体情况，需要给子账号授予CES权限。如果只是查看监控，给子账号授予CES

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践 > 配置ModelArts基本使用权限
管理员和开发者权限分离 - AI开发平台ModelArts

rts专属资源池的完全控制权限，以及Notebook所有实例的访问和操作权限。普通开发者使用开发环境，只需关注对自己Notebook实例的操作权限，包括对自己实例的创建、启动、停止、删除等权限以及周边依赖服务的权限。普通开发者不需要ModelArts专属资源池的操作权限，也不需要查看其他用户的Notebook实例。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
在ModelArts Standard运行GPU训练任务的准备工作 - AI开发平台ModelArts

Turbo中单击右上角的“创建文件系统”，如果能正常打开页面，表示当前用户具备SFS的操作权限。验证ECS权限。在左上角的服务列表中，选择ECS服务，进入ECS管理控制台。在ECS管理控制台，单击右上角的“购买弹性云服务器”，如果能正常打开页面，表示当前用户具备ECS的操作权限。验证VPC权限。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练任务
使用SmoothQuant量化 - AI开发平台ModelArts

othQuant(W8A8)量化的模型列表请参见支持的模型列表和权重文件。本章节介绍如何使用SmoothQuant量化工具实现推理量化。 SmoothQuant量化工具使用到的脚本存放在代码包AscendCloud-LLM-x.x.x.zip的llm_tools目录下。代码目录如下:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
查询模型对象列表 - AI开发平台ModelArts

]，列表中元素model_instance对象即为本章节描述的模型管理，可调用模型接口。支持按照检索参数查询模型列表，返回满足检索条件的模型list，检索参数如表1所示。在查询列表时，返回list的同时，会打印模型列表的详细信息，如表2和表3所示。当前支持最大获取150个模型对象。

帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理
模型推理代码编写说明 - AI开发平台ModelArts

首先，需要在配置文件中，定义自己的依赖包，详细示例请参见使用自定义依赖包的模型配置文件示例。然后通过如下示例代码，实现了“saved_model”格式模型的加载推理。当前推理基础镜像使用的python的logging模块，采用的是默认的日志级别Warnning，即当前只有warning级别

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建AI应用规范参考
附录：训练常见问题 - AI开发平台ModelArts

0框架推理失败：错误截图：报错原因：训练时transformers版本要求为4.45.0，训练完成后保存的tokenizer.json文件中的“merges”时保存的是拆开的列表不是字符串，导致推理异常解决措施，以下两种方法任选其一： ①更新transformes和tokenizers版本

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.909）
配置IAM权限 - AI开发平台ModelArts

授权范围。此处的“Policy1”为项目级云服务、“Policy2”为全局级云服务。了解更多。将自定义策略授权给开发者用户组user_group。在统一身份认证服务控制台的左侧菜单栏中，选择“用户组”。在用户组页面单击对应用户组名称user_group操作列的“授权”，勾选策

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置 > 权限配置
SDXL&SD1.5 WebUI基于Lite Cluster适配NPU推理指导（6.3.906） - AI开发平台ModelArts

906-xxx.zip中的AscendCloud-AIGC-6.3.906-xxx.zip文件。获取路径：Support-E。如果没有软件下载权限，请联系您所在企业的华为方技术支持下载获取。代码包文件名中的xxx表示具体的时间戳，以包名的实际时间为准。 Step1 准备环境

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
使用Notebook进行代码调试 - AI开发平台ModelArts

Notebook使用涉及到计费，具体收费项如下：处于“运行中”状态的Notebook，会消耗资源，产生费用。根据您选择的资源不同，收费标准不同，价格详情请参见产品价格详情。当您不需要使用Notebook时，建议停止Notebook，避免产生不必要的费用。创建Notebook时，如果选择使用云硬盘

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
ModelArts支持哪些AI框架？ - AI开发平台ModelArts

ModelArts支持哪些AI框架？ ModelArts的开发环境Notebook、训练作业、模型推理（即AI应用管理和部署上线）支持的AI框架及其版本，不同模块的呈现方式存在细微差异，各模块支持的AI框架请参见如下描述。统一镜像列表 ModelArts提供了ARM+Ascend规格的统一镜像，包括MindS

帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题
使用DCGM监控Lite Server资源 - AI开发平台ModelArts

heus.yml \ prom/prometheus 这里使用的是Prometheus最基本的功能，如有更高级的诉求，可参考prometheus的官方文档。 5、安装Grafana 运行社区最新发行的Grafana版本： docker run -d -p 3000:3000

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理 > 监控Lite Server资源
在Notebook中通过镜像保存功能制作自定义镜像用于推理 - AI开发平台ModelArts

个组织。创建组织的详细操作请参见创建组织。同一个组织内的用户可以共享使用该组织内的所有镜像。镜像会以快照的形式保存，保存过程约5分钟，请耐心等待。此时不可再操作实例（对于打开的JupyterLab界面和本地IDE仍可操作）。快照中耗费的时间仍占用实例的总运行时长，如果在快照

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
Standard支持的AI框架 - AI开发平台ModelArts

不同区域支持的AI引擎有差异，请以实际环境为准。推理支持的AI引擎在ModelArts创建AI应用时，若使用预置镜像“从模板中选择”或“从OBS中选择”导入模型，则支持如下常用引擎及版本的模型包。标注“推荐”的Runtime来源于统一镜像，后续统一镜像将作为主流的推理基础镜像

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
ma-cli configure鉴权命令 - AI开发平台ModelArts

属于PWD鉴权的一部分。 -u / --username String 否用户名，在使用账号认证时表示账号名，IAM认证时表示IAM用户名，在云星账号场景不需要指定，属于PWD鉴权的一部分。 -p / --password String 否密码，属于PWD鉴权的一部分。 -ak

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
SD1.5&SDXL ComfyUI、WebUI、Diffusers套件适配PyTorch NPU的推理指导（6.3.909） - AI开发平台ModelArts

909软件包中的AscendCloud-AIGC-6.3.909-xxx.zip 文件名中的xxx表示具体的时间戳，以包名发布的实际时间为准。获取路径：Support-E 说明：如果上述软件获取路径打开后未显示相应的软件信息，说明您没有下载权限，请联系您所在企业的华为方技术支持下载获取。

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理

总条数： 1217

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查询训练作业列表 - AI开发平台ModelArts

Hunyuan-DiT基于DevServer部署适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

通过patch操作对服务进行更新 - AI开发平台ModelArts

Step2 为用户配置云服务使用权限 - AI开发平台ModelArts

管理员和开发者权限分离 - AI开发平台ModelArts

在ModelArts Standard运行GPU训练任务的准备工作 - AI开发平台ModelArts

使用SmoothQuant量化 - AI开发平台ModelArts

查询模型对象列表 - AI开发平台ModelArts

模型推理代码编写说明 - AI开发平台ModelArts

附录：训练常见问题 - AI开发平台ModelArts

配置IAM权限 - AI开发平台ModelArts

SDXL&SD1.5 WebUI基于Lite Cluster适配NPU推理指导（6.3.906） - AI开发平台ModelArts

使用Notebook进行代码调试 - AI开发平台ModelArts

ModelArts支持哪些AI框架？ - AI开发平台ModelArts

使用DCGM监控Lite Server资源 - AI开发平台ModelArts

在Notebook中通过镜像保存功能制作自定义镜像用于推理 - AI开发平台ModelArts

Standard支持的AI框架 - AI开发平台ModelArts

ma-cli configure鉴权命令 - AI开发平台ModelArts

SD1.5&SDXL ComfyUI、WebUI、Diffusers套件适配PyTorch NPU的推理指导（6.3.909） - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线