搜索_华为云

发布Workflow到ModelArts - AI开发平台ModelArts

定义统一存储对象管理输出目录 output_storage = wf.data.OutputStorage(name="output_storage", description="输出目录统一配置", default="**") # 数据集对象 dataset = wf.data.DatasetPlac

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 发布Workflow
推理场景介绍 - AI开发平台ModelArts

Cluster。推荐使用“西南-贵阳一”Region上的资源和Ascend Snt9B。支持的模型列表和权重文件本方案支持vLLM的v0.6.0版本。不同vLLM版本支持的模型列表有差异，具体如表1所示。表1 支持的模型列表和权重获取地址序号模型名称是否支持fp16/bf16推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）
训练作业的自定义镜像制作流程 - AI开发平台ModelArts

al/Ascend/driver目录。 X86 CPU架构和ARM CPU架构的自定义镜像分别只能运行于对应CPU架构的规格中。执行如下命令，查看自定义镜像的CPU架构。 docker inspect {自定义镜像地址} | grep Architecture ARM CPU架构的自定义镜像，上述命令回显如下。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
查询API - AI开发平台ModelArts
查询API - AI开发平台ModelArts

服务编号，可通过查询服务列表获取。 api_id 是 String APP编号。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述 workspace_id 否 String 工作空间ID。获取方法请参见查询工

 帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
环境配置相关 - AI开发平台ModelArts

如何在Notebook中安装外部库？如何获取本机外网IP？如何解决“在IOS系统里打开ModelArts的Notebook，字体显示异常”的问题？ Notebook有代理吗？如何关闭？在Notebook中添加自定义IPython Kernel 父主题： Standard Notebook

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
编排Workflow - AI开发平台ModelArts

LabelTaskConfig wf.data.LabelTaskTypeEnum wf.data.MetricsConfig wf.data.TripartiteServiceConfig wf.data.DataConsumptionSelector policy包相关内容导入： wf

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
使用SmoothQuant量化 - AI开发平台ModelArts

SmoothQuant(W8A8)量化方案能降低模型显存以及需要部署的卡数。也能同时降低首token时延和增量推理时延。支持SmoothQuant(W8A8)量化的模型列表请参见支持的模型列表和权重文件。本章节介绍如何使用SmoothQuant量化工具实现推理量化。 SmoothQuan

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
查询工作空间列表 - AI开发平台ModelArts

aces 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述 offset 否 Integer 分页列表的起始页，默认为'0'。 limit

帮助中心 > AI开发平台ModelArts > API参考 > 工作空间管理
Standard资源管理 - AI开发平台ModelArts

操作资源池中的节点和k8s集群。请参见弹性集群k8s Cluster。弹性裸金属：弹性裸金属提供不同型号的xPU裸金属服务器，您可以通过弹性公网IP进行访问，在给定的操作系统镜像上可以自行安装GPU&NPU相关的驱动和其他软件，使用SFS或OBS进行数据存储和读取相关的操作，满

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
配置Workflow参数 - AI开发平台ModelArts

参数是否运行时输入，默认为“False”，在工作流启动运行前进行配置。设置为“True”，则在使用的相应节点运行时卡点配置。否 bool description 参数描述信息。否 str enum_list 参数枚举值列表，只有当参数类型为PlaceholderType.ENUM时才需要填写。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
查询工作空间详情 - AI开发平台ModelArts

String 工作空间名称。长度限制为4-64字符，支持中文、大小写字母、数字、中划线和下划线。同时'default'为系统预留的默认工作空间名称，用户无法自己创建名为'default'的工作空间。 description String 工作空间描述，默认为空。长度限制为0-256字符。 id

帮助中心 > AI开发平台ModelArts > API参考 > 工作空间管理
查询标注团队的成员列表 - AI开发平台ModelArts

kers 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 workforce_id 是 String 标注团队ID。表2 Query参数参数是否必选参数类型描述 limit 否 Integer

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
模型调试 - AI开发平台ModelArts
模型调试 - AI开发平台ModelArts

将自定义的推理文件和模型配置文件保存在训练生成的模型文件目录下。如训练生成的模型保存在“/home/ma-user/work/tensorflow_mlp_mnist_local_mode/train/model/”中，则推理文件“customize_service.py”和模型配置文件“config

帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理
导入模型时，模型配置文件中的安装包依赖参数如何编写？ - AI开发平台ModelArts

API接口。配置文件为JSON格式。配置文件中的“dependencies”，表示配置模型推理代码需要的依赖包，需要提供依赖包名、安装方式和版本约束的信息，详细参数见模型配置文件编写说明。导入模型时，模型配置文件中的安装包依赖参数“dependencies”如何编写？解决方案

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 模型管理 > 导入模型
创建标注团队 - AI开发平台ModelArts

参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数表2 请求Body参数参数是否必选参数类型描述 description 否 String 标注团队描述，长度为0-256位，不能包含^!<>=&"'特殊字符。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
使用GPTQ量化 - AI开发平台ModelArts

W8A16量化支持的模型请参见支持的模型列表和权重文件。本章节介绍如何在GPU的机器上使用开源GPTQ量化工具GPTQ (huggingface.co)量化模型权重，然后在NPU的机器上实现推理量化。具体操作如下：开始之前，请确保安装了以下库： pip install auto-gptq pip install

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用llm-compressor工具量化 - AI开发平台ModelArts

https://github.com/vllm-project/llm-compressor.git cd llm-compressor pip install -e . 修改examples/quantizing_moe/deepseek_moe_w8a8_int8.py中的代码：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
附录：指令微调训练常见问题 - AI开发平台ModelArts

module named 'multipart'"报错：截图如下：解决措施：可更新python-multipart为0.0.12版本，具体步骤如下：启动训练任务前更新python-multipart版本： pip install python-multipart==0.0.12 父主题：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907）
资源购买 - AI开发平台ModelArts
资源购买 - AI开发平台ModelArts

储容量和时长收费。您也可以购买包年包月套餐，提前规划资源的使用额度和时长。在欠费时，您需要及时（15天之内）续费以避免您的文件系统资源被清空。SFS购买指导请参考如何购买弹性文件服务？。购买容器镜像服务SWR 容器镜像服务分为企业版和共享版。共享版计费项包括存储空间和流量费用，目前均免费提供给您。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练
Notebook中快速使用MoXing - AI开发平台ModelArts

8_train_ascend.zip，复制到已有的OBS桶中，示例代码如下。 import os import zipfile import moxing as mox mox.file.copy('yolov8_train_ascend.zip','obs://pcb-data-me/pcb

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 在Notebook中使用Moxing命令

总条数： 973

上一页
1
...
36
37
38
...
49
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

发布Workflow到ModelArts - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

训练作业的自定义镜像制作流程 - AI开发平台ModelArts

查询API - AI开发平台ModelArts

环境配置相关 - AI开发平台ModelArts

编排Workflow - AI开发平台ModelArts

使用SmoothQuant量化 - AI开发平台ModelArts

查询工作空间列表 - AI开发平台ModelArts

Standard资源管理 - AI开发平台ModelArts

配置Workflow参数 - AI开发平台ModelArts

查询工作空间详情 - AI开发平台ModelArts

查询标注团队的成员列表 - AI开发平台ModelArts

模型调试 - AI开发平台ModelArts

导入模型时，模型配置文件中的安装包依赖参数如何编写？ - AI开发平台ModelArts

创建标注团队 - AI开发平台ModelArts

使用GPTQ量化 - AI开发平台ModelArts

使用llm-compressor工具量化 - AI开发平台ModelArts

附录：指令微调训练常见问题 - AI开发平台ModelArts

资源购买 - AI开发平台ModelArts

Notebook中快速使用MoXing - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线