搜索_华为云

使用AWQ量化 - AI开发平台ModelArts

AWQ(W4A16)量化方案能显著降低模型显存以及需要部署的卡数。降低小batch下的增量推理时延。支持AWQ量化的模型列表请参见表3。本章节介绍如何使用AWQ量化工具实现推理量化。量化方法：per-group Step1 模型量化可以在Huggingface开源社区获取AWQ量化后

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.907） > 推理模型量化
在Lite Cluster资源池上使用Snt9B完成推理任务 - AI开发平台ModelArts

在Lite Cluster资源池上使用Snt9B完成推理任务场景描述本案例介绍如何在Snt9B环境中利用Deployment机制部署在线推理服务。首先创建一个Pod以承载服务，随后登录至该Pod容器内部署在线服务，并最终通过新建一个终端作为客户端来访问并测试该在线服务的功能。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
显存溢出错误 - AI开发平台ModelArts

setting max_split_size_mb to avoid fragmentation. 解决方法：通过npu-smi info查看是否有进程资源占用NPU，导致训练时显存不足。解决可通过kill掉残留的进程或等待资源释放。父主题：常见错误原因和解决方法

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912） > 常见错误原因和解决方法
运行第一条Workflow - AI开发平台ModelArts

标注是否完成，用户在数据标注节点单击“实例详情”前往数据集页面查看该数据集是否已完成标注。未完成标注：在数据标注详情页，单击选择“未标注”页签，完成标注。已完成标注：返回工作流页面，单击“继续运行”。图4 查看实例详情图5 继续运行当工作流运行至服务部署节点，状态为“等

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发
最新动态 - AI开发平台ModelArts
最新动态 - AI开发平台ModelArts

阶段相关文档 1 Notebook连接大数据服务特性介绍如何将ModelArts Notebook开发环境与华为云大数据服务DLI中的Spark引擎相连接，让数据工程师能便捷地使用Notebook进行大数据开发，以及如何在DataArts Studio服务配置Notebook文件定时调度任务。

帮助中心 > AI开发平台ModelArts > 最新动态
在ModelArts Standard使用run.sh脚本实现OBS和训练容器间的数据传输 - AI开发平台ModelArts

ModelArts上进行训练比本地训练多了一步OBS和容器环境的数据迁移工作。增加了和OBS交互工作的整个训练流程如下：建议使用OBSutil作为和OBS交互的工具，如何在本机安装obsutil可以参考安装和配置OBS命令行工具。训练数据、代码、模型下载。（本地使用硬盘挂载或者docker cp，在ModelArts上使用OBSutil）

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
使用AWQ量化工具转换权重 - AI开发平台ModelArts

AWQ(W4A16)量化方案能显著降低模型显存以及需要部署的卡数。降低小batch下的增量推理时延。支持AWQ量化的模型列表请参见支持的模型列表和权重文件。本章节介绍如何在Notebook使用AWQ量化工具实现推理量化，量化方法为per-group。 Step1 模型量化可以在Huggingface开源社

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907） > 推理模型量化
Yaml配置文件参数配置说明 - AI开发平台ModelArts

/home/ma-user/AscendFactory/data 【可选】代码自带数据：如identity等地址为AscendFactory/third-party/LLaMA-Factory/data目录下；自定义数据：地址为代码包AscendFactory/data目录下 template qwen

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 训练脚本说明
图模式 - AI开发平台ModelArts
图模式 - AI开发平台ModelArts

MindSpeed git checkout a956b907ef3b0787d2a38577eb5b702f5b7e715d #推荐commit pip install -e . 开启图模式后，服务第一次响应请求时会有一个较长时间的图编译过程，并且会在当前目录下生成.torchair_ca

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
训练业务迁移到昇腾设备场景介绍 - AI开发平台ModelArts

训练业务迁移到昇腾设备场景介绍场景介绍本文介绍如何将客户已有的PyTorch训练业务迁移到昇腾设备上运行并获得较好的模型训练效果。华为云ModelArts针对该场景提供了系统化的迁移指导，包括迁移原理、迁移流程以及迁移后的精度调试及性能调优方法介绍。此外，ModelArts提

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导
从Manifest文件导入规范说明 - AI开发平台ModelArts

EVAL：指明该对象用于评估。 TEST：指明该对象用于测试。 INFERENCE：指明该对象用于推理。如果没有给出该字段，则使用者自行决定如何使用该对象。 id 否此参数为系统导出的样本id，导入时可以不用填写。 annotation 否如果不设置，则表示未标注对象。anno

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导入数据到ModelArts数据集 > 从OBS导入数据到ModelArts数据集
投机推理使用说明 - AI开发平台ModelArts

api_server \ --model=${base_model} \ # 大模型权重地址 --speculative-model=${spec_model} \ # 投机小模型权重地址 --num-speculative-tokens=${spec_step} \ #投机步数

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 投机推理
使用大模型在ModelArts Standard创建模型部署在线服务 - AI开发平台ModelArts

专属资源池磁盘空间大小必须超过1T。您可以通过专属资源池详情页面，规格页签，查看专属资源池磁盘信息。当服务部署失败，提示磁盘空间不足时，请参考服务部署、启动、升级和修改时，资源不足如何处理？图2 查看专属资源池磁盘信息创建模型使用大模型创建模型，选择从对象存储服务（OBS）中导入，需满足以下参数配置：

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
创建Workflow数据集节点 - AI开发平台ModelArts

数据集创建相关的配置信息。是 DatasetProperties title title信息，主要用于前端的名称展示。否 str description 数据集创建节点的描述信息。否 str policy 节点执行的policy。否 StepPolicy depend_steps

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
使用AWQ量化工具转换权重 - AI开发平台ModelArts

显著降低模型显存以及需要部署的卡数。降低小batch下的增量推理时延。支持AWQ量化的模型列表请参见支持的模型列表和权重文件。本章节介绍如何在Notebook使用AWQ量化工具实现推理量化。量化方法：W4A16 per-group/per-channel, W8A16 per-channel

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
创建IAM用户并授权使用MaaS - AI开发平台ModelArts

大型企业用户的使用场景下很常见。如果需要对委托授权的权限范围进行精确控制，可以参考本章节进行MaaS服务的定制化委托授权。本章节主要介绍如何给IAM用户下的子用户配置更细粒度的权限。前提条件给用户组授权之前，请先了解用户组可以添加的使用ModelArts及其依赖服务的权限，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 配置MaaS访问授权
数据管理（旧版） - AI开发平台ModelArts

数据管理（旧版）查询数据集列表创建数据集查询数据集详情更新数据集删除数据集查询数据集的统计信息查询数据集监控数据查询数据集的版本列表创建数据集标注版本查询数据集版本详情删除数据集标注版本查询样本列表批量添加样本批量删除样本查询单个样本信息获取样本搜索条件

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API
Standard Workflow - AI开发平台ModelArts

Standard Workflow 如何定位Workflow运行报错

 帮助中心 > AI开发平台ModelArts > 常见问题
开发环境管理 - AI开发平台ModelArts

创建Notebook实例查询Notebook实例列表查询所有Notebook实例列表查询Notebook实例详情更新Notebook实例删除Notebook实例通过运行的实例保存成容器镜像查询Notebook支持的有效规格列表查询Notebook支持的可切换规格列表查询运行中的Notebook可用时长

 帮助中心 > AI开发平台ModelArts > API参考
创建声音分类项目 - AI开发平台ModelArts

说明：只有北京四区域支持限时免费规格。如果您购买了套餐包，可优先选择您对应规格的套餐包，在“配置费用”处会显示您的套餐余量，以及超出的部分如何计费，请您关注，避免造成不必要的资源浪费。单击“创建项目”，声音分类项目创建成功后页面自动跳转到“自动学习工作流”。声音分类项目的工作流，将依次运行如下节点：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现声音分类

总条数： 1883

上一页
1
...
75
76
77
...
95
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用AWQ量化 - AI开发平台ModelArts

在Lite Cluster资源池上使用Snt9B完成推理任务 - AI开发平台ModelArts

显存溢出错误 - AI开发平台ModelArts

运行第一条Workflow - AI开发平台ModelArts

最新动态 - AI开发平台ModelArts

在ModelArts Standard使用run.sh脚本实现OBS和训练容器间的数据传输 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

图模式 - AI开发平台ModelArts

训练业务迁移到昇腾设备场景介绍 - AI开发平台ModelArts

从Manifest文件导入规范说明 - AI开发平台ModelArts

投机推理使用说明 - AI开发平台ModelArts

使用大模型在ModelArts Standard创建模型部署在线服务 - AI开发平台ModelArts

创建Workflow数据集节点 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

创建IAM用户并授权使用MaaS - AI开发平台ModelArts

数据管理（旧版） - AI开发平台ModelArts

Standard Workflow - AI开发平台ModelArts

开发环境管理 - AI开发平台ModelArts

创建声音分类项目 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线