搜索_华为云

数据准备使用流程 - AI开发平台ModelArts

样本筛选。提供12+标注工具，方便用户进行精细化、场景化和专业化的数据标注。提供基于样本和标注结果进行特征分析，帮助用户整体了解数据的质量。提升用户数据准备的效率。提供数据版本管理能力，帮助用户提升数据管理的效率。提供数据校验、数据选择、数据清洗等多种数据处理算子，帮助用户快速处理数据。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理
使用AWQ量化工具转换权重 - AI开发平台ModelArts

per-channel Step1 模型量化可以在Huggingface开源社区获取AWQ量化后的模型权重；或者获取FP16/BF16的模型权重之后，通过autoAWQ工具进行量化。方式一：从开源社区下载发布的AWQ量化模型。 https://huggingface.co/models?so

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
准备Notebook - AI开发平台ModelArts

Turbo服务。随后，通过Notebook将OBS中的数据上传至SFS Turbo，并对存储在SFS Turbo中的数据执行编辑操作。创建Notebook 创建开发环境Notebook实例，具体操作步骤请参考创建Notebook实例。镜像选择已注册的自定义镜像，资源类型选择创建好的专属资源池，规格推荐选择“Ascend:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 准备工作
更新服务配置 - AI开发平台ModelArts

权重百分比，分配到此模型的流量权重，仅当infer_type为real-time时需要配置，多个权重相加必须等于100；当在一个在线服务中同时配置了多个模型版本且设置不同的流量权重比例时，持续地访问此服务的预测接口，ModelArts会按此权重比例将预测请求转发到对应的模型版本实例。 specification

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
使用AWQ量化 - AI开发平台ModelArts

per-channel Step1 模型量化可以在Huggingface开源社区获取AWQ量化后的模型权重；或者获取FP16/BF16的模型权重之后，通过autoAWQ工具进行量化。方式一：从开源社区下载发布的AWQ量化模型。 https://huggingface.co/models?so

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
使用AWQ量化 - AI开发平台ModelArts

per-channel 步骤一模型量化可以在Huggingface开源社区获取AWQ量化后的模型权重；或者获取FP16/BF16的模型权重之后，通过autoAWQ工具进行量化。方式一：从开源社区下载发布的AWQ量化模型。 https://huggingface.co/models?so

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
模型管理 - AI开发平台ModelArts
模型管理 - AI开发平台ModelArts

模型管理创建模型失败，如何定位和处理问题？导入模型提示该账号受限或者没有操作权限用户创建模型时构建镜像或导入文件失败创建模型时，OBS文件目录对应镜像里面的目录结构是什么样的？通过OBS导入模型时，如何编写打印日志代码才能在ModelArts日志查询界面看到日志通过O

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署
【下线公告】华为云ModelArts服务旧版训练管理下线公告 - AI开发平台ModelArts

开发者的新特性需求。基于服务演进，ModelArts团队已于2021年上线新版训练，力求解决存在的历史问题，并为新特性提供高性能、高易用、可扩展、可演进的底座，给用户提供更好的AI训练体验，打造易用、高效的AI平台。下线旧版训练管理对现有用户的使用是否有影响？正在使用的训练作

 帮助中心 > AI开发平台ModelArts > 服务公告 > 下线公告
认证鉴权 - AI开发平台ModelArts
认证鉴权 - AI开发平台ModelArts

Key)：与访问密钥ID结合使用的密钥，对请求进行加密签名，可标识发送方，并防止请求被修改。使用AK/SK认证时，您可以基于签名算法使用AK/SK对请求进行签名，也可以使用专门的签名SDK对请求进行签名。详细的签名方法和SDK使用方法请参见API签名指南。签名SDK只提供签名功能，与服务提供的SDK不同，使用时请注意。

帮助中心 > AI开发平台ModelArts > API参考 > 如何调用API
使用AWQ量化 - AI开发平台ModelArts

低小batch下的增量推理时延。支持AWQ量化的模型列表请参见表3。本章节介绍如何使用AWQ量化工具实现推理量化。量化方法：per-group Step1 模型量化可以在Huggingface开源社区获取AWQ量化后的模型权重；或者获取FP16/BF16的模型权重之后，通过autoAWQ工具进行量化。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906） > 推理模型量化
典型场景配置实践 - AI开发平台ModelArts

给子账号配置部署上线基本使用权限给子账号配置查看所有Notebook实例的权限管理员和开发者权限分离不允许子账号使用公共资源池创建作业委托授权ModelArts云服务使用SFS Turbo 给子账号配置文件夹级的SFS Turbo访问权限父主题： Standard权限管理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理
使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化 AWQ(W4A16/W8A16)量化方案能显著降低模型显存以及需要部署的卡数。降低小batch下的增量推理时延。支持AWQ量化的模型列表请参见表3。多模态只支持hf上下载的awq权重，可跳过步骤一。本章节介绍如何使用AWQ量化工具实现推理量化。量化方法：W4A16 pe

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
使用AWQ量化 - AI开发平台ModelArts

per-channel 步骤一模型量化可以在Huggingface开源社区获取AWQ量化后的模型权重；或者获取FP16/BF16的模型权重之后，通过autoAWQ工具进行量化。方式一：从开源社区下载发布的AWQ量化模型。 https://huggingface.co/models?so

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
包年/包月 - AI开发平台ModelArts
包年/包月 - AI开发平台ModelArts

包年/包月是一种先付费再使用的计费模式，适用于对资源需求稳定且希望降低成本的用户。通过选择包年/包月的计费模式，您可以预先购买云服务资源并获得一定程度的价格优惠。本文将介绍ModelArts资源包年/包月的计费规则。适用场景包年/包月计费模式需要用户预先支付一定时长的费用，适用于长期、稳定的业务需

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费模式
Step4 测试用户权限 - AI开发平台ModelArts

验证ModelArts权限。在左上角选择区域，区域需与授权配置中的区域相同。在ModelArts左侧菜单栏中，选择“开发环境>Notebook”，界面未提示权限不足，表明ModelArts的使用权限和委托授权配置成功。如果提示“需获取依赖服务的授权”，说明未配置ModelArts委托访问授权，请参考Step3

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践 > 配置ModelArts基本使用权限
使用AWQ量化 - AI开发平台ModelArts

低小batch下的增量推理时延。支持AWQ量化的模型列表请参见表3。本章节介绍如何使用AWQ量化工具实现推理量化。量化方法：per-group Step1 模型量化可以在Huggingface开源社区获取AWQ量化后的模型权重；或者获取FP16/BF16的模型权重之后，通过autoAWQ工具进行量化。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.907） > 推理模型量化
准备Notebook - AI开发平台ModelArts

Turbo服务。随后，通过Notebook将OBS中的数据上传至SFS Turbo，并对存储在SFS Turbo中的数据执行编辑操作。创建Notebook 创建开发环境Notebook实例，具体操作步骤请参考创建Notebook实例。镜像选择已注册的自定义镜像，资源类型选择创建好的专属资源池，规格推荐选择“Ascend:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 准备工作
准备文本分类数据 - AI开发平台ModelArts

txt 文本分类的标注对象和标注文件均为文本文件，并且以行数进行对应。如标注文件中的第一行表示的是标注对象文件中的第一行的标注。例如，标注对象“COMMENTS_114745.txt”的内容如下所示。手感很好，反应速度很快，不知道以后怎样三个月前买了一个用的非常好果断把旧手机替换下来尤其在待机方面

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现文本分类
使用llm-compressor工具量化 - AI开发平台ModelArts

1、执行权重量化过程中，请保证使用的GPU卡上没有其他进程，否则可能出现OOM； 2、若量化Deepseek-v2-236b模型，大致需要10+小时。使用量化模型使用量化模型需要在NPU的机器上运行。启动vLLM前，请开启图模式（参考步骤六启动推理服务中的配置环境变量），启动服务的命令和启动非量化模型一致。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
使用llm-compressor工具量化 - AI开发平台ModelArts

1、执行权重量化过程中，请保证使用的GPU卡上没有其他进程，否则可能出现OOM； 2、如果量化Deepseek-v2-236b模型，大致需要10+小时。使用量化模型使用量化模型需要在NPU的机器上运行。启动vLLM前，请开启图模式（参考步骤六启动推理服务中的配置环境变量），启动服务的命令和启动非量化模型一致。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 推理模型量化

总条数： 1668

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

数据准备使用流程 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

准备Notebook - AI开发平台ModelArts

更新服务配置 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

模型管理 - AI开发平台ModelArts

【下线公告】华为云ModelArts服务旧版训练管理下线公告 - AI开发平台ModelArts

认证鉴权 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

典型场景配置实践 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

包年/包月 - AI开发平台ModelArts

Step4 测试用户权限 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

准备Notebook - AI开发平台ModelArts

准备文本分类数据 - AI开发平台ModelArts

使用llm-compressor工具量化 - AI开发平台ModelArts

使用llm-compressor工具量化 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线