搜索_华为云

使用AWQ量化工具转换权重 - AI开发平台ModelArts

tch下的增量推理时延。支持AWQ量化的模型列表请参见表1。本章节介绍如何在Notebook使用AWQ量化工具实现推理量化，量化方法为per-group。 Step1 模型量化可以在Huggingface开源社区获取AWQ量化后的模型权重；或者获取FP16/BF16的模型权重之后，通过autoAWQ工具进行量化。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906） > 推理模型量化
免费资产和商用资产 - AI开发平台ModelArts

Gallery。发布的免费资产将展示在AI Gallery的公共页签以及“我的Gallery > 我的资产”的各个模块的“我的发布”中。已经订阅的免费资产将展示在AI Gallery的“我的Gallery > 我的资产”的各个模块的“我的订阅”或“我的下载”中。免费资产在ModelArts的AI

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版）
查看训练作业资源占用情况 - AI开发平台ModelArts

例名称的下拉框切换节点。操作二：单击图例“cpuUsage”、“gpuMemUsage”、“gpuUtil”、“memUsage”“npuMemUsage”、“npuUtil”，可以添加或取消对应参数的使用情况图。操作三：鼠标悬浮在图片上的时间节点，可查看对应时间节点的占用率情况。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
在Standard上部署SD WebUI推理服务 - AI开发平台ModelArts

ascend-snt9b(64GB)规格。请按需选择需要的规格，64GB规格的推理耗时更短。推荐使用“西南-贵阳一”Region上的昇腾资源。 AI应用来源：我的AI应用。选择AI应用及其版本：此处选择上一步中创建的sdxl-webui-pytorch:0.0.1应用。计算节点规格：

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理 > SD WEBUI套件适配PyTorch NPU的推理指导（6.3.908）
Lite Cluster资源开通 - AI开发平台ModelArts

请根据界面提示选择需要使用的规格。平台分配的资源规格包含了一定的系统损耗，实际可用的资源量小于规格标称的资源。实际可用的资源量可在专属资源池创建成功后，在详情页的“节点”页签中查看。可用区您可以根据实际情况选择“随机分配”或“指定AZ”。可用区是在同一区域下，电力、网络隔离的物理区域。可用

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster）
使用AWQ量化工具转换权重 - AI开发平台ModelArts

per-channel Step1 模型量化可以在Huggingface开源社区获取AWQ量化后的模型权重；或者获取FP16/BF16的模型权重之后，通过autoAWQ工具进行量化。方式一：从开源社区下载发布的AWQ量化模型。 https://huggingface.co/models?so

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

8*ascend-snt9b表示昇腾8卡。推荐使用“西南-贵阳一”Region上的昇腾资源。创建OBS桶 ModelArts使用对象存储服务（Object Storage Service，简称OBS）进行数据存储以及模型的备份和快照，实现安全、高可靠和低成本的存储需求。因此，在使用ModelArts之前通常

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 准备工作
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

8*ascend-snt9b表示昇腾8卡。推荐使用“西南-贵阳一”Region上的昇腾资源。创建OBS桶 ModelArts使用对象存储服务（Object Storage Service，简称OBS）进行数据存储以及模型的备份和快照，实现安全、高可靠和低成本的存储需求。因此，在使用ModelArts之前通常

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 准备工作
模型训练存储加速 - AI开发平台ModelArts

并将生成的结果数据异步持久化到OBS对象存储中长期低成本保存。图1 基于OBS+SFS Turbo的华为云AI云存储解决方案 OBS + SFS Turbo存储加速的具体方案请查看：面向AI场景使用OBS+SFS Turbo的存储加速实践。设置训练存储加速当完成上传数据至OBS并预热到SFS

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
服务韧性 - AI开发平台ModelArts
服务韧性 - AI开发平台ModelArts

韧性特指安全韧性，即云服务受攻击后的韧性，不含可靠性、可用性。本章主要阐述ModelArts服务受入侵的检测响应能力、防抖动的能力、域名合理使用、内容安全检测等能力。安全防护套件覆盖和使用堡垒机，增强入侵检测和防御能力 ModelArts服务部署主机层、应用层、网络层和数据层的安全防护套件。及时

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
使用前必读 - AI开发平台ModelArts

同时ModelArts还提供多种编程语言的SDK供您使用，SDK的使用方法请参见ModelArts SDK参考。终端节点终端节点（Endpoint）即调用API的请求地址，不同服务不同区域的终端节点不同，您可以从地区和终端节点中查询所有服务的终端节点。约束与限制您能创建的ModelArts资源的数量与配额有关系，具体请参见服务配额。

帮助中心 > AI开发平台ModelArts > API参考
Notebook使用场景 - AI开发平台ModelArts

开发环境中，调试和运行代码。本地IDE方式不影响用户的编码习惯，并且可以方便快捷的使用云上的Notebook开发环境。本地IDE当前支持VS Code、PyCharm、SSH工具。PyCharm和VS Code还分别有专门的插件PyCharm Toolkit、VS Code T

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
使用SDK调测多机分布式训练作业 - AI开发平台ModelArts

到指定的obs_path中；将训练作业提交到ModelArts训练服务中，训练作业会使用当前Notebook的镜像来执行训练作业；训练任务得到的输出上传到4指定的obs_path中，日志上传到log_url指定的位置中。在这一步中需要注意的一个问题：如果用户在自己的训练脚

 帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业 > 训练作业调测
使用AWQ量化工具转换权重 - AI开发平台ModelArts

使用AWQ量化工具转换权重 AWQ(W4A16/W8A16)量化方案能显著降低模型显存以及需要部署的卡数。降低小batch下的增量推理时延。支持AWQ量化的模型列表请参见支持的模型列表和权重文件。本章节介绍如何在Notebook使用AWQ量化工具实现推理量化。量化方法：W4A16 per-group/per-channel

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

则会在容器内安装依赖以及下载完整的代码。当训练作业结束后，对应的容器也会同步销毁。图4 训练作业启动命令 ECS中构建新镜像（二选一）通过ECS获取和上传基础镜像获取基础镜像后，可通过ECS运行Dockerfile文件，在镜像的基础上构建新镜像。获取模型软件包，并上传到ECS的目录下（可自定义路径），获取地址参考表1。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） > 准备工作
Lite Cluster资源配置流程 - AI开发平台ModelArts

vpc下的某一台机器上。单击连接信息下kubectl后的“配置”按钮，根据界面提示使用kubectl工具。图14 通过内网使用kubectl工具通过公网使用kubectl工具，可以将kubectl安装在任一台可以访问公网的机器。首先需要绑定公网地址，单击公网地址后的“绑定”按钮。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
MoXing Framework功能介绍 - AI开发平台ModelArts

引入moxing framework的数据下载加速特性的相关说明在使用基于ModelArts预置镜像的训练作业时，可以引入moxing framework的数据下载加速特性。加速特性适用场景为：文件数在100w~1000w的场景、单个大文件及文件大小大于20GB的场景。登录ModelAr

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 在Notebook中使用Moxing命令
Notebook cache盘告警上报 - AI开发平台ModelArts

可创建一个主题。单击主题名称“操作”列的“更多 > 设置主题策略”。选择APM，即允许AOM的告警触发SMN服务。图5 设置主题策略单击主题名称“操作”列的“添加订阅”。订阅成功后，一旦满足告警条件，那么就会收到通知。选择合适的协议，如邮件，短信等，并填写终端，如邮件地址，手机号等。单击确认。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例
Step2 为用户配置云服务使用权限 - AI开发平台ModelArts

配置CES云监控和SMN消息通知使用权限。ModelArts推理部署的在线服务详情页面内有调用次数详情，单击可查看该在线服务的调用次数随时间详细分布的情况。如果想进一步通过CES云监控查看ModelArts的在线服务和对应模型负载运行状态的整体情况，需要给子账号授予CES权限。如果只是查看监控，给子账号授予CES

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践 > 配置ModelArts基本使用权限
限制用户使用公共资源池 - AI开发平台ModelArts

户组页面查找待授权的用户组名称，在右侧的操作列单击“授权”，勾选步骤2创建的两条自定义策略，单击“下一步”，选择授权范围方案，单击“确定”。此时，该用户组下的所有用户均有权限查看该用户组内成员创建的所有Notebook实例。如果没有用户组，也可以创建一个新的用户组，并通过“用

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践

总条数： 558

上一页
1
...
21
22
23
...
28
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用AWQ量化工具转换权重 - AI开发平台ModelArts

免费资产和商用资产 - AI开发平台ModelArts

查看训练作业资源占用情况 - AI开发平台ModelArts

在Standard上部署SD WebUI推理服务 - AI开发平台ModelArts

Lite Cluster资源开通 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

模型训练存储加速 - AI开发平台ModelArts

服务韧性 - AI开发平台ModelArts

使用前必读 - AI开发平台ModelArts

Notebook使用场景 - AI开发平台ModelArts

使用SDK调测多机分布式训练作业 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

Lite Cluster资源配置流程 - AI开发平台ModelArts

MoXing Framework功能介绍 - AI开发平台ModelArts

Notebook cache盘告警上报 - AI开发平台ModelArts

Step2 为用户配置云服务使用权限 - AI开发平台ModelArts

限制用户使用公共资源池 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线