搜索_华为云

使用AWQ量化工具转换权重 - AI开发平台ModelArts

py”文件进行模型量化，量化时间和模型大小有关，预计30分钟~3小时。 pip install transformers==4.41.0 # AutoAWQ未适配transformers 4.42以上 python examples/quantize.py --model-path /home/ma-user/llama-2-7b/

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
使用AWQ量化 - AI开发平台ModelArts

py”文件进行模型量化，量化时间和模型大小有关，预计30分钟~3小时。 pip install transformers==4.41.0 # AutoAWQ未适配transformers 4.42以上 python examples/quantize.py --model-path /home/ma-user/llama-2-7b/

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用AWQ量化 - AI开发平台ModelArts

py”文件进行模型量化，量化时间和模型大小有关，预计30分钟~3小时。 pip install transformers==4.41.0 # AutoAWQ未适配transformers 4.42以上 python examples/quantize.py --model-path /home/ma-user/llama-2-7b/

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
使用自动分组智能标注作业 - AI开发平台ModelArts

Arts内置了分组算法，您可以针对您选中的数据，执行自动分组，提升您的数据标注效率。自动分组可以理解为数据标注的预处理，先使用聚类算法对未标注图片进行聚类，再根据聚类结果进行处理，可以分组打标或者清洗图片。例如，用户通过搜索引擎搜索XX，将相关图片下载并上传到数据集，然后再使

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过智能标注方式标注数据
在ModelArts Standard上运行GPU训练作业的场景介绍 - AI开发平台ModelArts

SFS Turbo的存储加速实践。表1 不同场景所需服务及购买推荐场景 OBS SFS SWR DEW ModelArts VPC ECS EVS 单机单卡按需购买（并行文件系统） × 免费免费包月购买免费 × 按需购买单机多卡 × 包月购买（HPC型500G）免费

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

训练作业中存在2个代码目录，一个是从OBS上传到ModelArts Standard训练容器中的代码目录OBS_CODE_DIR，一个是后续构建新镜像步骤ECS中构建新镜像中镜像的代码目录CODE_DIR。修改代码如图1。图1 修改区分训练作业中2个代码目录使用环境变量SAVE_PATH重新覆

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.908） > 准备工作
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

发请求时model指定为lora1或者lora2即为LoRA推理。 --quantization：推理量化参数。当使用量化功能，则在推理服务启动脚本中增加该参数，如果未使用量化功能，则无需配置。根据使用的量化方式配置，可选择awq或smoothquant方式。该参数可与投机推理配合使用，实现投机校验模型的量化功能。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

包含了本教程中使用到的模型训练代码。代码包具体说明请参见模型软件包结构说明。获取路径：Support-E 说明：如果上述软件获取路径打开后未显示相应的软件信息，说明您没有下载权限，请联系您所在企业的华为方技术支持下载获取。模型软件包结构说明 AscendCloud-6.3.90

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） > 准备工作
快速配置ModelArts委托授权 - AI开发平台ModelArts

如果已获得委托授权，则可以在权限管理页面中查看到已获得的委托授权信息。如果未获得委托授权，当打开“访问授权”页面时，ModelArts会提醒您当前用户未配置授权，需联系此IAM用户的管理员账号进行委托授权。添加授权登录ModelArts管理控制台，在左侧导航栏选择“权限管理”，进入“权限管理”页面。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard准备工作 > 配置ModelArts Standard访问授权
非分离部署推理服务 - AI开发平台ModelArts

与--model入参同系列，但是权重参数远小于--model指定的模型。如果未使用投机推理功能，则无需配置。 --num-speculative-tokens：投机推理小模型每次推理的token数。如果未使用投机推理功能，则无需配置。参数--num-speculative-tok

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.908） > 部署推理服务
Notebook Cache盘告警上报 - AI开发平台ModelArts

那么就会收到通知。选择合适的协议，如邮件，短信等，并填写终端，如邮件地址，手机号等。单击确认。此时订阅总数中会出现一条记录，但是处于未确认的状态。收到邮件后单击“订阅确认”。此时该订阅记录将处于已确认的状态。创建告警行动规则行动规则即为告警触发时，AOM以怎样的方式

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例
在Workflow中更新已部署的服务 - AI开发平台ModelArts

wf.AlgorithmParameters(name="save_model_secs", value=wf.Placeholder(name="save_model_secs", placeholder_type=wf.PlaceholderType.INT, default=60

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
在推理生产环境中部署推理服务 - AI开发平台ModelArts

与--model入参同系列，但是权重参数远小于--model指定的模型。如果未使用投机推理功能，则无需配置。 --num-speculative-tokens：投机推理小模型每次推理的token数。如果未使用投机推理功能，则无需配置。参数--num-speculative-tok

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
使用大模型在ModelArts Standard创建模型部署在线服务 - AI开发平台ModelArts

”，避免尚未启动完成被认为超时而导致部署失败。添加环境变量部署服务时，增加如下环境变量，会将负载均衡的请求亲和策略配置为集群亲和，避免未就绪的服务实例影响预测成功率。 MODELARTS_SERVICE_TRAFFIC_POLICY: cluster 图4 自定义部署超时时间和添加环境变量示例图

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
使用AWQ量化工具转换权重 - AI开发平台ModelArts

py”文件进行模型量化，量化时间和模型大小有关，预计30分钟~3小时。 pip install transformers==4.41.0 # AutoAWQ未适配transformers 4.42以上 python examples/quantize.py --model-path /home/ma-user/llama-2-7b/

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用AWQ量化 - AI开发平台ModelArts

py”文件进行模型量化，量化时间和模型大小有关，预计30分钟~3小时。 pip install transformers==4.41.0 # AutoAWQ未适配transformers 4.42以上 python examples/quantize.py --model-path /home/ma-user/llama-2-7b/

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
启动推理服务 - AI开发平台ModelArts

ANNGraph图模式目前支持llama和qwen2系列大语言模型单卡场景，包含该系列AWQ量化模型，其他场景(如Multi-lora)暂未支持。小模型如Qwen2-1.5B和Qwen2-0.5B推荐不设置该参数。 --disable-async-output-proc：关闭异步后处理特性，关闭后性能会下降。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务部署
下载数据 - AI开发平台ModelArts
下载数据 - AI开发平台ModelArts

入下载详情页面。根据数据集下载至OBS还是ModelArts数据集列表，填写不同配置信息： ModelArts数据管理模块在重构升级中，对未使用过数据管理的用户不可见。建议新用户选择将数据集下载至OBS使用。将数据集下载至OBS “下载方式”选择“对象存储服务（OBS）”。 “

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 订阅使用
FlUX.1基于Lite Server适配PyTorch NPU推理指导（6.3.912） - AI开发平台ModelArts

时间为准。获取路径：Support-E，在此路径中查找下载ModelArts 6.3.912 版本。说明：如果上述软件获取路径打开后未显示相应的软件信息，说明您没有下载权限，请联系您所在企业的华为方技术支持下载获取。镜像版本本教程中用到基础镜像地址和配套版本关系如下表所示，请提前了解。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
更新API授权 - AI开发平台ModelArts

Array of Apps objects app列表。 workspace_id 否 String 工作空间ID。获取方法请参见查询工作空间列表。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。表4 Apps 参数是否必选参数类型描述 app_id 否 String

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理

总条数： 602

上一页
1
...
21
22
23
...
31
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用AWQ量化工具转换权重 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

使用自动分组智能标注作业 - AI开发平台ModelArts

在ModelArts Standard上运行GPU训练作业的场景介绍 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

快速配置ModelArts委托授权 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

Notebook Cache盘告警上报 - AI开发平台ModelArts

在Workflow中更新已部署的服务 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

使用大模型在ModelArts Standard创建模型部署在线服务 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

启动推理服务 - AI开发平台ModelArts

下载数据 - AI开发平台ModelArts

FlUX.1基于Lite Server适配PyTorch NPU推理指导（6.3.912） - AI开发平台ModelArts

更新API授权 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线