搜索_华为云

使用SmoothQuant量化工具转换权重 - AI开发平台ModelArts

thQuant量化工具实现推理量化。 SmoothQuant量化工具使用到的脚本存放在代码包AscendCloud-LLM-x.x.x.zip的llm_tools目录下。代码目录如下: AutoSmoothQuant #量化工具 ├── ascend_aut

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
使用SmoothQuant量化工具转换权重 - AI开发平台ModelArts

thQuant量化工具实现推理量化。 SmoothQuant量化工具使用到的脚本存放在代码包AscendCloud-LLM-x.x.x.zip的llm_tools目录下。代码目录如下: AutoSmoothQuant #量化工具 ├── ascend_aut

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
创建Workflow数据集标注节点 - AI开发平台ModelArts

数据集标注相关的配置信息是 LabelTaskProperties title title信息，主要用于前端的名称展示否 str description 数据集标注节点的描述信息否 str policy 节点执行的policy 否 StepPolicy depend_steps 依赖的节点列表

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
使用SmoothQuant量化工具转换权重 - AI开发平台ModelArts

thQuant量化工具实现推理量化。 SmoothQuant量化工具使用到的脚本存放在代码包AscendCloud-LLM-x.x.x.zip的llm_tools目录下。代码目录如下: AutoSmoothQuant #量化工具 ├── ascend_aut

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907） > 推理模型量化
使用SmoothQuant量化 - AI开发平台ModelArts

本章节介绍如何使用SmoothQuant量化工具实现推理量化。 SmoothQuant量化工具使用到的脚本存放在代码包AscendCloud-LLM-x.x.x.zip的llm_tools目录下。代码目录如下: AutoSmoothQuant #量化工具 ├── ascend_aut

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.907） > 推理模型量化
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。父主题：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906） > 准备工作
从DWS导入数据到ModelArts数据集 - AI开发平台ModelArts

用户名：输入DWS集群管理员用户的用户名。密码：输入DWS集群管理员用户的密码。从DWS导入数据，需要借助DLI的功能，如果用户没有访问DLI服务的权限，需根据页面提示创建DLI的委托。父主题：导入数据到ModelArts数据集

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导入数据到ModelArts数据集
开发Workflow的核心概念介绍 - AI开发平台ModelArts

GalleryModel 属性描述是否必填数据类型 subscription_id 订阅模型的订阅ID 是 str version_num 订阅模型的版本号是 str 示例： example = GalleryModel(subscription_id="**", version_num="**")

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
使用AWQ量化工具转换权重 - AI开发平台ModelArts

方式二：使用AutoAWQ量化工具进行量化。 1、运行“examples/quantize.py”文件进行模型量化，量化时间和模型大小有关，预计30分钟~3小时。 pip install transformers==4.41.0 # AutoAWQ未适配transformers 4.42以上 python examples/quantize

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
与其他云服务的关系 - AI开发平台ModelArts

训练作业结束后，其生成的模型存储在OBS中，创建AI应用时，从OBS中导入已有的模型文件。部署上线将存储在OBS中的模型部署上线。全局配置 - 获取访问授权（使用委托或访问密钥授权），以便ModelArts可以使用OBS存储数据、创建Notebook等操作。与云硬盘的关系 ModelArts使用云硬盘服务（Elastic

帮助中心 > AI开发平台ModelArts > 产品介绍
ModelArts与其他服务的关系 - AI开发平台ModelArts

训练作业结束后，其生成的模型存储在OBS中，创建AI应用时，从OBS中导入已有的模型文件。部署上线将存储在OBS中的模型部署上线。权限管理 - 获取访问授权（使用委托或访问密钥授权），以便ModelArts可以使用OBS存储数据、创建Notebook等操作。与云硬盘的关系 ModelArts使用云硬盘服务（Elastic

帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题
AIGC模型训练推理 - AI开发平台ModelArts

NPU推理指导（6.3.902） SDXL WebUI基于DevServer适配PyTorch NPU推理指导（6.3.902） Open-Clip基于DevServer适配PyTorch NPU训练指导 moondream2基于DevServer适配PyTorch NPU推理指导 AIGC工具tailor使用指导

 帮助中心 > AI开发平台ModelArts > 最佳实践
管理Workflow StepExecution - AI开发平台ModelArts

type 否 String 参数的类型，枚举值如下: str：字符串 int：整型 bool：布尔类型 float：浮点型 description 否 String Workflow工作流配置参数的描述。 example 否 Object Workflow工作流配置参数的样例。

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
查看AI应用事件 - AI开发平台ModelArts

does not support dependencies. 自定义镜像导入不支持配置运行时依赖，在构建镜像的dockerfile文件中安装pip依赖包。FAQ 异常非自定义镜像不支持指定swr_location字段。 Non-custom type models should not

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理AI应用
更新资源池 - AI开发平台ModelArts

annotations object 资源池的注释信息。表5 annotations 参数是否必选参数类型描述 os.modelarts/description 否 String 资源池描述信息，用于说明资源池用于某种指定场景。不能包含特殊字符!<>=&"'。 os.modelarts/order

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
附录：工作负载Pod异常问题和解决方法 - AI开发平台ModelArts

scheduler 若重启后，还是会Pending，建议多重复重启几次。其他实例调度失败问题首先通过打印Pod日志信息。根据错误信息，可通过访问官网链接：工作负载异常：实例调度失败，进行查找。父主题：主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）
在ModelArts Studio基于Llama3-8B模型实现新闻自动分类 - AI开发平台ModelArts

MaaS），使用Llama3-8B模型框架可以实现新闻自动分类，能够高效处理和分类大量新闻内容。该解决方案可以应用于如下场景：新闻门户网站：自动将新闻内容归类到相应板块，如科技、体育或国际新闻，以提升用户体验和内容检索效率。社交媒体平台：对用户分享的新闻链接进行智能分类，帮助用户迅速定位到感兴趣的话题。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
工作负载Pod异常 - AI开发平台ModelArts

${pod_scheduler_name} 若重启后，还是会Pending，建议多重复重启几次。其他实例调度失败问题首先通过打印Pod日志信息。根据错误信息，可通过访问官网链接：工作负载异常：实例调度失败，进行查找。如何删除config.yaml创建出的所有工作负载Pod 若要删除config.yaml

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.909） > 常见错误原因和解决方法
分页查询智能任务列表 - AI开发平台ModelArts

19：基于gaussianblur的数据增强与原图预测结果不一致。 20：基于fliplr的数据增强与原图预测结果不一致。 21：基于crop的数据增强与原图预测结果不一致。 22：基于flipud的数据增强与原图预测结果不一致。 23：基于scale的数据增强与原图预测结果不一致。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
创建团队标注任务 - AI开发平台ModelArts

图6 标注任务数据标注访问地址可以查看如下表格获取，另外，如果团队成员绑定了邮箱，可以收到任务通知邮件，成员也可以通过邮件中给出的地址访问ModelArts-Console标注地址。表1 ModelArts标注地址局点 ModelArts-Console访问地址华北-北京四 https://console

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过团队标注方式标注数据

总条数： 938

上一页
1
...
40
41
42
...
47
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用SmoothQuant量化工具转换权重 - AI开发平台ModelArts

使用SmoothQuant量化工具转换权重 - AI开发平台ModelArts

创建Workflow数据集标注节点 - AI开发平台ModelArts

使用SmoothQuant量化工具转换权重 - AI开发平台ModelArts

使用SmoothQuant量化 - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

从DWS导入数据到ModelArts数据集 - AI开发平台ModelArts

开发Workflow的核心概念介绍 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

与其他云服务的关系 - AI开发平台ModelArts

ModelArts与其他服务的关系 - AI开发平台ModelArts

AIGC模型训练推理 - AI开发平台ModelArts

管理Workflow StepExecution - AI开发平台ModelArts

查看AI应用事件 - AI开发平台ModelArts

更新资源池 - AI开发平台ModelArts

附录：工作负载Pod异常问题和解决方法 - AI开发平台ModelArts

在ModelArts Studio基于Llama3-8B模型实现新闻自动分类 - AI开发平台ModelArts

工作负载Pod异常 - AI开发平台ModelArts

分页查询智能任务列表 - AI开发平台ModelArts

创建团队标注任务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线