搜索_华为云

使用AWQ量化 - AI开发平台ModelArts

awq --clone PyTorch-2.1.0 conda activate awq 2、运行“examples/quantize.py”文件进行模型量化，量化时间和模型大小有关，预计30分钟~3小时。 python examples/quantize.py --model-path

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
升级Standard专属资源池驱动 - AI开发平台ModelArts

驱动升级，请提交工单联系华为工程师开启节点绑定。驱动升级操作登录ModelArts管理控制台，在左侧导航栏中选择“AI专属资源池 > 弹性集群Cluster”，进入“Standard资源池”页面。在资源池列表中，选择需要进行驱动升级的资源池，在右侧的操作列，单击“ > 驱动升级”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本案例仅支持在专属资源池上运行。专属资源池驱动版本要求23.0.6。适配的CANN版本是cann_8.0.rc3。支持的模型列表和权重文件本方案支持vLLM的v0.5.0版本。不同vLLM版本支持的模型列表有差异，具体如表1所示。表1 支持的模型列表和权重获取地址序号模型名称

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
推理场景介绍 - AI开发平台ModelArts

cc0 cann_8.0.rc2 不同软件版本对应的基础镜像地址不同，请严格按照软件版本和镜像配套关系获取基础镜像。支持的模型列表和权重文件本方案支持vLLM的v0.3.2版本。不同vLLM版本支持的模型列表有差异，具体如表3所示。表3 支持的模型列表和权重获取地址序号模型名称

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于LIte Server适配PyTorch NPU推理指导（6.3.905）
训练的数据集预处理说明 - AI开发平台ModelArts

tokenized_dataset = self.get_tokenized_data() output_bin_files = {} output_idx_files = {} builders = {} level = "document" if self

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.909） > 训练脚本说明参考
训练的数据集预处理说明 - AI开发平台ModelArts

tokenized_dataset = self.get_tokenized_data() output_bin_files = {} output_idx_files = {} builders = {} level = "document" if self

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.910） > 训练脚本说明参考
训练的数据集预处理说明 - AI开发平台ModelArts

tokenized_dataset = self.get_tokenized_data() output_bin_files = {} output_idx_files = {} builders = {} level = "document" if self

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.908） > 训练脚本说明参考
Standard资源池节点故障定位 - AI开发平台ModelArts

ECC错误。通过nvidia-smi -a查询到存在Pending Page Blacklist为Yes的记录，或多比特Register File大于0。对于Ampere架构的GPU，存在以下场景：存在不可纠正的SRAM错误。存在Remapping Failure记录。 dmsg中存在Xid

帮助中心 > AI开发平台ModelArts > 故障排除 > 资源池
API概览 - AI开发平台ModelArts
API概览 - AI开发平台ModelArts

根据指定的实例规格、AI引擎镜像、存储等相关参数，创建一个开发环境实例。查询Notebook实例详情查询开发环境实例详情。更新Notebook实例更新开发环境实例。删除Notebook实例删除开发环境实例，删除的资源包括Notebook容器以及对应的所有存储资源。通过运行的实例保存成容器镜像

 帮助中心 > AI开发平台ModelArts > API参考
W4A16量化 - AI开发平台ModelArts
W4A16量化 - AI开发平台ModelArts

awq --clone PyTorch-2.1.0 conda activate awq 2、运行“examples/quantize.py”文件进行模型量化，量化时间和模型大小有关，预计30分钟~3小时。 python examples/quantize.py --model-path

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 量化
修改训练作业优先级 - AI开发平台ModelArts

作列单击“授权”，勾选步骤2创建的自定义策略，单击“下一步”，选择授权范围方案，单击“确定”。此时，该用户组下的所有用户均有权限通过Cloud Shell登录运行中的训练作业容器。如果没有用户组，也可以创建一个新的用户组，并通过“用户组管理”功能添加用户，并配置授权。如果指定

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
创建节点池 - AI开发平台ModelArts

资源规格名称，比如：modelarts.vm.gpu.t4u8。 count 是 Integer 规格保障使用量。 maxCount 是 Integer 资源规格的弹性使用量，物理池该值和count相同。 azs 否 Array of PoolNodeAz objects 资源池中节点的AZ信息。 nodePool

帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本案例仅支持在专属资源池上运行。专属资源池驱动版本要求23.0.6。适配的CANN版本是cann_8.0.rc3。支持的模型列表和权重文件本方案支持vLLM的v0.6.0版本。不同vLLM版本支持的模型列表有差异，具体如表1所示。表1 支持的模型列表和权重获取地址序号模型名称

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
订阅免费模型 - AI开发平台ModelArts

在使用过程中如果消耗了硬件资源进行部署，管理控制台将根据实际使用情况收取硬件资源的费用。前提条件注册并登录华为云，且创建好OBS桶用于存储数据和模型。如果是订阅使用HiLens技能，则需要获取相关服务权限，详细操作请参见准备工作（华为HiLens）。订阅免费模型登录“AI

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 订阅使用
删除镜像 - AI开发平台ModelArts
删除镜像 - AI开发平台ModelArts

删除镜像功能介绍删除镜像对象，对于个人私有镜像可以通过参数一并删除SWR镜像内容。接口约束暂无约束调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI DELETE

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

确保容器可以访问公网。训练支持的模型列表本方案支持以下模型的训练，如表1所示。表1 支持的模型列表序号支持模型支持模型参数量权重文件获取地址 1 llama2 llama2-7b https://huggingface.co/meta-llama/Llama-2-7b-chat-hf

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.907）
部署声音分类服务 - AI开发平台ModelArts

服务测试。图1 服务测试下面的测试，是您在自动学习声音分类项目页面将模型部署之后进行服务测试的操作步骤。模型部署完成后，您可添加音频文件进行测试。在“自动学习”页面，选择服务部署节点，单击实例详情，进入“模型部署”界面，选择状态为“运行中”的服务版本，在“服务测试”区域单击“上传”，选择本地音频进行测试。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现声音分类
批量删除标签 - AI开发平台ModelArts

Integer 是否删除标签及包含标签的样本。可选值如下： 0：只删除标签 1：删除标签及包含标签的样本 2：删除标签和包含标签的样本及其源文件请求参数表3 请求Body参数参数是否必选参数类型描述 labels 否 Array of Label objects 待删除标签列表。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询镜像详情 - AI开发平台ModelArts

查询镜像详情功能介绍查询镜像详情。接口约束暂无约束调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v1/{project_id}/images/{id}

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

确保容器可以访问公网。训练支持的模型列表本方案支持以下模型的训练，如表1所示。表1 支持的模型列表序号支持模型支持模型参数量权重文件获取地址 1 llama2 llama2-7b https://huggingface.co/meta-llama/Llama-2-7b-chat-hf

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.906）

总条数： 1654

上一页
1
...
78
79
80
...
83
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用AWQ量化 - AI开发平台ModelArts

升级Standard专属资源池驱动 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

Standard资源池节点故障定位 - AI开发平台ModelArts

API概览 - AI开发平台ModelArts

W4A16量化 - AI开发平台ModelArts

修改训练作业优先级 - AI开发平台ModelArts

创建节点池 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

订阅免费模型 - AI开发平台ModelArts

删除镜像 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

部署声音分类服务 - AI开发平台ModelArts

批量删除标签 - AI开发平台ModelArts

查询镜像详情 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线