搜索_华为云

创建OBS桶用于ModelArts存储数据 - AI开发平台ModelArts

ModelArts标注的数据存储在OBS中。自动训练训练作业结束后，其生成的模型存储在OBS中。部署上线 ModelArts将存储在OBS中的模型部署上线为在线服务。 Standard AI全流程开发数据管理数据集存储在OBS中。数据集的标注信息存储在OBS中。支持从OBS中导入数据。开发环境

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard准备工作
使用AWQ量化工具转换权重 - AI开发平台ModelArts

Step2 权重格式离线转换（可选） AutoAWQ量化完成后，使用int32对int4的权重进行打包。昇腾上使用int8对权重进行打包，在线转换会增加启动时间，可以提前对权重进行转换以减少启动时间，转换步骤如下：进入llm_tools/AutoAWQ代码目录下执行以下脚本：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
在MaaS中创建模型 - AI开发平台ModelArts

specific problem. 未知错误。查看日志定位处理问题，或者联系技术支持。 Backend model template selection error (metadata error). 后台模型模板选择错误。查看日志定位处理问题，或者联系技术支持。 Failed to

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
配置Lite Server存储 - AI开发平台ModelArts

如高性能计算、媒体处理、文件共享和内容管理和Web服务等。说明：高性能计算：主要是高带宽的需求，用于共享文件存储，比如基因测序、图片渲染这些。如大数据分析、静态网站托管、在线视频点播、基因测序和智能视频监控等。如高性能计算、企业核心集群应用、企业应用系统和开发测试等。说明：高性能计算：主要是高速率、高IO

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置
使用AWQ量化工具转换权重 - AI开发平台ModelArts

Step2 权重格式离线转换（可选） AutoAWQ量化完成后，使用int32对int4的权重进行打包。昇腾上使用int8对权重进行打包，在线转换会增加启动时间，可以提前对权重进行转换以减少启动时间，转换步骤如下：进入llm_tools/AutoAWQ代码目录下执行以下脚本：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
错误码 - AI开发平台ModelArts
错误码 - AI开发平台ModelArts

allowed. 免费服务的最大值为{个数}。删除无用的免费服务释放配额。 400 ModelArts.3857 A maximum of {number} free service instances are allowed. 免费服务实例的最大值为{个数}。删除无用的免费服务释放配额。

帮助中心 > AI开发平台ModelArts > API参考 > 公共参数
更新Notebook实例 - AI开发平台ModelArts

工作空间ID。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。 feature String 实例类别。枚举值： DEFAULT：CodeLab免费规格实例，每个用户最多只能创建一个。 NOTEBOOK：计费规格实例。 billing_items Array of strings 计费资源类型。枚举值：

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
W8A16量化 - AI开发平台ModelArts
W8A16量化 - AI开发平台ModelArts

"desc_act": false } 启动vLLM，如果是使用命令行的方式，指定--quantization "gptq"参数，其他参数请参考启动在线推理服务。 python -m vllm.entrypoints.openai.api_server --model <your_model>

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 量化
自动学习/Workflow计费项 - AI开发平台ModelArts

06:00完成了数据校验，10:06:00-10:12:00完成了图像分类，11:30:00完成了服务部署，并在12:00:00停止运行在线服务。同时，使用公共资源池运行实例，模型训练时选择资源池规格为CPU: 8 核 32GB、计算节点个数为1个（单价：3.40 元/小时）；服务部署时选择资源池规格为CPU:

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费项
获取智能任务的信息 - AI开发平台ModelArts

SampleLabels objects 视频在线服务推理结果。 service_id String 在线服务ID。 service_name String 在线服务名称。 service_resource String 用户绑定的在线服务资源ID。 total_sample_count

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
使用AWQ量化工具转换权重 - AI开发平台ModelArts

Step2 权重格式离线转换（可选） AutoAWQ量化完成后，使用int32对int4的权重进行打包。昇腾上使用int8对权重进行打包，在线转换会增加启动时间，可以提前对权重进行转换以减少启动时间，转换步骤如下：进入llm_tools/AutoAWQ代码目录下执行以下脚本：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
不允许子账号使用公共资源池创建作业 - AI开发平台ModelArts

Notebook”，单击“创建”，在创建Notebook页面，资源池规格只能选择专属资源池。使用子账号用户登录ModelArts控制台，选择“模型部署 > 在线服务”，单击“部署”，在部署服务页面，资源池规格只能选择专属资源池。父主题：典型场景配置实践

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
附录：训练常见问题 - AI开发平台ModelArts

ZeRO-3 Optimizer States、Gradient、Model Parameter分布到不同的NPU 增加卡数重新训练，未解决找相关人员定位。问题2：访问容器目录时提示Permission denied 解决方法：由于在容器中没有相应目录的权限，会导致访问时提示Permission

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910）
附录：训练常见问题 - AI开发平台ModelArts

ZeRO-3 Optimizer States、Gradient、Model Parameter分布到不同的NPU 增加卡数重新训练，未解决找相关人员定位。问题2：访问容器目录时提示Permission denied 解决方法：由于在容器中没有相应目录的权限，会导致访问时提示Permission

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911）
附录：训练常见问题 - AI开发平台ModelArts

ZeRO-3 Optimizer States、Gradient、Model Parameter分布到不同的NPU 增加卡数重新训练，未解决找相关人员定位。问题2：访问容器目录时提示Permission denied 解决方法：由于在容器中没有相应目录的权限，会导致访问时提示Permission

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.909）
使用AWQ量化 - AI开发平台ModelArts

Step2 权重格式离线转换（可选）在GPU上AutoAWQ量化完成后，使用int32对int4的权重进行打包。昇腾上使用int8对权重进行打包，在线转换会增加启动时间，可以提前对权重进行转换以减少启动时间，转换步骤如下：进入llm_tools/AutoAWQ代码目录下执行以下脚本：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
使用AWQ量化 - AI开发平台ModelArts

步骤二权重格式离线转换（可选）在GPU上AutoAWQ量化完成后，使用int32对int4的权重进行打包。昇腾上使用int8对权重进行打包，在线转换会增加启动时间，可以提前对权重进行转换以减少启动时间，转换步骤如下：进入llm_tools/AutoAWQ代码目录下执行以下脚本：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用AWQ量化工具转换权重 - AI开发平台ModelArts

Step2 权重格式离线转换（可选） AutoAWQ量化完成后，使用int32对int4的权重进行打包。昇腾上使用int8对权重进行打包，在线转换会增加启动时间，可以提前对权重进行转换以减少启动时间，转换步骤如下：进入llm_tools/AutoAWQ代码目录下执行以下脚本：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用AWQ量化 - AI开发平台ModelArts

步骤二权重格式离线转换（可选）在GPU上AutoAWQ量化完成后，使用int32对int4的权重进行打包。昇腾上使用int8对权重进行打包，在线转换会增加启动时间，可以提前对权重进行转换以减少启动时间，转换步骤如下：进入llm_tools/AutoAWQ代码目录下执行以下脚本：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
使用AWQ量化 - AI开发平台ModelArts

步骤二权重格式离线转换（可选）在GPU上AutoAWQ量化完成后，使用int32对int4的权重进行打包。昇腾上使用int8对权重进行打包，在线转换会增加启动时间，可以提前对权重进行转换以减少启动时间，转换步骤如下：进入llm_tools/AutoAWQ代码目录下执行以下脚本：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 推理模型量化

总条数： 412

上一页
1
...
16
17
18
...
21
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建OBS桶用于ModelArts存储数据 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

在MaaS中创建模型 - AI开发平台ModelArts

配置Lite Server存储 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

错误码 - AI开发平台ModelArts

更新Notebook实例 - AI开发平台ModelArts

W8A16量化 - AI开发平台ModelArts

自动学习/Workflow计费项 - AI开发平台ModelArts

获取智能任务的信息 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

不允许子账号使用公共资源池创建作业 - AI开发平台ModelArts

附录：训练常见问题 - AI开发平台ModelArts

附录：训练常见问题 - AI开发平台ModelArts

附录：训练常见问题 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线