搜索_华为云

使用SmoothQuant量化 - AI开发平台ModelArts

使用SmoothQuant量化 SmoothQuant(W8A8)量化方案能降低模型显存以及需要部署的卡数。也能同时降低首token时延和增量推理时延。支持SmoothQuant(W8A8)量化的模型列表请参见表3。本章节介绍如何使用SmoothQuant量化工具实现推理量化。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用SmoothQuant量化 - AI开发平台ModelArts

使用SmoothQuant量化 SmoothQuant(W8A8)量化方案能降低模型显存以及需要部署的卡数。也能同时降低首token时延和增量推理时延。支持SmoothQuant(W8A8)量化的模型列表请参见表3。本章节介绍如何使用SmoothQuant量化工具实现推理量化。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
功能介绍 - AI开发平台ModelArts
功能介绍 - AI开发平台ModelArts

功能介绍 Standard功能介绍 MaaS大模型即服务平台功能介绍 Lite Cluster&Server介绍 AI Gallery功能介绍

 帮助中心 > AI开发平台ModelArts > 产品介绍
Standard支持的AI框架 - AI开发平台ModelArts

Standard支持的AI框架 ModelArts Standard的开发环境Notebook、训练作业、模型推理（即模型管理和部署上线）支持的AI框架及其版本，请参见如下描述。统一镜像列表 ModelArts提供了ARM+Ascend规格的统一镜像，包括MindSpore、P

帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
使用SmoothQuant量化工具转换权重 - AI开发平台ModelArts

使用SmoothQuant量化工具转换权重 SmoothQuant(W8A8)量化方案能降低模型显存以及需要部署的卡数。也能同时降低首token时延和增量推理时延。支持SmoothQuant(W8A8)量化的模型列表请参见支持的模型列表和权重文件。本章节介绍如何在Noteboo

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907） > 推理模型量化
使用SmoothQuant量化 - AI开发平台ModelArts

使用SmoothQuant量化 SmoothQuant(W8A8)量化方案能降低模型显存以及需要部署的卡数。也能同时降低首token时延和增量推理时延。支持SmoothQuant(W8A8)量化的模型列表请参见表3。本章节介绍如何使用SmoothQuant量化工具实现推理量化。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.907） > 推理模型量化
使用SmoothQuant量化工具转换权重 - AI开发平台ModelArts

使用SmoothQuant量化工具转换权重 SmoothQuant(W8A8)量化方案能降低模型显存以及需要部署的卡数。也能同时降低首token时延和增量推理时延。支持SmoothQuant(W8A8)量化的模型列表请参见支持的模型列表和权重文件。本章节介绍如何在Noteboo

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
AI Gallery（新版） - AI开发平台ModelArts

AI Gallery（新版） AI Gallery使用流程发布和管理AI Gallery模型发布和管理AI Gallery数据集发布和管理AI Gallery项目发布和管理AI Gallery镜像发布和管理AI Gallery中的AI应用使用AI Gallery微调大师训练模型

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery）
批量服务输入/输出obs目录不存在或者权限不足 - AI开发平台ModelArts

批量服务输入/输出obs目录不存在或者权限不足问题现象输入输出目录不存在，报如下错误 "error_code": "ModelArts.3551", "error_msg": "OBS path xxxx does not exist." 当访问目录权限不足时，报如下错误 "error_code":

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
LoRA训练 - AI开发平台ModelArts
LoRA训练 - AI开发平台ModelArts

LoRA训练本章节介绍SDXL&SD 1.5模型的LoRA训练过程。LoRA训练是指在已经训练好的模型基础上，使用新的数据集进行LoRA微调以优化模型性能的过程。训练前需要修改数据集路径、模型路径。脚本里写到datasets路径即可。 run_lora_sdxl中的vae路径要准确写到sdxl_vae

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理 > SD1.5&SDXL Kohya框架基于DevServer适配PyTorch NPU训练指导（6.3.908）
服务预测 - AI开发平台ModelArts
服务预测 - AI开发平台ModelArts

服务预测服务预测失败服务预测失败，报错APIG.XXXX 在线服务预测报错ModelArts.4206 在线服务预测报错ModelArts.4302 在线服务预测报错ModelArts.4503 在线服务预测报错MR.0105 Method Not Allowed 请求超时返回Timeout

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署
ModelArts - AI开发平台ModelArts
ModelArts - AI开发平台ModelArts

None 服务介绍 ModelArts产品产品介绍 03:19 了解什么是ModelArts ModelArts自动学习视频介绍 02:59 ModelArts自动学习简介 ModelArts CodeLab 视频介绍 04:16 ModelArts CodeLab介绍 JupyterLab

帮助中心 > AI开发平台ModelArts > 视频帮助
查询数据集导入任务列表 - AI开发平台ModelArts

查询数据集导入任务列表功能介绍分页查询数据集导入任务列表。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/datase

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
推理业务迁移评估表 - AI开发平台ModelArts

推理业务迁移评估表通用的推理业务及LLM推理可提供下表进行业务迁移评估：收集项说明实际情况（请填写）项目名称项目名称，例如：XXX项目。 - 使用场景例如：使用YOLOv5算法对工地的视频流裁帧后进行安全帽检测。使用BertBase算法对用户在app上购买商品后的评论进行理解。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
查询数据集导入任务的详情 - AI开发平台ModelArts

查询数据集导入任务的详情功能介绍查询数据集导入任务的详情。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/datase

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
功能总览 - AI开发平台ModelArts
功能总览 - AI开发平台ModelArts

功能总览功能总览全部自动学习 Workflow 开发工具算法管理训练管理 AI应用管理部署上线镜像管理资源池 AI Gallery ModelArts SDK 昇腾生态自动学习自动学习是帮助人们实现AI应用的低门槛、高灵活、零代码的定制化模型开发工具。自动学习

 帮助中心 > AI开发平台ModelArts > 功能总览
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

场景介绍方案概览本文档利用训练框架LlamaFactory+华为自研Ascend Snt9B硬件，为用户提供了常见主流开源大模型在ModelArts Lite Server上的不同训练阶段方案，包括指令监督微调、DPO偏好训练、RM奖励模型训练、PPO强化训练方案。 DPO(Direct

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.909）
权限策略和授权项 - AI开发平台ModelArts

权限策略和授权项策略及授权项说明数据管理权限开发环境权限训练作业权限模型管理权限服务管理权限工作空间管理权限 DevServer权限

 帮助中心 > AI开发平台ModelArts > API参考
主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.906） - AI开发平台ModelArts

主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.906）推理场景介绍部署推理服务推理性能测试推理精度测试推理模型量化附录：大模型推理常见问题父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
迁移评估 - AI开发平台ModelArts
迁移评估 - AI开发平台ModelArts

迁移评估推理迁移包括模型迁移、业务迁移、精度性能调优等环节，是否能满足最终的迁移效果需要进行系统的评估。如果您仅需要了解迁移过程，可以先按照本文档的指导进行操作并熟悉迁移流程。如果您有实际的项目需要迁移，建议填写下方的推理业务迁移评估表，并将该调研表提供给华为云技术支持人员进行迁移评估，以确保迁移项目能顺利实施。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导

总条数： 1464

上一页
1
...
62
63
64
...
74
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用SmoothQuant量化 - AI开发平台ModelArts

使用SmoothQuant量化 - AI开发平台ModelArts

功能介绍 - AI开发平台ModelArts

Standard支持的AI框架 - AI开发平台ModelArts

使用SmoothQuant量化工具转换权重 - AI开发平台ModelArts

使用SmoothQuant量化 - AI开发平台ModelArts

使用SmoothQuant量化工具转换权重 - AI开发平台ModelArts

AI Gallery（新版） - AI开发平台ModelArts

批量服务输入/输出obs目录不存在或者权限不足 - AI开发平台ModelArts

LoRA训练 - AI开发平台ModelArts

服务预测 - AI开发平台ModelArts

ModelArts - AI开发平台ModelArts

查询数据集导入任务列表 - AI开发平台ModelArts

推理业务迁移评估表 - AI开发平台ModelArts

查询数据集导入任务的详情 - AI开发平台ModelArts

功能总览 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

权限策略和授权项 - AI开发平台ModelArts

主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.906） - AI开发平台ModelArts

迁移评估 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线