搜索_华为云

场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

场景介绍方案概览本文档介绍了在ModelArts的Standard上使用昇腾计算资源开展常见开源大模型Llama、Qwen、ChatGLM、Yi、Baichuan等推理部署的详细过程，利用适配昇腾平台的大模型推理服务框架vLLM和华为自研昇腾Snt9B硬件，为用户提供推理部署方案，帮助用户使能大模型业务。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

场景介绍方案概览本文档利用训练框架PyTorch_npu+华为自研Ascend Snt9B硬件，为用户提供了常见主流开源大模型在ModelArts Standard上的预训练和全量微调方案。本方案目前仅适用于部分企业客户，完成本方案的部署，需要先联系您所在企业的华为方技术支持。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912）
附录：大模型推理常见问题 - AI开发平台ModelArts

float16改成torch.bfloat16 kwargs = {"torch_dtype": torch.bfloat16, "device_map": "auto"} 问题13：使用SmoothQuant做权重转换时报错图8 权重转换报错涉及模型：qwen2-1.5b

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
从OBS中导入模型文件创建模型 - AI开发平台ModelArts

健康检查URL：健康检查的URL固定为“/health”。健康检查周期（秒）：填写1-2147483647之前的整数，单位为秒。延迟时间（秒）：实例启动后，延迟执行健康检查的时间。填写0-2147483647之间的整数，单位为秒，不能为空。超时时间（秒）：每次检查的超时时间，填写0-2147483647之间的整数，单位为秒。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
Ascend-vLLM推理常见问题 - AI开发平台ModelArts

float16改成torch.bfloat16 kwargs = {"torch_dtype": torch.bfloat16, "device_map": "auto"} 问题13：使用SmoothQuant做权重转换时，有如下报错涉及模型：qwen2-1.5b、qwen2-0

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 附录
自动学习训练作业失败 - AI开发平台ModelArts

不满足训练作业要求时，会出现训练作业运行失败的错误。建议检查用于训练的数据，是否满足预测分析作业的要求。要求如下所示，如果数据满足要求，执行下一步检查。如果不满足要求，请根据要求进行数据调整后再重新训练。文件规范：名称由以字母数字及中划线下划线组成，以'.csv'结尾，且文件

 帮助中心 > AI开发平台ModelArts > 故障排除 > 自动学习 > 模型训练
附录：大模型推理常见问题 - AI开发平台ModelArts

float16改成torch.bfloat16 kwargs = {"torch_dtype": torch.bfloat16, "device_map": "auto"} 问题13：使用SmoothQuant做权重转换时报错图8 权重转换报错涉及模型：qwen2-1.5b

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911）
附录：大模型推理常见问题 - AI开发平台ModelArts

float16改成torch.bfloat16 kwargs = {"torch_dtype": torch.bfloat16, "device_map": "auto"} 问题13：使用SmoothQuant做权重转换时报错图8 权重转换报错涉及模型：qwen2-1.5b

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
按需计费 - AI开发平台ModelArts
按需计费 - AI开发平台ModelArts

总览”的“欠费金额”查看，华为云将在您充值时自动扣取欠费金额。如果您在宽限期内仍未支付欠款，那么就会进入保留期，资源状态变为“已冻结”，您将无法对处于保留期的按需计费资源执行任何操作。保留期到期后，如果您仍未支付账户欠款，那么计算资源将被释放，数据无法恢复。华为云根据客户等级定义了不同客户的宽限期和保留期时长。

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费模式
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

场景介绍方案概览本文档介绍了在ModelArts的Standard上使用昇腾计算资源开展常见开源大模型Llama、Qwen、ChatGLM、Yi、Baichuan等推理部署的详细过程，利用适配昇腾平台的大模型推理服务框架vLLM和华为自研昇腾Snt9B硬件，为用户提供推理部署方案，帮助用户使能大模型业务。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

场景介绍方案概览本文档介绍了在ModelArts的Standard上使用昇腾计算资源开展常见开源大模型Llama、Qwen、ChatGLM、Yi、Baichuan等推理部署的详细过程，利用适配昇腾平台的大模型推理服务框架vLLM和华为自研昇腾Snt9B硬件，为用户提供推理部署方案，帮助用户使能大模型业务。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
调用MaaS部署的模型服务 - AI开发平台ModelArts

境。表3 常见错误码错误码错误内容说明 400 Bad Request 请求包含语法错误。 403 Forbidden 服务器拒绝执行。 404 Not Found 服务器找不到请求的网页。 500 Internal Server Error 服务内部错误。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
使用AI Gallery的订阅算法实现花卉识别 - AI开发平台ModelArts

json”文件，将“runtime”的配置修改为ModelArts支持的GPU规格，例如"runtime": "tf1.13-python3.6-gpu"。修改完成后，重新执行导入模型和部署为在线服务的操作。参数设置完成后，单击“下一步”，确认规格参数，单击“提交”，完成在线服务的部署。您可以进入“模型部署 >

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务在ModelArts的开发环境Notebook中可以部署推理服务进行调试。 Step1 准备Notebook 参考准备Notebook完成Notebook的创建，并打开Notebook。 Step2 准备权重文件将OBS中的模型权重上传

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务在ModelArts的开发环境Notebook中可以部署推理服务进行调试。 Step1 准备Notebook 参考准备Notebook完成Notebook的创建，并打开Notebook。 Step2 准备权重文件将OBS中的模型权重上传

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
发布数据 - AI开发平台ModelArts
发布数据 - AI开发平台ModelArts

根据异常状态的错误提示修改源数据后，单击目标数据集右侧的“重试”重新发布数据集。删除发布的数据集当您需要删除发布在AI Gallery中的数据集时，可以执行如下步骤进行删除。在AI Gallery页面的右上角选择“我的Gallery > 我的资产 > 数据”，进入“我的数据”。在“我的发布

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 发布分享
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务在ModelArts的开发环境Notebook中可以部署推理服务进行调试。 Step1 准备Notebook 参考准备Notebook完成Notebook的创建，并打开Notebook。 Step2 准备权重文件将OBS中的模型权重上传

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
创建Workflow数据集节点 - AI开发平台ModelArts

title title信息，主要用于前端的名称展示。否 str description 数据集创建节点的描述信息。否 str policy 节点执行的policy。否 StepPolicy depend_steps 依赖的节点列表。否 Step或者Step的列表表2 CreateDatasetInput

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
更新算法 - AI开发平台ModelArts
更新算法 - AI开发平台ModelArts

描述 key 否 String 资源约束，可选键值如： flavor_type（资源类型），对应值可选择CPU、GPU或Ascend； device_distributed_mode（是否支持多卡训练），对应值可选择multiple（支持）、singular（不支持）； host_

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
创建ModelArts数据集 - AI开发平台ModelArts

行列。创建数据集时必须指定schema，且一旦创建不支持修改。从OBS数据源导入数据，会自动获取文件路径下csv文件的schema，如果多个csv文件的schema不一致会报错。说明：从OBS选择数据后，Schema信息的列名会自动带出，且默认为表格中的第一行数据。为确保预

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理

总条数： 1253

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

从OBS中导入模型文件创建模型 - AI开发平台ModelArts

Ascend-vLLM推理常见问题 - AI开发平台ModelArts

自动学习训练作业失败 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

按需计费 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

调用MaaS部署的模型服务 - AI开发平台ModelArts

使用AI Gallery的订阅算法实现花卉识别 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

发布数据 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

创建Workflow数据集节点 - AI开发平台ModelArts

更新算法 - AI开发平台ModelArts

创建ModelArts数据集 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线