搜索_华为云

附录：基于vLLM不同模型推理支持最小卡数和最大序列说明 - AI开发平台ModelArts

以下值是在gpu-memory-utilization为0.9时测试得出，为服务部署所需的最小昇腾卡数及该卡数下推荐的最大max-model-len长度，不代表最佳性能。以llama2-13b为例，NPU卡显存为32GB时，至少需要2张卡运行推理业务，2张卡运行的情况下，推荐的最大序列max-model

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
运行训练代码，出现dead kernel，并导致实例崩溃 - AI开发平台ModelArts

层数太多，亦或者其他原因，导致出现“内存不够”问题，最终导致该容器实例崩溃。出现此问题后，系统将自动重启Notebook，来修复实例崩溃的问题。此时只是解决了崩溃问题，如果重新运行训练代码仍将失败。如果您需要解决“内存不够”的问题，建议您创建一个新的Notebook，使用更高规

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 代码运行故障
AIGC工具tailor使用指导 - AI开发平台ModelArts

tailor是AIGC场景下用于模型转换（onnx到mindir）和性能分析的辅助工具，当前支持以下功能。表1 功能总览功能大类具体功能模型转换固定shape转模型动态shape传入指定档位转模型支持fp32 支持AOE优化 benchmark 支持测试性能支持精度测试 profiling 支持分析算子的profiling

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
日志提示“pandas.errors.ParserError: Error tokenizing data. C error: Expected .* fields” - AI开发平台ModelArts

errors.ParserError: Error tokenizing data. C error: Expected .* fields” 问题现象使用pandas读取csv数据表时，日志报出如下错误导致训练作业失败： pandas.errors.ParserError: Error

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
MaaS大模型即服务平台功能介绍 - AI开发平台ModelArts

MaaS集成了业界主流开源大模型，含Llama、Baichuan、Yi、Qwen、AIGC等模型系列，所有的模型均基于昇腾AI云服务进行全面适配和优化，使得精度和性能显著提升。开发者无需从零开始构建模型，只需选择合适的预训练模型进行微调或直接应用，大大减轻模型集成的负担。零代码、免配置、免调优模型开发

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍
LoRA微调训练 - AI开发平台ModelArts

for_output/llama2-13b/saved_models/。最后，提交训练作业，训练完成后，请参考查看日志和性能章节查看SFT微调的日志和性能。了解更多ModelArts训练功能，可查看模型开发简介。父主题：主流开源大模型基于Standard适配PyTorch NPU训练指导（6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906）
更新AI应用版本时，边缘服务预测功能不可用？ - AI开发平台ModelArts

更新AI应用版本时，边缘服务预测功能不可用？针对某一部署的边缘服务，如果在更新AI应用版本时，即修改边缘服务，更新其使用的AI应用版本，导致此边缘服务的预测功能暂不可用。针对此场景，由于更新了AI应用版本，边缘服务将重新部署，处于部署中的边缘服务，则无法使用预测功能。即更新A

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 边缘服务
Huggingface缓存目录空间不足，出现OSError: [Errno 122] Disk quota exceeded - AI开发平台ModelArts

Huggingface缓存目录空间不足，出现OSError: [Errno 122] Disk quota exceeded 问题现象报错提示OSError: [Errno 122] Disk quota exceeded。原因分析默认情况下，下载数据集缓存目录为“~/.c

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于LLM模型的GPU训练业务迁移至昇腾指导 > 常见问题
ModelArts - AI开发平台ModelArts
ModelArts - AI开发平台ModelArts

Snt3和Snt9芯片是华为自研的AI芯片。基于Ascend Snt3的低功耗、高算力特性，ModelArts支持使用Ascend Snt3提供高性能推理能力。Ascend Snt9是一款性能更高的训练芯片，主打算力强、体积小等特性，ModelArts支持使用Snt9提供训练能力。针对Ascend系列芯片，

帮助中心 > AI开发平台ModelArts > 功能总览
在物体检测作业中上传已标注图片后，为什么部分图片显示未标注？ - AI开发平台ModelArts

在物体检测作业中上传已标注图片后，为什么部分图片显示未标注？请您检查未标注图片的标注文件是否正确。如果标注框文件坐标超过图片，自动学习默认该图片未标注。父主题：数据标注

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习 > 数据标注
在线服务处于运行中状态时，如何填写推理请求的request header和request body - AI开发平台ModelArts

在线服务处于运行中状态时，如何填写推理请求的request header和request body 问题现象部署在线服务完成且在线服务处于“运行中”状态时，通过ModelArts console的调用指南tab页签可以获取到推理请求的地址，但是不知道如何填写推理请求的header及body。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 在线服务
昇腾能力应用地图 - AI开发平台ModelArts

Open-Sora-Plan1.0基于DevServer适配PyTorch NPU训练推理指导（6.3.907） Qwen-VL 训练推理 PyTorch Qwen-VL基于DevServer适配Pytorch NPU的Finetune训练指导(6.3.906) Qwen-VL基于DevServer适配Pytorch

帮助中心 > AI开发平台ModelArts > 最佳实践
SD WebUI推理方案概览 - AI开发平台ModelArts

SD WebUI推理方案概览本文档主要介绍如何在ModelArts的DevServer和ModelArts Standard环境上部署Stable Diffusion的WebUI套件，使用NPU卡进行推理。约束限制本方案目前仅适用于部分企业客户，完成本方案的部署，需要先联系您所在企业的华为方技术支持。

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理 > SD WEBUI套件适配PyTorch NPU的推理指导（6.3.908）
使用AI Gallery微调大师训练模型 - AI开发平台ModelArts

Gallery支持将模型进行微调，训练后得到更优模型。场景描述模型微调是深度学习中的一种重要技术，它是指在预训练好的模型基础上，通过调整部分参数，使其在特定任务上达到更好的性能。在实际应用中，预训练模型是在大规模通用数据集上训练得到的，而在特定任务上，这些模型的参数可能并不都是最优的，因此需要进行微调。 AI

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
使用MaaS压缩模型 - AI开发平台ModelArts

模型压缩是指将高比特浮点数映射到低比特量化空间，从而减少显存占用的资源，降低推理服务时延，提高推理服务吞吐量，并同时减少模型的精度损失。模型压缩适用于追求更高的推理服务性能、低成本部署以及可接受一定精度损失的场景。 ModelArts Studio大模型即服务平台当前支持SmoothQuant-W8A8和AWQ-W4A16两种压缩策略。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
使用GPTQ量化 - AI开发平台ModelArts

当前版本使用GPTQ量化仅支持W8A16 perchannel的量化形式，使用W8A16的量化不仅可以保证精度在可接受的范围内，同时也有一定的性能收益。 GPTQ W8A16量化支持的模型请参见表1。本章节介绍如何在GPU的机器上使用开源GPTQ量化工具GPTQ (huggingface

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
训练业务迁移到昇腾设备场景介绍 - AI开发平台ModelArts

设备上运行并获得较好的模型训练效果。华为云ModelArts针对该场景提供了系统化的迁移指导，包括迁移原理、迁移流程以及迁移后的精度调试及性能调优方法介绍。此外，ModelArts提供了即开即用的云上集成开发环境，包含迁移所需要的算力资源、AI框架、昇腾开发套件以及迁移调优工具链

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导
使用边缘节点部署边缘服务能否使用http接口协议？ - AI开发平台ModelArts

使用边缘节点部署边缘服务能否使用http接口协议？系统默认使用https。如果您想使用http，可以采取以下两种方式：方式一：在部署边缘服务时添加如下环境变量： MODELARTS_SSL_ENABLED = false 图1 添加环境变量方式二：在使用自定义镜像导入模型时

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 边缘服务
创建图像分类自动学习项目并完成图片标注，训练按钮显示灰色，无法开始训练？ - AI开发平台ModelArts

创建图像分类自动学习项目并完成图片标注，训练按钮显示灰色，无法开始训练？图像分类项目，图片标注至少需要两个类别，且每个类别至少5张图片，才可以开始自动训练。父主题：模型训练

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习 > 模型训练
从AI Gallery下载到桶里的数据集，再在ModelArts里创建数据集，显示样本数为0 - AI开发平台ModelArts

从AI Gallery下载到桶里的数据集，再在ModelArts里创建数据集，显示样本数为0 首先需要确认从AI Gallery下载的数据格式，比如压缩包、excel文件等会被忽略，支持格式详情：数据集类型标注类型创建数据集导入数据导出数据发布数据集修改数据集管理版本

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据管理

总条数： 1439

上一页
1
...
41
42
43
...
72
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

附录：基于vLLM不同模型推理支持最小卡数和最大序列说明 - AI开发平台ModelArts

运行训练代码，出现dead kernel，并导致实例崩溃 - AI开发平台ModelArts

AIGC工具tailor使用指导 - AI开发平台ModelArts

日志提示“pandas.errors.ParserError: Error tokenizing data. C error: Expected .* fields” - AI开发平台ModelArts

MaaS大模型即服务平台功能介绍 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

更新AI应用版本时，边缘服务预测功能不可用？ - AI开发平台ModelArts

Huggingface缓存目录空间不足，出现OSError: [Errno 122] Disk quota exceeded - AI开发平台ModelArts

ModelArts - AI开发平台ModelArts

在物体检测作业中上传已标注图片后，为什么部分图片显示未标注？ - AI开发平台ModelArts

在线服务处于运行中状态时，如何填写推理请求的request header和request body - AI开发平台ModelArts

昇腾能力应用地图 - AI开发平台ModelArts

SD WebUI推理方案概览 - AI开发平台ModelArts

使用AI Gallery微调大师训练模型 - AI开发平台ModelArts

使用MaaS压缩模型 - AI开发平台ModelArts

使用GPTQ量化 - AI开发平台ModelArts

训练业务迁移到昇腾设备场景介绍 - AI开发平台ModelArts

使用边缘节点部署边缘服务能否使用http接口协议？ - AI开发平台ModelArts

创建图像分类自动学习项目并完成图片标注，训练按钮显示灰色，无法开始训练？ - AI开发平台ModelArts

从AI Gallery下载到桶里的数据集，再在ModelArts里创建数据集，显示样本数为0 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线