搜索_华为云

附录：基于vLLM不同模型推理支持最小卡数和最大序列说明 - AI开发平台ModelArts

卡数和对应卡数下的max-model-len长度说明，如下面的表格所示。以下值是在gpu-memory-utilization为0.9时测试得出，为服务部署所需的最小昇腾卡数及该卡数下推荐的最大max-model-len长度，不代表最佳性能。以llama2-13b为例，NPU

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.911）
附录：基于vLLM不同模型推理支持最小卡数和最大序列说明 - AI开发平台ModelArts

卡数和对应卡数下的max-model-len长度说明，如下面的表格所示。以下值是在gpu-memory-utilization为0.9时测试得出，为服务部署所需的最小昇腾卡数及该卡数下推荐的最大max-model-len长度，不代表最佳性能。以llama2-13b为例，NPU

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
ModelArts最佳实践案例列表 - AI开发平台ModelArts

训练后的模型可用于推理部署，搭建大模型问答助手。主流开源大模型基于DevServer适配PyTorch NPU推理指导推理部署、推理性能测试、推理精度测试、推理模型量化介绍主流的开源大模型Llama系列、Qwen系列、Yi系列、Baichuan系列、ChatGLM系列等基于ModelArts

帮助中心 > AI开发平台ModelArts > 最佳实践
使用AI Gallery的订阅算法实现花卉识别 - AI开发平台ModelArts

6-gpu"。修改完成后，重新执行导入模型和部署为在线服务的操作。参数设置完成后，单击“下一步”，确认规格参数，单击“提交”，完成在线服务的部署。您可以进入“模型部署 > 在线服务”页面，等待服务部署完成，当服务状态变为“运行中”时，表示服务部署成功。预计时长2分钟左右。在线服务部署完成后，您可以单

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
GPU A系列裸金属服务器RoCE带宽不足如何解决？ - AI开发平台ModelArts

问题现象 GP Ant8支持RoCE网卡， Ubuntu20.04场景，在进行nccl-tests时，总线带宽理论峰值可达90GB/s，但实际测试下来的结果只有35GB/s。原因分析 “nv_peer_mem”是一个Linux内核模块，它允许支持P2P(Peer-to-Peer)的NVIDIA

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
日志提示“root: XXX valid number is 0” - AI开发平台ModelArts

XXX valid number is 0” 问题现象日志提示“root: XXX valid number is 0”，表示训练集/验证集/测试集的有效样本量为0，例如： INFO: root: Train valid number is 0. INFO: root: Eval valid

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 预置算法运行故障
在推理生产环境中部署推理服务 - AI开发平台ModelArts

若权重文件大于60G，创建AI应用会报错，提示模型大于60G，请提工单扩容。 Step3 部署在线服务将Step2 部署模型中创建的AI应用部署为一个在线服务，用于推理调用。在ModelArts控制台，单击“模型部署 > 在线服务 > 部署”，开始部署在线服务。设置部署服务名称，选择Step2 部署模型中创建的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
在推理生产环境中部署推理服务 - AI开发平台ModelArts

若权重文件大于60G，创建AI应用会报错，提示模型大于60G，请提工单扩容。 Step3 部署在线服务将Step2 部署模型中创建的AI应用部署为一个在线服务，用于推理调用。在ModelArts控制台，单击“模型部署 > 在线服务 > 部署”，开始部署在线服务。设置部署服务名称，选择Step2 部署模型中创建的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
ModelArts支持将模型部署为哪些类型的服务？ - AI开发平台ModelArts

ModelArts支持将模型部署为哪些类型的服务？支持在线服务、批量服务和边缘服务。父主题：功能咨询

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 功能咨询
配置Lite Server存储 - AI开发平台ModelArts

了多种场景下的存储解决方案，主要区别如下表所示。若需要对本地盘进行配置，请参考物理机环境配置。表1 表1 SFS、OBS、EVS服务对比对比维度弹性文件服务SFS 对象存储服务OBS 云硬盘EVS 概念提供按需扩展的高性能文件存储，可为云上多个云服务器提供共享访问。弹性文

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置
使用ModelArts Standard自动学习实现垃圾分类 - AI开发平台ModelArts

步骤六：预测分析运行完成的工作流会自动部署相应的在线服务，您只需要在相应的服务详情页面进行预测即可。在服务部署节点单击“实例详情”或者在ModelArts管理控制台，选择“模型部署 > 在线服务”，单击生成的在线服务名称，即可进入在线服务详情页。在服务详情页，单击选择“预测”页签。

帮助中心 > AI开发平台ModelArts > 快速入门
使用ModelArts Standard自动学习实现垃圾分类 - AI开发平台ModelArts

步骤六：预测分析运行完成的工作流会自动部署相应的在线服务，您只需要在相应的服务详情页面进行预测即可。在服务部署节点单击“实例详情”或者在ModelArts管理控制台，选择“模型部署 > 在线服务”，单击生成的在线服务名称，即可进入在线服务详情页。在服务详情页，单击选择“预测”页签。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard自动学习
部署服务 - AI开发平台ModelArts
部署服务 - AI开发平台ModelArts

infer_type 是 String 推理方式，取值为real-time/batch/edge。 real-time代表在线服务，将模型部署为一个Web Service，并且提供在线的测试UI与监控能力，服务一直保持运行。 batch为批量服务，批量服务可对批量数据进行推理，完成数据处理后自动停止。

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
Msprobe API预检 - AI开发平台ModelArts

sult_{timestamp}.csv属于API级，标明每个API是否通过测试。建议用户先查看accuracy_checking_result_{timestamp}.csv文件，对于其中没有通过测试的或者特定感兴趣的API，根据其API name字段在 accuracy_ch

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优 > Msprobe工具使用指导
advisor分析报告html文件详解 - AI开发平台ModelArts

算子级的对比。如下图所示，当分析时显式指定了标杆集群profiling数据，advisor识别到两次训练任务中0号卡的step12存在计算性能差异，则会对目标集群的0号卡step12与标杆集群的0号卡step12进行kernel（npu侧计算的算子）性能对比。基于该对比数据，可

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于advisor的昇腾训练性能自助调优指导
准备图像分类数据 - AI开发平台ModelArts

每一类数据尽量多，尽量均衡。期望获得良好效果，图像分类项目中，至少有两种以上的分类，每种分类的样本不少于20张。为了保证模型的预测准确度，训练样本跟真实使用场景尽量相似。为保证模型的泛化能力，数据集尽量覆盖可能出现的各种场景。数据上传至OBS 在本文档中，采用通过OBS管理控制台将数据上传至OBS桶。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现图像分类
使用ModelArts Standard一键完成商超商品识别模型部署 - AI开发平台ModelArts

示模型可以使用。步骤三：使用订阅模型部署在线服务模型订阅成功后，可将此模型部署为在线服务在展开的版本列表中，单击“部署 > 在线服务”跳转至部署页面。图2 部署模型在部署页面，参考如下说明填写关键参数。 “名称”：自定义一个在线服务的名称，也可以使用默认值，此处以“商超商品识别服务”为例。

帮助中心 > AI开发平台ModelArts > 快速入门
服务管理概述 - AI开发平台ModelArts

服务管理概述服务管理，包括将已创建成功的模型部署为在线服务或本地服务。可以实现在线预测、本地预测、服务详情查询、查看服务日志等功能。这里的在线服务包括“predictor”和“transformer”两类，都包括下文描述的功能，本章节以“predictor”服务为例进行说明。

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
停止计费 - AI开发平台ModelArts
停止计费 - AI开发平台ModelArts

flow、开发环境、模型训练、在线服务、专属资源池涉及到需要停止的计费项如下：自动学习：停止因运行自动学习作业而创建的训练作业和在线服务。删除存储到OBS中的数据及OBS桶。 Workflow：停止因运行Workflow作业而创建的训练作业和在线服务。删除存储到OBS中的数据及OBS桶。

帮助中心 > AI开发平台ModelArts > 计费说明
批量更新团队标注样本的标签 - AI开发平台ModelArts

3：预测结果和训练集同类别数据差异较大。 4：连续多张相似图片的预测结果不一致。 5：图像的分辨率与训练数据集的特征分布存在较大偏移。 6：图像的高宽比与训练数据集的特征分布存在较大偏移。 7：图像的亮度与训练数据集的特征分布存在较大偏移。 8：图像的饱和度与训练数据集的特征分布存在较大偏移。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）

总条数： 603

上一页
1
...
9
10
11
...
31
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

附录：基于vLLM不同模型推理支持最小卡数和最大序列说明 - AI开发平台ModelArts

附录：基于vLLM不同模型推理支持最小卡数和最大序列说明 - AI开发平台ModelArts

ModelArts最佳实践案例列表 - AI开发平台ModelArts

使用AI Gallery的订阅算法实现花卉识别 - AI开发平台ModelArts

GPU A系列裸金属服务器RoCE带宽不足如何解决？ - AI开发平台ModelArts

日志提示“root: XXX valid number is 0” - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

ModelArts支持将模型部署为哪些类型的服务？ - AI开发平台ModelArts

配置Lite Server存储 - AI开发平台ModelArts

使用ModelArts Standard自动学习实现垃圾分类 - AI开发平台ModelArts

使用ModelArts Standard自动学习实现垃圾分类 - AI开发平台ModelArts

部署服务 - AI开发平台ModelArts

Msprobe API预检 - AI开发平台ModelArts

advisor分析报告html文件详解 - AI开发平台ModelArts

准备图像分类数据 - AI开发平台ModelArts

使用ModelArts Standard一键完成商超商品识别模型部署 - AI开发平台ModelArts

服务管理概述 - AI开发平台ModelArts

停止计费 - AI开发平台ModelArts

批量更新团队标注样本的标签 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线