搜索_华为云

在ModelArts控制台查看监控指标 - AI开发平台ModelArts

节点的CPU、GPU、NPU资源使用情况。具体请参见训练资源监控章节。在线服务：用户将模型部署为在线服务后，可以通过监控功能查看CPU、内存、GPU等资源使用统计信息和模型调用次数统计，具体参见查看服务详情章节。父主题： ModelArts Standard资源监控

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控
在模型广场查看模型 - AI开发平台ModelArts

在模型广场查看模型在模型广场页面，ModelArts Studio大模型即服务平台提供了丰富的开源大模型，在模型详情页可以查看模型的详细介绍，根据这些信息选择合适的模型进行训练、推理，接入到企业解决方案中。访问模型广场登录ModelArts Studio控制台，在顶部导航栏选择目标区域。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
推理场景介绍 - AI开发平台ModelArts

Cluster上使用昇腾计算资源开展常见开源大模型Llama、Qwen、ChatGLM、Yi、Baichuan等推理部署的详细过程。本方案利用适配昇腾平台的大模型推理服务框架vLLM和华为自研昇腾Snt9B硬件，为用户提供推理部署方案，帮助用户使能大模型业务。约束限制本方案目前仅适用于部分企业客户。本文档适配昇腾云ModelArts

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）
推理场景介绍 - AI开发平台ModelArts

Cluster上使用昇腾计算资源开展常见开源大模型Llama、Qwen、ChatGLM、Yi、Baichuan等推理部署的详细过程。本方案利用适配昇腾平台的大模型推理服务框架vLLM和华为自研昇腾Snt9B硬件，为用户提供推理部署方案，帮助用户使能大模型业务。约束限制本方案目前仅适用于部分企业客户。本文档适配昇腾云ModelArts

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
Lite Cluster高危操作一览表 - AI开发平台ModelArts

Lite Cluster高危操作一览表当您在CCE、ECS或BMS服务控制台直接操作ModelArts Lite Lite Cluster资源时，可能会导致资源池部分功能异常。下表可帮助您定位异常出现的原因，风险操作包括但不限于以下内容。高危操作风险等级说明：高：对于可能直

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster使用前必读
费用账单 - AI开发平台ModelArts
费用账单 - AI开发平台ModelArts

署 > 在线服务”，在“在线服务”列表页，复制实例名称。单击服务名称进入服务详情页，在“配置更新记录”页签中，单击模型名称，进入模型详情页。在“基本信息”中，复制模型的ID。图3 获取模型ID 根据查询到的资源名称拼接账单中上报的资源名称。拼接规则：在线服务名称-模型的ID

帮助中心 > AI开发平台ModelArts > 计费说明
欠费后，ModelArts的资源是否会被删除？ - AI开发平台ModelArts

欠费后，ModelArts的资源是否会被删除？欠费后，ModelArts的资源不会被立即删除。欠费后，您可以在“费用中心”查看欠费详情。为了防止相关资源不会被停止服务或者逾期释放，您需要及时进行还款或充值。查询欠费步骤登录管理控制台。单击页面右上角的“费用”进入“费用中心”页面。在“总览”页面可以查看到当前的欠费金额。

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费FAQ
成本管理 - AI开发平台ModelArts
成本管理 - AI开发平台ModelArts

ModelArts提供AI工具链、AI算力，成本由AI算力的资源成本和运维成本构成。成本分配 ModelArts支持企业项目管理，可以由企业项目服务来管理同一账号下不同项目的成本。成本分析通过华为云费用账单来分析账号下的成本支出情况。成本优化长期使用的资源，建议客户使用更优惠的

 帮助中心 > AI开发平台ModelArts > 计费说明
在ModelArts上如何提升训练效率并减少与OBS的交互？ - AI开发平台ModelArts

在ModelArts上如何提升训练效率并减少与OBS的交互？场景描述在使用ModelArts进行自定义深度学习训练时，训练数据通常存储在对象存储服务（OBS）中，且训练数据较大时（如200GB以上），每次都需要使用GPU资源池进行训练，且训练效率低。希望提升训练效率，同时减少与对象存

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
在ModelArts的Notebook中，访问外网速度不稳定怎么办？ - AI开发平台ModelArts

在ModelArts的Notebook中，访问外网速度不稳定怎么办？为了方便AI开发者在使用Notebook时访问外部资源，ModelArts提供了一个免费的共享网络代理服务。借助这个代理，开发者可以更加便捷地下载所需的各类资源，助力开发工作的顺利进行。由于该网络代理免费且共享，其性能会受到实时访问量大小的显

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
Standard模型部署 - AI开发平台ModelArts

生产厂商提供了一整套安全可靠的一站式部署方式。图1 部署模型的流程在线推理服务，可以实现高并发，低延时，弹性伸缩，并且支持多模型灰度发布、A/B测试。支持各种部署场景，既能部署为云端的在线推理服务和批量推理任务，也能部署到端，边等各种设备。一键部署，可以直接推送部署到边缘设备中，选择智能边缘节点，推送模型。

帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
Chunked Prefill - AI开发平台ModelArts

甚至更大。执行推理参考 Ascend vllm使用Chunked Prefill特性需参考表1，其它参数请参考启动推理服务。启动推理服务请参考启动推理服务。父主题：推理关键特性使用

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
套餐包 - AI开发平台ModelArts
套餐包 - AI开发平台ModelArts

登录ModelArts管理控制台，在“总览”页中，单击“购买套餐包”，进入“购买套餐包”页面。可根据需要，自行购买适用规格的套餐包。适用场景 ModelArts服务支持购买套餐包，根据用户选择使用的资源不同进行收费。您可以根据业务需求选择使用不同规格的套餐包。 ModelArts提供了AI全流程开发的

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费模式
ModelArts线上训练得到的模型是否支持离线部署在本地？ - AI开发平台ModelArts

获取训练输出位置单击“输出路径”，跳转至OBS对象路径，下载训练得到的模型。在本地环境进行离线部署。具体请参见模型调试章节在本地导入模型，参见服务调试章节，将模型离线部署在本地并使用。父主题： Standard推理部署

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
产品优势 - AI开发平台ModelArts
产品优势 - AI开发平台ModelArts

产品优势 ModelArts服务具有以下产品优势。稳定安全的算力底座，极快至简的模型训练支持万节点计算集群管理。大规模分布式训练能力，加速大模型研发。提供高性价比国产算力。多年软硬件经验沉淀，AI场景极致优化。加速套件，训练、推理、数据访问多维度加速。一站式端到端生产工具链，一致性开发体验

 帮助中心 > AI开发平台ModelArts > 产品介绍
AI Gallery功能介绍 - AI开发平台ModelArts

AI Gallery功能介绍面向开发者提供了AI Gallery大模型开源社区，通过大模型为用户提供服务，普及大模型行业。AI Gallery提供了大量基于昇腾云底座适配的三方开源大模型，同步提供了可以快速体验模型的能力、极致的开发体验，助力开发者快速了解并学习大模型。构建零

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍
Chunked Prefill - AI开发平台ModelArts

甚至更大。执行推理参考 Ascend vllm使用Chunked Prefill特性需参考表1，其它参数请参考启动推理服务。启动推理服务请参考启动推理服务。父主题：推理关键特性使用

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.5.901） > 推理关键特性使用
从MRS导入数据到ModelArts数据集 - AI开发平台ModelArts

从MRS导入数据到ModelArts数据集 ModelArts支持从MRS服务中导入存储在HDFS上的csv格式的数据，首先需要选择已有的MRS集群，并从HDFS文件列表选择文件名称或所在目录，导入文件的列数需与数据集schema一致。MRS的详细功能说明，请参考MRS用户指南。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导入数据到ModelArts数据集
PD分离部署手动配比调优（推荐） - AI开发平台ModelArts

rate增大的TPOT变化走势图，由图可知混推服务（红色线条）在1.72 req/s时达到SLO要求上限（50ms），PD分离服务在2.59 res/s时达到SLO要求上限。根据木桶短板理论可得出：在满足SLO的情况下，PD分离服务较PD混推服务QPS提升1.5x。左下图为端到端性能

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.5.901） > 推理关键特性使用 > 分离部署
multi-step - AI开发平台ModelArts
multi-step - AI开发平台ModelArts

暂不支持Multi-Lora和投机推理场景。 multi-step参数设置启动推理服务时，使用multi-step调度需要配置的参数如下表所示。表1 开启multi-step调度参数配置服务启动方式配置项取值类型配置说明 offline num_scheduler_steps

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用

总条数： 2342

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在ModelArts控制台查看监控指标 - AI开发平台ModelArts

在模型广场查看模型 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

Lite Cluster高危操作一览表 - AI开发平台ModelArts

费用账单 - AI开发平台ModelArts

欠费后，ModelArts的资源是否会被删除？ - AI开发平台ModelArts

成本管理 - AI开发平台ModelArts

在ModelArts上如何提升训练效率并减少与OBS的交互？ - AI开发平台ModelArts

在ModelArts的Notebook中，访问外网速度不稳定怎么办？ - AI开发平台ModelArts

Standard模型部署 - AI开发平台ModelArts

Chunked Prefill - AI开发平台ModelArts

套餐包 - AI开发平台ModelArts

ModelArts线上训练得到的模型是否支持离线部署在本地？ - AI开发平台ModelArts

产品优势 - AI开发平台ModelArts

AI Gallery功能介绍 - AI开发平台ModelArts

Chunked Prefill - AI开发平台ModelArts

从MRS导入数据到ModelArts数据集 - AI开发平台ModelArts

PD分离部署手动配比调优（推荐） - AI开发平台ModelArts

multi-step - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线