搜索_华为云

在MaaS体验模型服务 - AI开发平台ModelArts

任选以下方式进入“模型体验”页面。方式一在左侧导航栏中，选择“模型体验”。在“模型体验”页面，单击“请选择服务”，在“预置服务”或“我的服务”页签，选择要体验的模型服务，单击“确定”。方式二在左侧导航栏中，选择“模型推理”。在“模型推理”页面，任选以下方式进入“模型体验”页面。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

若已完成集群资源购买和开通，则需要对网络、存储、容器镜像等内容进行配置。请参考k8s Cluster环境配置详细流程。 kubectl访问集群配置本步骤需要在节点机器，对kubectl进行集群访问配置。首先进入已创建的CCE集群控制版面中。根据图2的步骤进行操作，单击kubectl配置时，会弹出图3步骤页面。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 准备工作
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

专属资源池驱动版本要求23.0.6。适配的CANN版本是cann_8.0.rc3。支持的模型列表和权重文件本方案支持vLLM的v0.5.0版本。不同vLLM版本支持的模型列表有差异，具体如表1所示。表1 支持的模型列表和权重获取地址序号模型名称是否支持fp16/bf16推理是否支持W4A16量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
管理批量服务生命周期 - AI开发平台ModelArts

进入服务详情页面。您可以单击页面右上角“启动”，启动服务。部署方式为ModelArts边缘节点和ModelArts边缘资源池的服务不支持启动。停止服务停止服务，ModelArts将停止计费。您可以通过如下方式停止服务：登录ModelArts管理控制台，在左侧菜单栏中选择“

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理批量推理作业
释放Lite Cluster资源 - AI开发平台ModelArts

如果您的资源中存在游离节点（即没有被纳管到资源池中的节点），您可在“AI专属资源池 > 弹性集群Cluster >节点”下查看此类节点的相关信息。针对游离节点，可以通过以下方式释放节点资源：如果是“包年/包月”且资源未到期的节点，您可单击操作列的“退订”，即可实现对单个节点的资源释放。支持批量退订节点。如果是

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
GPU A系列裸金属服务器RoCE带宽不足如何解决？ - AI开发平台ModelArts

原因分析 “nv_peer_mem”是一个Linux内核模块，它允许支持P2P(Peer-to-Peer)的NVIDIA GPU直接进行内存访问(DMA)。这意味着数据可以直接在多个GPU之间传输，而无需经过CPU或系统内存，这可以显著降低延迟并提高带宽。所以既然nccl-tests能正常测试，

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
用户结束kernelgateway进程后报错Server Connection Error，如何恢复？ - AI开发平台ModelArts

--KernelGatewayApp.ip=${HOST_IP} --KernelGatewayApp.port=8889 --KernelGatewayApp.api=${API_TYPE} --KernelGatewayApp.auth_token=${JPY_AUTH_TOKEN} --JupyterWebsocketPersonality

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 环境配置故障
管理AI Gallery镜像 - AI开发平台ModelArts

管理AI Gallery镜像编辑镜像介绍资产发布上架后，准确、完整的资产介绍有助于提升资产的排序位置和访问量，能更好的支撑用户使用该资产。在镜像详情页，选择“镜像介绍”页签，单击右侧“编辑介绍”。编辑镜像基础设置和镜像描述。表1 镜像介绍的参数说明参数名称说明基础设置

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery镜像
NPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

本文旨在指导如何在Snt9b裸金属服务器上，进行磁盘合并挂载、安装docker等环境配置。在配置前请注意如下事项：首次装机时需要配置存储、固件、驱动、网络访问等基础内容，这部分配置尽量稳定减少变化。裸机上的开发形式建议开发者启动独立的Docker容器作为个人开发环境。Snt9b的裸机包含8卡算

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置 > 配置Lite Server软件环境
在Notebook中通过镜像保存功能制作自定义镜像 - AI开发平台ModelArts

新的Notebook实例，完全继承保存状态下的实例软件环境配置。方式一：在Notebook实例创建页面，镜像类型选择“自定义镜像”，名称选择上述保存的镜像。图3 创建基于自定义镜像的Notebook实例方式二：在“镜像管理”页面，单击某个镜像的镜像详情，在镜像详情页，单击“

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于创建Notebook
保存Notebook实例 - AI开发平台ModelArts

新的Notebook实例，完全继承保存状态下的实例软件环境配置。方式一：在Notebook实例创建页面，镜像类型选择“自定义镜像”，名称选择上述保存的镜像。图3 创建基于自定义镜像的Notebook实例方式二：在“镜像管理”页面，单击某个镜像的镜像详情，在镜像详情页，单击“

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例
附录：大模型推理常见问题 - AI开发平台ModelArts

问题10：使用benchmark-tools访问推理客户端返回报错或警告使用benchmark-tools访问推理客户端返回报错或警告：actual output_tokens_length < expected output_len 图5 benchmark-tools访问推理客户端返回报错图6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911）
附录：大模型推理常见问题 - AI开发平台ModelArts

问题10：使用benchmark-tools访问推理客户端返回报错或警告使用benchmark-tools访问推理客户端返回报错或警告：actual output_tokens_length < expected output_len 图5 benchmark-tools访问推理客户端返回报错图6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
Cluster资源池如何进行NCCl Test？ - AI开发平台ModelArts

开始测试使用的最小数据：取值范围[1, 1024]，单位可选为“B”、“KB”、“MB”、“GB”“TB”。日志上传路径：AI诊断日志上传路径。数据增加方式：当前支持乘法方式。乘法系数：数值范围[2, 100]。超过时间：数值范围[150, 3600]。 NCCL Test节点名称列表：不可为空，且被选择的节点须为可用状态。

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Cluster
更新Notebook实例 - AI开发平台ModelArts

的密钥对。修改远程连接的可访问IP地址后，原来已经建立的链接依然有效，当链接关闭后失效；新打开建立的链接只允许当前设置的IP进行访问。此处的IP地址，请填写外网IP地址。如果用户使用的访问机器和华为云ModelArts服务的网络有隔离，则访问机器的外网地址需要在主流搜索引

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例
场景介绍及环境准备 - AI开发平台ModelArts

27的FID值。下文以Dit模型为例，介绍如何在昇腾设备上如何进行模型迁移，精度及性能调优。环境准备迁移环境准备有以下两种方式：表1 迁移环境准备方式方式说明 ModelArts Notebook 该环境为在线调试环境，主要面向演示、体验和快速原型调试场景。环境开通指导请参考Notebook环境创建。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > Dit模型PyTorch迁移与精度性能调优
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

如果已完成集群资源购买和开通，则需要对网络、存储、容器镜像等内容进行配置。请参考k8s Cluster环境配置详细流程。 kubectl访问集群配置本步骤需要在节点机器，对kubectl进行集群访问配置。首先进入已创建的CCE集群控制版面中。根据图2的步骤进行操作，单击kubectl配置时，会弹出图3步骤页面。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 准备工作
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

如果已完成集群资源购买和开通，则需要对网络、存储、容器镜像等内容进行配置。请参考k8s Cluster环境配置详细流程。 kubectl访问集群配置本步骤需要在节点机器，对kubectl进行集群访问配置。首先进入已创建的CCE集群控制版面中。根据图2的步骤进行操作，单击kubectl配置时，会弹出图3步骤页面。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） > 准备工作
Function Calling介绍 - AI开发平台ModelArts

Calling可以调用外部工具或服务，例如实时数据检索、文件处理、数据库查询等，从而扩展其能力。实时数据访问由于大模型通常基于静态数据集训练，不具备实时信息。Function Calling允许模型访问最新的数据，提供更准确、更及时的回答。提高准确性在需要精确计算或特定领域知识时，大模型

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 通过Function Calling扩展大语言模型交互能力
预训练任务 - AI开发平台ModelArts

WORK_DIR=/home/ma-user/ws sh scripts/llama2/llama2.sh 以上命令多台机器执行时，只有${NODE_RANK}的节点ID值不同，其他参数都保持一致；其中MASTER_ADDR、 NODE_RANK、 NODE_RANK、MODEL_TYPE 、RUN_TYPE、

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > LLama2系列模型基于Lite Server适配PyTorch NPU训练指导（6.3.904） > 预训练

总条数： 2349

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在MaaS体验模型服务 - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

管理批量服务生命周期 - AI开发平台ModelArts

释放Lite Cluster资源 - AI开发平台ModelArts

GPU A系列裸金属服务器RoCE带宽不足如何解决？ - AI开发平台ModelArts

用户结束kernelgateway进程后报错Server Connection Error，如何恢复？ - AI开发平台ModelArts

管理AI Gallery镜像 - AI开发平台ModelArts

NPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

在Notebook中通过镜像保存功能制作自定义镜像 - AI开发平台ModelArts

保存Notebook实例 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

Cluster资源池如何进行NCCl Test？ - AI开发平台ModelArts

更新Notebook实例 - AI开发平台ModelArts

场景介绍及环境准备 - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

Function Calling介绍 - AI开发平台ModelArts

预训练任务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线