搜索_华为云

NPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

run”，商用版是权限受控，仅华为工程师和渠道用户有权限下载，下载地址请见固件驱动包下载链接。 arch cat /etc/os-release 图6 查看机器操作系统版本及架构下文均以适配EulerOS 2.0（SP10）和aarch64架构的包为例来进行讲解。安装固件和驱动包。固件和驱动安装时，注意安装顺序：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置 > 配置Lite Server软件环境
在推理生产环境中部署推理服务 - AI开发平台ModelArts

Step1 准备模型文件和权重文件在OBS桶中，创建文件夹，准备ascend_vllm代码包、模型权重文件、推理启动脚本run_vllm.sh及SSL证书。此处以chatglm3-6b为例。 ascend_vllm代码包在Step9 构建推理代码已生成。模型权重文件获取地址请参见表1。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
创建训练作业 - AI开发平台ModelArts

objects 训练在子任务状态信息。 running_records Array of RunningRecord objects 训练作业运行及故障恢复记录。表58 TaskStatuses 参数参数类型描述 task String 训练作业子任务名称。 exit_code Integer

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
Prefix Caching - AI开发平台ModelArts

略边界情况，基本上可以认为其消除了历史轮次中生成对话的recompute。 Ascend vllm提供prefix caching关键特性能力，能够显著降低长system prompt和多轮对话场景首token时延，提升用户体验。其优势主要包括：更短的prefill时间：由于跨请求的重复token序列对应的KV

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
Paraformer基于DevServer适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

chown -R ma-user:ma-group ${container_work_dir} 此步骤可能需要密码或root权限。步骤五：下载代码及安装环境下载华为侧插件代码包AscendCloud-CV-6.3.911-xxx.zip文件，获取路径参见表1。 unzip AscendCloud-CV-6

帮助中心 > AI开发平台ModelArts > 最佳实践 > 内容审核模型训练推理
Lite Cluster资源配置流程 - AI开发平台ModelArts

指定版本。 5 （可选）配置镜像预热 Lite Cluster资源池支持镜像预热功能，镜像预热可实现将镜像提前在资源池节点上拉取好，在推理及大规模分布式训练时有效缩短镜像拉取时间。快速配置Lite Cluster资源案例下文提供一个快速配置的案例，配置完成后您可登录到节点查看

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
ModelArts最佳实践案例列表 - AI开发平台ModelArts

Code Toolkit工具目标检测本案例以Ascend Model Zoo为例，介绍如何通过VS Code插件及ModelArts Notebook进行云端数据调试及模型开发。 ModelArts Standard模型训练案例表4 自定义算法样例列表样例镜像对应功能场景

 帮助中心 > AI开发平台ModelArts > 最佳实践
通过APP认证的方式访问在线服务 - AI开发平台ModelArts

在HTTP请求头部消息增加一个参数“apikey”（参数值为“AppKey”），实现快速认证。 AppCode认证：通过AppCode认证通用请求。 AppCode认证就是在调用API的时候，在HTTP请求头部消息增加一个参数“X-Apig-AppCode”（参数值为“AppCo

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的认证方式
线下容器镜像构建及调试 - AI开发平台ModelArts

线下容器镜像构建及调试镜像构建导出conda环境首先拉起线下的容器镜像： # run on terminal docker run -ti ${your_image:tag} 在容器中输入如下命令，得到pytorch.tar.gz： # run on container #

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
部署服务 - AI开发平台ModelArts
部署服务 - AI开发平台ModelArts

或pool_name参数，且该参数优先级高于服务层级的cluster_id及pool_name，当config内的cluster_id与pool_name均未配置时，会使用服务层级的cluster_id及pool_name参数，均不配置时则会使用共享资源池；对于edge服务类型，

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

如果不再需要使用此模型及在线服务，建议清除相关资源，避免产生不必要的费用。在“在线服务”页面，“停止”或“删除”刚创建的在线服务。在“自定义模型”页面，“删除”刚创建的模型。在“训练作业”页面，“删除”运行结束的训练作业。进入OBS，删除本示例使用的OBS桶及文件夹，以及文件夹的文件。

帮助中心 > AI开发平台ModelArts > 快速入门
准备图像分类数据 - AI开发平台ModelArts

类项目中，至少有两种以上的分类，每种分类的样本不少于20张。为了保证模型的预测准确度，训练样本跟真实使用场景尽量相似。为保证模型的泛化能力，数据集尽量覆盖可能出现的各种场景。数据上传至OBS 在本文档中，采用通过OBS管理控制台将数据上传至OBS桶。上传OBS的文件规范：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现图像分类
托管数据集到AI Gallery - AI开发平台ModelArts

同步在模型描述部分，保存到“README.md”文件里。模型描述部分是一个可在线编辑、预览的Markdown文件，里面包含该模型的简介、能力描述、训练情况、引用等信息。编辑内容会自动保存在“README.md”文件里。更新后的“README.md”文件自动存放在数据集详情页的

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery数据集
托管模型到AI Gallery - AI开发平台ModelArts

同步在模型描述部分，保存到“README.md”文件里。模型描述部分是一个可在线编辑、预览的Markdown文件，里面包含该模型的简介、能力描述、训练情况、引用等信息。编辑内容会自动保存在“README.md”文件里。更新后的“README.md”文件自动存放在数据集详情页的

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型
查看诊断报告 - AI开发平台ModelArts

html报告总览-三大模块当前advisor的performance problem analysis中包含如下分析项。表1 性能分析能力概览分析维度分析项释义 overall overall summary 对于单卡profiling进行性能拆解，获取单步计算、下发和通信耗时。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于advisor的昇腾训练性能自助调优指导
自动学习训练作业失败 - AI开发平台ModelArts

业的要求。要求如下所示，如果数据满足要求，执行下一步检查。如果不满足要求，请根据要求进行数据调整后再重新训练。文件规范：名称由以字母数字及中划线下划线组成，以'.csv'结尾，且文件不能直接放在OBS桶的根目录下，应该存放在OBS桶的文件夹内。如：“/obs-xxx/data/input

帮助中心 > AI开发平台ModelArts > 故障排除 > 自动学习 > 模型训练
使用CodeLab免费体验Notebook - AI开发平台ModelArts

功能亮点免费算力 CodeLab内置了免费算力，包含CPU和GPU两种。您可以使用免费规格，端到端体验ModelArts Notebook能力。也可使用此免费算力，在线完成您的算法开发。即开即用无需创建Notebook实例，打开即可编码。高效分享 ModelArts在AI

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
在推理生产环境中部署推理服务 - AI开发平台ModelArts

功能）中部署推理服务。 Step1 准备模型文件和权重文件在OBS桶中，创建文件夹，准备模型权重文件、推理启动脚本run_vllm.sh及SSL证书。此处以chatglm3-6b为例。模型权重文件获取地址请参见支持的模型列表和权重文件。若需要部署量化模型，请参考推理模型量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
在推理生产环境中部署推理服务 - AI开发平台ModelArts

功能）中部署推理服务。 Step1 准备模型文件和权重文件在OBS桶中，创建文件夹，准备模型权重文件、推理启动脚本run_vllm.sh及SSL证书。此处以chatglm3-6b为例。模型权重文件获取地址请参见表1。若需要部署量化模型，请参考推理模型量化在Notebook中

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
使用ModelArts Standard一键完成商超商品识别模型部署 - AI开发平台ModelArts

“名称”：自定义一个在线服务的名称，也可以使用默认值，此处以“商超商品识别服务”为例。 “资源池”：选择“公共资源池”。 “模型来源”和“选择模型及版本”：会自动选择订阅模型。 “实例规格”：在下拉框中选择推理使用的计算资源。如果有免费资源，建议选择免费资源。其他参数可使用默认值。参

 帮助中心 > AI开发平台ModelArts > 快速入门

总条数： 368

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

NPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

创建训练作业 - AI开发平台ModelArts

Prefix Caching - AI开发平台ModelArts

Paraformer基于DevServer适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

Lite Cluster资源配置流程 - AI开发平台ModelArts

ModelArts最佳实践案例列表 - AI开发平台ModelArts

通过APP认证的方式访问在线服务 - AI开发平台ModelArts

线下容器镜像构建及调试 - AI开发平台ModelArts

部署服务 - AI开发平台ModelArts

使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

准备图像分类数据 - AI开发平台ModelArts

托管数据集到AI Gallery - AI开发平台ModelArts

托管模型到AI Gallery - AI开发平台ModelArts

查看诊断报告 - AI开发平台ModelArts

自动学习训练作业失败 - AI开发平台ModelArts

使用CodeLab免费体验Notebook - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

使用ModelArts Standard一键完成商超商品识别模型部署 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线