搜索_华为云

语言模型推理性能测试 - AI开发平台ModelArts

# 执行静态、动态性能评测脚本 ├── requirements.txt # 第三方依赖静态benchmark验证本章节介绍如何进行静态benchmark验证。已经上传benchmark验证脚本到推理容器中。如果在步骤三：上传代码包和权重文件中已经上传过AscendCloud-LLM-x

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务性能评测
语言模型推理性能测试 - AI开发平台ModelArts

├── requirements.txt # 第三方依赖目前性能测试已经支持投机推理能力。静态benchmark验证本章节介绍如何进行静态benchmark验证。已经上传benchmark验证脚本到推理容器中。如果在步骤四制作推理镜像步骤中已经上传过AscendCloud-LLM-x

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 推理性能测试
通过AK/SK认证的方式访问在线服务 - AI开发平台ModelArts

使用AK/SK认证时，您可以通过APIG SDK访问，也可以通过ModelArts SDK访问。使用ModelArts SDK访问参见用户AK-SK认证模式。本文档详细介绍如何通过APIG SDK访问在线服务，具体操作流程如下：获取AK/SK 获取在线服务信息发送预测请求方式一：使用Python语言发送预测请求

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的认证方式
AI开发基本概念 - AI开发平台ModelArts

与分类不同，聚类分析数据对象，而不考虑已知的类标号（一般训练数据中不提供类标号）。聚类可以产生这种标号。对象根据最大化类内的相似性、最小化类间的相似性的原则进行聚类或分组。对象的聚类是这样形成的，使得在一个聚类中的对象具有很高的相似性，而与其他聚类中的对象很不相似。父主题： AI开发基础知识

 帮助中心 > AI开发平台ModelArts > 产品介绍 > AI开发基础知识
创建Workflow数据集版本发布节点 - AI开发平台ModelArts

modelarts import workflow as wf # 通过ReleaseDatasetStep将输入的数据集对象发布新的版本，输出带有版本信息的数据集对象 # 定义数据集对象 dataset = wf.data.DatasetPlaceholder(name="input_dataset")

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

包结构说明。 AscendSpeed是用于模型并行计算的框架，其中包含了许多模型的输入处理方法。获取路径：Support-E，在此路径中查找下载ModelArts 6.3.911版本。说明：如果上述软件获取路径打开后未显示相应的软件信息，说明您没有下载权限，请联系您所在企业的华为方技术支持下载获取。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 准备工作
通过APP认证的方式访问在线服务 - AI开发平台ModelArts

默认以“app_”开头，您也可以自行修改。查看、重置或删除应用您可以单击目标应用名称操作列的按钮完成应用的查询明文、重置或删除。创建完成后自动生成“AppKey/AppSecret”以供您后续调取接口进行APP鉴权使用。图3 查询明文、重置或删除解绑服务您可以单击目标应

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的认证方式
模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

其他加速框架或ZeRO (Zero Redundancy Optimizer)优化器、NPU节点数及其他配置。具体优化工具使用说明可参考如何选择最佳性能的zero-stage和-offloads。父主题：训练脚本说明

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 训练脚本说明
将AI Gallery中的模型部署为AI应用 - AI开发平台ModelArts

线共享给其他用户使用。前提条件选择的模型必须是支持部署为AI应用的模型，否则模型详情页没有“部署 > AI应用”选项。部署AI应用登录AI Gallery。单击“模型”进入模型列表。选择需要部署为AI应用的模型，单击模型名称进入模型详情页。在模型详情页，选择“部署 >

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery中的AI应用
套餐包 - AI开发平台ModelArts
套餐包 - AI开发平台ModelArts

套餐包购买方式登录ModelArts管理控制台，在“总览”页中，单击“购买套餐包”，进入“购买套餐包”页面。可根据需要，自行购买适用规格的套餐包。适用场景 ModelArts服务支持购买套餐包，根据用户选择使用的资源不同进行收费。您可以根据业务需求选择使用不同规格的套餐包。

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费模式
执行训练任务（推荐） - AI开发平台ModelArts

/llm_train/saved_dir_for_output/llama2-13b/saved_models/。最后，请参考查看日志和性能章节查看预训练的日志和性能。步骤五删除config.yaml创建出的所有工作负载Pod 若要删除config.yaml创建出的所有工作负载Pod，需要先找到config

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练任务
指令监督微调训练任务 - AI开发平台ModelArts

3指使用0-3卡执行训练任务训练成功标志 “***** train metrics *****”关键字打印训练完成后，请参考查看日志和性能章节查看指令微调的日志和性能。 1、如训练过程中遇到“NPU out of memory”“Permission denied” 问题可参考

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.907）
模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

其他加速框架或ZeRO (Zero Redundancy Optimizer)优化器、NPU节点数及其他配置。具体优化工具使用说明可参考如何选择最佳性能的zero-stage和-offloads。父主题：训练脚本说明

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.909） > 训练脚本说明
训练作业日志中提示“No such file or directory” - AI开发平台ModelArts

器的本地路径。所以，在训练代码中直接使用OBS路径会报错。例如训练代码的OBS路径为obs://bucket-A/training/，训练代码会被自动下载至${MA_JOB_DIR}/training/。假设训练代码的OBS目录为obs://bucket-A/XXX/{trai

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
管理Workflow工作流 - AI开发平台ModelArts

管理Workflow工作流启动Workflow 登录ModelArts管理控制台，在左侧导航栏选择“开发空间>Workflow”，进入Workflow总览页面。有3种操作方式运行工作流。工作流列表页：单击操作栏的“启动”按钮，出现启动Workflow询问弹窗，单击“确定”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 管理Workflow
创建ModelArts委托 - AI开发平台ModelArts

创建ModelArts委托功能介绍创建包含OBS、SWR、IEF等依赖服务的ModelArts委托。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI POST /

帮助中心 > AI开发平台ModelArts > API参考 > 授权管理
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

构说明。 AscendFactory是用于模型并行计算的框架，其中包含了许多模型的输入处理方法。获取路径：Support-E，在此路径中查找下载ModelArts 6.3.912 版本。说明：如果上述软件获取路径打开后未显示相应的软件信息，说明您没有下载权限，请联系您所在企业的华为方技术支持下载获取。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 准备工作
导入模型提示模型或镜像大小超过限制 - AI开发平台ModelArts

导入模型提示模型或镜像大小超过限制问题现象在导入模型时，提示模型或镜像大小超过限制。原因分析如果使用的是OBS导入或者训练导入，则是基础镜像、模型文件、代码、数据文件和下载安装软件包的大小总和超过了限制。如果使用的是自定义镜像导入，则是解压后镜像和镜像下载文件的大小总和超过了限制。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
专属资源池VPC打通 - AI开发平台ModelArts

通过打通VPC，可以方便用户跨VPC使用资源，提升资源利用率。步骤一：打通VPC 通过打通VPC，可以方便用户跨VPC使用资源，提升资源利用率。登录ModelArts管理控制台，在左侧导航栏中选择“AI专属资源池 > 弹性集群Cluster”，在“网络”页签，单击网络列表中某个网络操作列的“打通VPC”。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置
Manifest管理概述 - AI开发平台ModelArts

各个使用场景，同时兼顾数据集管理的灵活性，本文档描述数据集管理的接口和描述规范——Manifest文件。 Manifest文件中定义了标注对象和标注内容的对应关系。Manifest文件中也可以只有原始文件信息，没有标注信息，如生成的未标注的数据集。 Manifest文件使用UTF

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > Manifest管理

总条数： 2222

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

语言模型推理性能测试 - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

通过AK/SK认证的方式访问在线服务 - AI开发平台ModelArts

AI开发基本概念 - AI开发平台ModelArts

创建Workflow数据集版本发布节点 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

通过APP认证的方式访问在线服务 - AI开发平台ModelArts

模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

将AI Gallery中的模型部署为AI应用 - AI开发平台ModelArts

套餐包 - AI开发平台ModelArts

执行训练任务（推荐） - AI开发平台ModelArts

指令监督微调训练任务 - AI开发平台ModelArts

模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

训练作业日志中提示“No such file or directory” - AI开发平台ModelArts

管理Workflow工作流 - AI开发平台ModelArts

创建ModelArts委托 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

导入模型提示模型或镜像大小超过限制 - AI开发平台ModelArts

专属资源池VPC打通 - AI开发平台ModelArts

Manifest管理概述 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线