搜索_华为云

使用自定义引擎在ModelArts Standard创建模型 - AI开发平台ModelArts

-p 8080:8080 -v model:/home/mind/model custom_engine:v1 该指令无法完全模拟线上，主要是由于-v挂载进去的目录是root权限。在线上，模型文件从OBS下载到/home/mind/model目录之后，文件owner将统一修改为ma-user。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
ModelArts中常用概念 - AI开发平台ModelArts

在线推理在线推理是对每一个推理请求同步给出推理结果的在线服务（Web Service）。批量推理批量推理是对批量数据进行推理的批量作业。昇腾芯片昇腾芯片又叫Ascend芯片，是华为自主研发的高计算力低功耗的AI芯片。资源池 ModelArts提供的大规模计算集群，可

 帮助中心 > AI开发平台ModelArts > 产品介绍 > AI开发基础知识
数据管理权限 - AI开发平台ModelArts

{dataset_id}/data-annotations/stats modelarts:dataset:get - √ √ 查询数据集监控数据 GET /v2/{project_id}/datasets/{dataset_id}/metrics modelarts:dataset:get

帮助中心 > AI开发平台ModelArts > API参考 > 权限策略和授权项
ascendfactory-cli方式启动（推荐） - AI开发平台ModelArts

5-7b-sft-4096-lora-313T-20241028_164746-npu_info-0.txt，打印训练过程中AICORE利用率本章节主要介绍训练性能训练任务流程，如需执行训练精度任务可参考训练精度测试 PPO强化训练时必须关闭共享内存，启动任务命令需设置PYTORCH_NP

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 执行训练任务
ascendfactory-cli方式启动（推荐） - AI开发平台ModelArts

5-7b-sft-4096-lora-313T-20241028_164746-npu_info-0.txt，打印训练过程中AICORE利用率本章节主要介绍训练性能训练任务流程，如需执行训练精度任务可参考训练精度测试 PPO强化训练时必须关闭共享内存，启动任务命令需设置PYTORCH_NP

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.5.901） > 执行训练任务
自定义引擎创建模型规范 - AI开发平台ModelArts

-p 8080:8080 -v model:/home/mind/model custom_engine:v1 该指令无法完全模拟线上，主要是由于-v挂载进去的目录是root权限。在线上，模型文件从OBS下载到/home/mind/model目录之后，文件owner将统一修改为ma-user。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
multi-lora - AI开发平台ModelArts
multi-lora - AI开发平台ModelArts

LoRA（Low-Rank Adaptation）是一种适用于大模型的轻量化微调技术方法。原理是通过在模型层中引入低秩矩阵，将大模型的权重降维处理，来实现高效的模型适配。相比于传统的微调方法，LoRA不仅能大幅减少所需的训练参数，还降低了显存和计算成本，加快了模型微调速度。对于VL

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
multi-lora - AI开发平台ModelArts
multi-lora - AI开发平台ModelArts

LoRA（Low-Rank Adaptation）是一种适用于大模型的轻量化微调技术方法。原理是通过在模型层中引入低秩矩阵，将大模型的权重降维处理，来实现高效的模型适配。相比于传统的微调方法，LoRA不仅能大幅减少所需的训练参数，还降低了显存和计算成本，加快了模型微调速度。对于VL

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.5.901） > 推理关键特性使用
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

] LLama-Factory ShareGPT 指令微调数据：ShareGPT 格式来源于通过记录 ChatGPT 与用户对话的数据集，主要用于对话系统的训练。它更侧重于多轮对话数据的收集和组织，模拟用户与 AI 之间的交互。数据集包含有以下字段： conversations：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.5.901） > 准备工作
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

] LLama-Factory ShareGPT 指令微调数据：ShareGPT 格式来源于通过记录 ChatGPT 与用户对话的数据集，主要用于对话系统的训练。它更侧重于多轮对话数据的收集和组织，模拟用户与 AI 之间的交互。数据集包含有以下字段： conversations：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
infiniband驱动的安装 - AI开发平台ModelArts

可能部分区域的网卡较新，会出现更高版本的infiniband驱动版本，如果您遇到了infiniband驱动安装后，仍然无法使能infiniband网卡的问题，可以咨询相关运维人员以确认宿主机的实际infiniband驱动版本。图1 下载驱动参考如下Dockerfile中，以在容器镜像中安装infiniband驱动。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > FAQ
使用AI Gallery SDK构建自定义模型 - AI开发平台ModelArts

“PretrainedConfig”之间的交互。 “PretrainedConfig”：预训练模型的配置基类提供模型配置的通用属性和两个主要方法，用于序列化和反序列化配置文件。 PretrainedConfig.from_pretrained(dir) # 从目录中加载序列化对

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型 > 构建模型
测试用户权限 - AI开发平台ModelArts

在左上角的服务列表中，选择ModelArts服务，进入ModelArts管理控制台。在ModelArts管理控制台，可正常创建Notebook、训练作业、注册镜像。验证SFS权限。在左上角的服务列表中，选择SFS服务，进入SFS管理控制台。在SFS管理控制台，在SFS Turbo中单

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置 > 权限配置
在模型广场查看模型 - AI开发平台ModelArts

Studio控制台，在顶部导航栏选择目标区域。在左侧导航栏，单击“模型广场”。在“模型广场”页面的“模型筛选”区域，按需选择模型系列、模型类型和支持作业，或者直接输入模型名称进行搜索。在“模型广场”页面的目标模型区域，单击“模型详情”。在“模型详情”页面可以查看模型的介绍、基本信息和版本信息。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
修改工作空间 - AI开发平台ModelArts

n的值）。表3 请求Body参数参数是否必选参数类型描述 grants 否 Array of grants objects 训练作业使用的数据集。不可与data_url或dataset_id/dataset_version_id同时使用。 auth_type 否 String

帮助中心 > AI开发平台ModelArts > API参考 > 工作空间管理
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

} ] LLama-Factory ShareGPT指令微调数据：ShareGPT 格式来源于通过记录 ChatGPT 与用户对话的数据集，主要用于对话系统的训练。它更侧重于多轮对话数据的收集和组织，模拟用户与 AI 之间的交互。数据集包含有以下字段： conversations：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
资源购买 - AI开发平台ModelArts
资源购买 - AI开发平台ModelArts

购买时需注意，ECS需要和SFS买到同一个VPC才能挂载SFS存储。购买ModelArts专属资源池提供独享的计算资源，可用于Notebook、训练作业、部署模型。专属资源池不与其他用户共享，更加高效。在使用专属资源池之前，您需要先创建一个专属资源池，操作指导请参考创建专属资源池。创建一

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练
部署服务 - AI开发平台ModelArts
部署服务 - AI开发平台ModelArts

pnt004(需申请)/modelarts.vm.ai1.snt3(需申请)/custom(仅支持在部署到专属资源池时使用)，需申请的规格请提交工单，由ModelArts运维工程师添加权限。若配置为custom，需同时指定custom_spec参数。 weight 否 Integer real-time类型必选

 帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

} ] LLama-Factory ShareGPT指令微调数据：ShareGPT 格式来源于通过记录 ChatGPT 与用户对话的数据集，主要用于对话系统的训练。它更侧重于多轮对话数据的收集和组织，模拟用户与 AI 之间的交互。数据集包含有以下字段： conversations：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.5.901） > 准备工作
Lite Server资源开通 - AI开发平台ModelArts

服务器。弹性云服务器是一种可随时自助获取、可弹性伸缩的云服务器，可帮助您打造可靠、安全、灵活、高效的应用环境，确保服务持久稳定运行，提升运维效率。计费模式选择“包年/包月”。包年/包月是预付费模式，按订单的购买周期计费，适用于可预估资源使用周期的场景，价格比按需计费模式更优惠。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server）

总条数： 939

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用自定义引擎在ModelArts Standard创建模型 - AI开发平台ModelArts

ModelArts中常用概念 - AI开发平台ModelArts

数据管理权限 - AI开发平台ModelArts

ascendfactory-cli方式启动（推荐） - AI开发平台ModelArts

ascendfactory-cli方式启动（推荐） - AI开发平台ModelArts

自定义引擎创建模型规范 - AI开发平台ModelArts

multi-lora - AI开发平台ModelArts

multi-lora - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

infiniband驱动的安装 - AI开发平台ModelArts

使用AI Gallery SDK构建自定义模型 - AI开发平台ModelArts

测试用户权限 - AI开发平台ModelArts

在模型广场查看模型 - AI开发平台ModelArts

修改工作空间 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

资源购买 - AI开发平台ModelArts

部署服务 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

Lite Server资源开通 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线