搜索_华为云

在ECS中通过Dockerfile从0制作自定义镜像用于推理 - AI开发平台ModelArts

在ECS中通过Dockerfile从0制作自定义镜像用于推理针对ModelArts目前不支持的AI引擎，您可以针对该引擎构建自定义镜像，并将镜像导入ModelArts，创建为模型。本文详细介绍如何使用自定义镜像完成模型的创建，并部署成在线服务。操作流程如下：本地构建镜像：在

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

PyTorch版本：2.1.0 确保容器可以访问公网。文档更新内容 6.3.911版本相对于6.3.910版本新增如下内容：文档中新增在数据预处理时，支持LLama-Factory格式的模板：支持Alpaca格式的数据，DATA_TYPE 环境变量需设置为 AlpacaStyleInstructionHandler

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.911）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本案例仅支持在专属资源池上运行，确保专属资源池可以访问公网。文档更新内容 6.3.911版本相对于6.3.910版本新增如下内容：文档中新增在数据预处理时，支持LLama-Factory格式的模板：支持Alpaca格式的数据，DATA_TYPE 环境变量需设置为 AlpacaStyleInstructionHandler

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.911）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本案例仅支持在专属资源池上运行，确保专属资源池可以访问公网。文档更新内容 6.3.911版本相对于6.3.910版本新增如下内容：文档中新增在数据预处理时，支持LLama-Factory格式的模板：支持Alpaca格式的数据，DATA_TYPE 环境变量需设置为 AlpacaStyleInstructionHandler

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.911）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

rc3，驱动版本是23.0.6。确保集群可以访问公网。文档更新内容 6.3.911版本相对于6.3.910版本新增如下内容：文档中新增在数据预处理时，支持LLama-Factory格式的模板：支持Alpaca格式的数据，DATA_TYPE 环境变量需设置为 AlpacaStyleInstructionHandler

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.911）
离线训练安装包准备说明 - AI开发平台ModelArts

scripts/install.sh 文件中，找到需要git clone的文件，如下列所示。运行git clone命令，并git checkout切换到指定的版本。注意：针对Megatron-LM下载完成后，需要将megatron文件夹复制至ModelLink中。 git clone https://gitee

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.910） > 训练脚本说明参考
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

准备镜像准备大模型推理适用的容器镜像，包括获取镜像地址，了解镜像中包含的各类固件版本，配置Standard物理机环境操作。镜像版本本教程中用到基础镜像地址和配套版本关系如下表所示，请提前了解。表1 基础容器镜像地址镜像用途镜像地址配套版本基础镜像 swr.cn-southwest-2

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906） > 准备工作
在Lite Cluster资源池上使用ranktable路由规划完成Pytorch NPU分布式训练 - AI开发平台ModelArts

distributed.launch/run命令启动，不能使用mp.spawn命令启动，否则无法实现ranktable路由加速。在使用Pytorch训练时，需要将“RANK_AFTER_ACC”环境变量赋值给“NODE_RANK”，使得ranktable路由规划生效。训练启动脚本（xxxx_train

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
MiniCPM-V2.6基于DevServer适配PyTorch NPU训练指导（6.3.909） - AI开发平台ModelArts

er资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
Yaml配置文件参数配置说明 - AI开发平台ModelArts

文本处理时的最大长度，此处为4096，用户可根据自己要求适配。 packing true 可选项。当选用静态数据长度时，可将不足于文本处理时的最大长度数据弥补到文本处理时的最大长度;当选用动态数据长度则去掉此参数。 deepspeed examples/deepspeed/ds_z3_config.json

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 训练脚本说明
推理性能测试 - AI开发平台ModelArts

--tokenizer：tokenizer路径，可以是huggingface的权重路径 --request-rate：请求频率，支持多个，如 0.1 1 2。实际测试时，会根据request-rate为均值的指数分布来发送请求以模拟真实业务场景。 --num-prompts：某个频率下请求数，支持多个，如 10

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.905）
分布式训练功能介绍 - AI开发平台ModelArts

总览页面打开的CodeLab不支持此项功能，但是如果用户在AI Hub中打开了可用的案例，会自动跳转到CodeLab中，此时是可以使用这项功能的。如果切换了Notebook的规格，那么只能在Notebook进行单机调测，不能进行分布式调测，也不能提交远程训练作业。当前仅支持PyTorch和MindSpore

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
查询Notebook支持的有效规格列表 - AI开发平台ModelArts

NotebookFlavor objects 分页数据。 flavors Array of NotebookFlavor objects 支持切换的规格列表。 pages Integer 总的页数。 size Integer 每一页的数量。 total Long 总的记录数量。表4

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
MaaS大模型即服务平台功能介绍 - AI开发平台ModelArts

配置方案，有效避免了资源闲置与浪费，降低了进入AI领域的门槛。架构强调高可用性，多数据中心部署确保数据与任务备份，即使遭遇故障，也能无缝切换至备用系统，维持模型训练不中断，保护长期项目免受时间与资源损耗，确保进展与收益。大模型应用开发，帮助开发者快速构建智能Agents 在企

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍
使用Msprobe工具分析偏差 - AI开发平台ModelArts

ch.randint()函数在device侧随机初始化（下图第214行），由于device侧随机性无法通过seed等自动化方式固定，先通过切换CPU侧计算初始化之后再切回device侧。在train.py中做如下图第215行代码修改。重新训练Dump比对分析后续计算是否存在偏差。比对之后发现：Tensor

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > Dit模型Pytorch迁移与精度性能调优 > 精度对齐
费用账单 - AI开发平台ModelArts
费用账单 - AI开发平台ModelArts

例中，2023/07/10 16:47:08 ~ 2023/07/10 18:17:08时段总计使用量为1.5小时。使用量单位小时官网价官网价=使用量*单价本例中，使用量为1.5小时，单价可在ModelArts价格详情中查询，以3.5元/小时为例，那么官网价=3.5 元/小时

 帮助中心 > AI开发平台ModelArts > 计费说明
获取智能任务的信息 - AI开发平台ModelArts

Boolean 是否通过图片色彩来聚类。 inf_cluster_id String 专属集群ID，默认为空，不使用专属集群；使用专属集群部署服务时需确保集群状态正常；配置此参数后，则使用集群的网络配置，vpc_id参数不生效。 inf_config_list Array of InfConfig

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

准备镜像准备大模型推理适用的容器镜像，包括获取镜像地址，了解镜像中包含的各类固件版本，配置Standard物理机环境操作。镜像版本本教程中用到基础镜像地址和配套版本关系如下表所示，请提前了解。表1 基础容器镜像地址镜像用途镜像地址配套版本基础镜像 swr.cn-southwest-2

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905） > 准备工作
基于ModelArts performance advisor插件的昇腾PyTorch性能调优步骤 - AI开发平台ModelArts

多机场景如果没有挂载共享存储如SFS Turbo，需要将多机上的profiling复制至同一个目录下才能进行性能分析，这个操作相对较为繁琐且耗时。使用ModelArts时推荐挂载共享网盘如sfs turbo，既能加快训练数据的读取速度又能用于存放性能profiling数据。如果没有共享网盘，profiling

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于advisor的昇腾训练性能自助调优指导
实时同步用户所有DevServer实例状态 - AI开发平台ModelArts

停止失败： REBOOTING: 重启中： REBOOT_FAILED: 重启失败； CHANGINGOS: 切换操作系统中： CHANGINGOS_FAILED: 切换操作系统失败： REINSTALLINGOS: 重装操作系统中： REINSTALLINGOS_FAILED。重装操作系统失败。

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理

总条数： 831

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在ECS中通过Dockerfile从0制作自定义镜像用于推理 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

离线训练安装包准备说明 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

在Lite Cluster资源池上使用ranktable路由规划完成Pytorch NPU分布式训练 - AI开发平台ModelArts

MiniCPM-V2.6基于DevServer适配PyTorch NPU训练指导（6.3.909） - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

分布式训练功能介绍 - AI开发平台ModelArts

查询Notebook支持的有效规格列表 - AI开发平台ModelArts

MaaS大模型即服务平台功能介绍 - AI开发平台ModelArts

使用Msprobe工具分析偏差 - AI开发平台ModelArts

费用账单 - AI开发平台ModelArts

获取智能任务的信息 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

基于ModelArts performance advisor插件的昇腾PyTorch性能调优步骤 - AI开发平台ModelArts

实时同步用户所有DevServer实例状态 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线