搜索_华为云

ECS中构建新镜像 - AI开发平台ModelArts

ECS中构建新镜像通过ECS获取和上传基础镜像获取基础镜像后，可通过ECS运行Dockerfile文件，在镜像的基础上构建新镜像。 Step1 构建新ModelArts Standard训练镜像获取模型软件包，并上传到ECS的目录下（可自定义路径），获取地址参考表1。解压A

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.911） > 准备工作 > 准备镜像
使用自定义引擎在ModelArts Standard创建模型 - AI开发平台ModelArts

ockerfile指令如下： groupadd -g 100 ma-group && useradd -d /home/ma-user -m -u 1000 -g 100 -s /bin/bash ma-user 明确设置镜像的启动命令。在dockerfile文件中指定cmd，dockerfile指令示例如下：

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
ECS中构建新镜像 - AI开发平台ModelArts

ECS中构建新镜像通过ECS获取和上传基础镜像获取基础镜像后，可通过ECS运行Dockerfile文件，在镜像的基础上构建新镜像。 Step1 构建新ModelArts Standard训练镜像获取模型软件包，并上传到ECS的目录下（可自定义路径），获取地址参考表1。解压A

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 准备工作 > 准备镜像
ModelArts如何通过标签实现资源分组管理 - AI开发平台ModelArts

用户也可以在ModelArts任务中添加标签时，创建新的标签，直接输入标签键和标签值即可。此处创建的标签仅当前的项目Project可见。不同的项目中查看不到。 Step3 在TMS中根据资源类型查询ModelArts资源使用情况登录TMS控制台，在资源标签页面根据资源类型和资源标签查询指定区域的资源任务。区域：

帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题
使用TMS标签实现资源分组管理 - AI开发平台ModelArts

用户也可以在ModelArts任务中添加标签时，创建新的标签，直接输入标签键和标签值即可。此处创建的标签仅当前的项目Project可见。不同的项目中查看不到。 Step3 在TMS中根据资源类型查询ModelArts资源使用情况登录TMS控制台，在资源标签页面根据资源类型和资源标签查询指定区域的资源任务。区域：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
部署推理服务 - AI开发平台ModelArts

"software|firmware" #查看驱动和固件版本如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载。请先正常安装固件和驱动，或释放被挂载的NPU。驱动版本要求是23.0.6。如果不符合要求请参考安装固件和驱动章节升级驱动。检查docker是否安装。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.907）
ECS中构建新镜像 - AI开发平台ModelArts

ECS中构建新镜像通过ECS获取和上传基础镜像获取基础镜像后，可通过ECS运行Dockerfile文件，在镜像的基础上构建新镜像。 Step1 构建新ModelArts Standard训练镜像获取模型软件包，并上传到ECS的目录下（可自定义路径），获取地址参考表1。解压A

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.910） > 准备工作 > 准备镜像
ECS中构建新镜像 - AI开发平台ModelArts

ECS中构建新镜像通过ECS获取和上传基础镜像获取基础镜像后，可通过ECS运行Dockerfile文件，在镜像的基础上构建新镜像。 Step1 构建新ModelArts Standard训练镜像获取模型软件包，并上传到ECS的目录下（可自定义路径），获取地址参考表1。解压A

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.910） > 准备工作 > 准备镜像
ECS中构建新镜像 - AI开发平台ModelArts

ECS中构建新镜像通过ECS获取和上传基础镜像获取基础镜像后，可通过ECS运行Dockerfile文件，在镜像的基础上构建新镜像。 Step1 构建新ModelArts Standard训练镜像获取模型软件包，并上传到ECS的目录下（可自定义路径），获取地址参考表1。解压A

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.911） > 准备工作 > 准备镜像
欠拟合的解决方法有哪些？ - AI开发平台ModelArts

欠拟合的解决方法有哪些？模型复杂化。对同一个算法复杂化。例如回归模型添加更多的高次项，增加决策树的深度，增加神经网络的隐藏层数和隐藏单元数等。弃用原来的算法，使用一个更加复杂的算法或模型。例如用神经网络来替代线性回归，用随机森林来代替决策树。增加更多的特征，使输入数据具有更强的表达能力。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 功能咨询
训练的数据集预处理说明 - AI开发平台ModelArts

微调包含SFT和LoRA微调。数据集预处理脚本参数说明如下： --input：原始数据集的存放路径。 --output-prefix：处理后的数据集保存路径+数据集名称（例如：moss-003-sft-data） --tokenizer-type：tokenizer的类型，可选项有['B

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明
【下线公告】华为云ModelArts服务模型转换下线公告 - AI开发平台ModelArts

型转换任务列表和详情功能。如您有任何问题，可随时通过工单或者服务热线（+86-4000-955-988或+86-950808）与我们联系。常见问题为什么要下线模型转换？ ModelArts模型转换向AI开发者提供了便捷的模型转换页面，将Tensorflow和Caffe框架的

 帮助中心 > AI开发平台ModelArts > 服务公告 > 下线公告
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

准备训练Llama2-13B模型适用的容器镜像，包括获取镜像地址，了解镜像中包含的各类固件版本，配置Standard物理机环境操作。镜像地址本教程中用到的训练的基础镜像地址和配套版本关系如下表所示，请提前了解。表1 基础容器镜像地址镜像用途镜像地址配套版本训练基础镜像 swr.cn-southwest-2

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 准备工作
准备工作 - AI开发平台ModelArts
准备工作 - AI开发平台ModelArts

一致导致，为了在定位过程中少走弯路，需要在定位前先对训练环境及代码做有效排查。此外，问题定位主要基于GPU环境和NPU环境上运行的过程数据做对比，所以需要分别准备GPU和NPU训练环境，大部分场景需要规模相同的训练环境。如果已经将模型缩减到单机可运行，则只是单台GPU设备即可。定位前的排查当前主要包含如下几个方面：

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
发布免费模型 - AI开发平台ModelArts

等，让资产更吸引人。修改封面图和二级标题在发布的资产详情页面，单击右侧的“编辑”，选择上传新的封面图，为资产编辑独特的主副标题。编辑完成之后单击“保存”。封面图和二级标题内容自动同步，您可以直接在资产详情页查看修改结果。图1 修改封面图和二级标题编辑标签单击标签右侧的

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 发布分享
训练迁移快速入门案例 - AI开发平台ModelArts

指导的讨论范围中。已完成迁移环境准备，且代码、预训练模型、数据等训练必需内容已经上传到环境中。约束和限制安装插件后，大部分能力能够对标在GPU上的使用，但并不是所有行为和GPU上是一一对应的。例如在torch_npu下，当PyTorch版本低于2.1.0时，一个进程只能操作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导
引言 - AI开发平台ModelArts
引言 - AI开发平台ModelArts

也可能会引入不收敛情况；最后，则是不符合预期的计算或者通信导致的模型收敛问题。在迁移流程中，一般已经有模型训练的标杆，因此主要关注昇腾软件栈引入的精度偏差即可。由于昇腾芯片和GPU芯片的架构差异（包括不同架构下的GPU芯片），收到数值计算精度的影响，在软件实现上也存在微小的偏差

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
查询作业引擎规格 - AI开发平台ModelArts

String 用户项目ID。获取方法请参见获取项目ID和名称。表2 查询检索参数说明参数是否为必选参数类型说明 job_type 否 String 指定作业的类型，可选的有“train”和“inference”。请求消息无请求参数。响应消息响应参数如表3所示。表3

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 资源和引擎规格接口
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

准备训练Llama2-13B模型适用的容器镜像，包括获取镜像地址，了解镜像中包含的各类固件版本，配置Standard物理机环境操作。镜像地址本教程中用到的训练的基础镜像地址和配套版本关系如下表所示，请提前了解。表1 基础容器镜像地址镜像用途镜像地址配套版本训练基础镜像 swr.cn-southwest-2

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 准备工作
环境准备 - AI开发平台ModelArts
环境准备 - AI开发平台ModelArts

0 fsspec==2022.11.0 transformers==4.29.2 deepspeed==0.9.2 与昇腾NPU适配的依赖库有torch_npu，多卡训练也需要deepspeed_npu。本文适配的版本：deepspeed_npu(0.1)，torch_npu(1.

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于LLM模型的GPU训练业务迁移至昇腾指导

总条数： 606

上一页
1
...
17
18
19
...
31
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ECS中构建新镜像 - AI开发平台ModelArts

使用自定义引擎在ModelArts Standard创建模型 - AI开发平台ModelArts

ECS中构建新镜像 - AI开发平台ModelArts

ModelArts如何通过标签实现资源分组管理 - AI开发平台ModelArts

使用TMS标签实现资源分组管理 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

ECS中构建新镜像 - AI开发平台ModelArts

ECS中构建新镜像 - AI开发平台ModelArts

ECS中构建新镜像 - AI开发平台ModelArts

欠拟合的解决方法有哪些？ - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

【下线公告】华为云ModelArts服务模型转换下线公告 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

准备工作 - AI开发平台ModelArts

发布免费模型 - AI开发平台ModelArts

训练迁移快速入门案例 - AI开发平台ModelArts

引言 - AI开发平台ModelArts

查询作业引擎规格 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

环境准备 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线