检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
docker push <镜像仓库地址>/<组织名称>/<镜像名称>:<版本名称> 示例: docker push swr.cn-southwest-2.myhuaweicloud.com/ma-group/pytorch_2_1_ascend:20240606 父主题: 准备镜像
docker push <镜像仓库地址>/<组织名称>/<镜像名称>:<版本名称> 示例: docker push swr.cn-southwest-2.myhuaweicloud.com/ma-group/pytorch_2_1_ascend:20240606 父主题: 准备镜像
检查是否安装docker。 docker -v #检查docker是否安装 如尚未安装,运行以下命令安装docker。
主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导(6.3.911) 场景介绍 准备工作 预训练任务 SFT全参微调训练任务 LoRA微调训练 查看日志和性能 训练脚本说明 常见错误原因和解决方法 父主题: LLM大语言模型训练推理
主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导(6.3.912) 场景介绍 准备工作 训练任务 查看日志和性能 训练脚本说明参考 常见错误原因和解决方法 父主题: LLM大语言模型训练推理
执行训练任务(推荐) 新的训练方式将统一管理训练日志、训练结果和训练配置,使用yaml配置文件方便用户根据自己实际需求进行修改。推荐用户使用该方式进行训练。 权重文件支持以下组合方式,用户根据自己实际要求选择: 训练stage 不加载权重 增量训练:加载权重,不加载优化器(默认开启
docker push <镜像仓库地址>/<组织名称>/<镜像名称>:<版本名称> 示例: docker push swr.cn-southwest-2.myhuaweicloud.com/ma-group/pytorch_2_1_ascend:20240606 父主题: 准备镜像
检查是否安装docker。 docker -v #检查docker是否安装 如尚未安装,运行以下命令安装docker。
检查是否安装docker。 docker -v #检查docker是否安装 如尚未安装,运行以下命令安装docker。
父主题: 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导(6.3.910)
图2 创建镜像组织 Step3 安装Docker 检查docker是否安装。 docker -v #检查docker是否安装 如尚未安装,运行以下命令安装docker。 yum install -y docker 配置IP转发,用于容器内的网络访问。
docker push <镜像仓库地址>/<组织名称>/<镜像名称>:<版本名称> 示例: docker push swr.cn-southwest-2.myhuaweicloud.com/ma-group/pytorch_2_1_ascend:20240606 父主题: 准备镜像
Logout successful! 父主题: Gallery CLI配置工具指南
表5 DescribeSampleResp 参数 参数类型 描述 check_accept Boolean 是否验收通过,用于团队标注。可选值如下: true:验收通过 false:验收不通过 check_comment String 验收意见,用于团队标注。
图2 创建镜像组织 Step3 安装Docker 检查docker是否安装。 docker -v #检查docker是否安装 如尚未安装,运行以下命令安装docker。 yum install -y docker 配置IP转发,用于容器内的网络访问。
图2 创建镜像组织 Step3 安装Docker 检查docker是否安装。 docker -v #检查docker是否安装 如尚未安装,运行以下命令安装docker。 yum install -y docker 配置IP转发,用于容器内的网络访问。
kubectl exec -it {pod_name} bash ${pod_name}:pod名,例如图1${pod_name}为yourapp-87d9b5b46-c46bk。
准备工作 准备环境 准备代码 准备镜像 父主题: 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导(6.3.910)
/ 父主题: 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导(6.3.911)
执行训练任务(历史版本) 权重文件支持以下组合方式,用户根据自己实际要求选择: 训练stage 不加载权重 增量训练:加载权重,不加载优化器 断点续训:加载权重+优化器 pt sft CKPT_LOAD_TYPE=0 CKPT_LOAD_TYPE=1 USER_CONVERTED_CKPT_PATH