检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
SFT全参微调训练 SFT全参微调数据处理 SFT全参微调权重转换 SFT全参微调任务 父主题: LLama2系列模型基于DevServer适配PyTorch NPU训练指导(6.3.904)
准备工作 准备环境 准备代码 准备数据 准备镜像 父主题: Qwen系列模型基于DevServer适配PyTorch NPU训练指导(6.3.904)
SFT微调训练 SFT微调数据处理 SFT微调权重转换 SFT微调训练任务 父主题: Qwen系列模型基于DevServer适配PyTorch NPU训练指导(6.3.904)
预训练 预训练数据处理 预训练任务 断点续训练 查看日志和性能 父主题: GLM3-6B模型基于DevServer适配PyTorch NPU训练指导(6.3.904)
主流开源大模型基于DevServer适配PyTorch NPU训练指导(6.3.906) 场景介绍 准备工作 预训练任务 SFT全参微调训练任务 LoRA微调训练 查看日志和性能 训练脚本说明 父主题: LLM大语言模型训练推理
FAQ CUDA和CUDNN run.sh脚本测试ModelArts训练整体流程 ModelArts环境挂载目录说明 infiniband驱动的安装 如何保证训练和调试时文件路径保持一致 父主题: 专属资源池训练
基于ModelArts Standard运行GPU训练任务 在ModelArts Standard上运行GPU训练任务的场景介绍 在ModelArts Standard运行GPU训练任务的准备工作 在ModelArts Standard上运行GPU单机单卡训练任务 在ModelArts
Standard Notebook 规格限制 文件上传下载 数据存储 环境配置相关 Notebook实例常见错误 代码运行常见错误 CodeLab PyCharm Toolkit使用 VS Code使用技巧 VS Code连接开发环境失败常见问题 在Notebook中使用自定义镜像常见问题
规格限制 是否支持sudo提权? 是否支持apt-get? 是否支持Keras引擎? 是否支持caffe引擎? 是否支持本地安装MoXing? Notebook支持远程登录吗? 父主题: Standard Notebook
导入模型 如何将Keras的.h5格式模型导入到ModelArts中 导入模型时,模型配置文件中的安装包依赖参数如何编写? 使用自定义镜像创建在线服务,如何修改默认端口 ModelArts平台是否支持多模型导入 导入AI应用对于镜像大小的限制 父主题: 模型管理
查看作业详情 如何查看训练作业资源占用情况? 如何访问训练作业的后台? 两个训练作业的模型都保存在容器相同的目录下是否有冲突? 训练输出的日志只保留3位有效数字,是否支持更改loss值? 训练好的模型是否可以下载或迁移到其他账号?如何获取下载路径? 父主题: Standard训练作业
VS Code连接开发环境失败常见问题 在ModelArts控制台界面上单击VS Code接入并在新界面单击打开,未弹出VS Code窗口 在ModelArts控制台界面上单击VS Code接入并在新界面单击打开,VS Code打开后未进行远程连接 VS Code连接开发环境失败时的排查方法
Standard推理部署 模型管理 部署上线
在Notebook中使用自定义镜像常见问题 不在同一个主账号下,如何使用他人的自定义镜像创建Notebook? 父主题: Standard Notebook
Lite Cluster Cluster资源池如何进行NCCl Test?
PyCharm Toolkit使用 安装ToolKit工具时出现错误,如何处理? PyCharm ToolKit工具中Edit Credential时,出现错误 为什么无法启动训练? 提交训练作业时,出现xxx isn't existed in train_version错误 提交训练作业报错“Invalid
Lite Server GPU A系列裸金属服务器如何进行RoCE性能带宽测试? GPU A系列裸金属服务器节点内如何进行NVLINK带宽性能测试方法? 如何将Ubuntu20.04内核版本从低版本升级至5.4.0-144-generic? 如何禁止Ubuntu 20.04内核自动升级?
典型场景配置实践 个人用户快速配置ModelArts访问权限 配置ModelArts基本使用权限 给子账号配置开发环境基本使用权限 给子账号配置训练作业基本使用权限 给子账号配置部署上线基本使用权限 管理员和开发者权限分离 使用Cloud Shell登录训练容器 限制用户使用公共资源池
SD1.5&SDXL Koyha框架基于DevServer适配PyTorch NPU训练指导(6.3.908) 训练场景和方案介绍 准备镜像环境 Finetune训练 LoRA训练 父主题: AIGC模型训练推理
主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导(6.3.907) 场景介绍 准备工作 预训练任务 SFT全参微调训练任务 LoRA微调训练 查看日志和性能 训练脚本说明 常见错误原因和解决方法 父主题: LLM大语言模型训练推理