搜索_华为云

重装的包与镜像装CUDA版本不匹配 - AI开发平台ModelArts

CUDA is not enabled” 原因分析出现该问题的可能原因如下：新安装的包与镜像中带的CUDA版本不匹配。处理方法必现的问题，使用本地Pycharm远程连接Notebook调试安装。先远程登录到所选的镜像，使用“nvcc -V”查看目前镜像自带的CUDA版本。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
开发环境 - AI开发平台ModelArts
开发环境 - AI开发平台ModelArts

开发环境环境配置故障实例故障代码运行故障 JupyterLab插件故障 VS Code连接开发环境失败故障处理自定义镜像故障其他故障

 帮助中心 > AI开发平台ModelArts > 故障排除
规格限制 - AI开发平台ModelArts
规格限制 - AI开发平台ModelArts

规格限制是否支持sudo提权？是否支持apt-get？是否支持Keras引擎？是否支持caffe引擎？是否支持本地安装MoXing？ Notebook支持远程登录吗？父主题： Standard Notebook

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
使用自动学习实现预测分析 - AI开发平台ModelArts

使用自动学习实现预测分析准备预测分析数据创建预测分析项目训练预测分析模型部署预测分析服务父主题：使用自动学习实现零代码AI开发

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发
使用自定义镜像创建训练作业找不到启动文件 - AI开发平台ModelArts

例如，当训练代码启动脚本在OBS路径为“obs://bucket-name/app/code/train.py”，创建作业时配置代码目录为“/bucket-name/app/code/”。则代码目录配置完成后，执行如下命令，那么“run_train.sh”将选中的“code”文件夹下载到训练容器的“/h

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败
日志提示"write line error" - AI开发平台ModelArts

本地数据、文件保存将"/cache"目录3.5T空间用完了。云上训练磁盘空间一般指如下两个目录的磁盘空间： “/”根目录，是docker中配置项“base size”，默认是10G，云上统一改为50G。 “/cache”目录满了，一般是3.5T存储空间满了，具体规格的空间大小可参

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
托管镜像到AI Gallery - AI开发平台ModelArts

Gallery，单击右上角“我的Gallery”进入我的Gallery页面。单击左上方“创建资产”，选择“镜像”。在“创建镜像”弹窗中配置参数，单击“创建”。表1 创建镜像参数名称说明英文名称必填项，镜像的英文名称。如果没有填写“中文名称”，则资产发布后，在镜像页签上会显示该“英文名称”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery镜像
查看模型评估结果 - AI开发平台ModelArts

查看模型评估结果训练作业运行结束后，ModelArts可为您的模型进行评估，并且给出调优诊断和建议。针对使用预置算法创建训练作业，无需任何配置，即可查看此评估结果（由于每个模型情况不同，系统将自动根据您的模型指标情况，给出一些调优建议，请仔细阅读界面中的建议和指导，对您的模型进行进一步的调优）。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
ModelArts入门指引 - AI开发平台ModelArts

成AI建模和应用。如果您想了解如何使用ModelArts Standard一键部署现有的模型，并在线使用模型进行预测，您可以参考使用ModelArts Standard一键完成商超商品识别模型部署。 ModelArts Standard同时提供了自动学习功能，帮助用户零代码构建

 帮助中心 > AI开发平台ModelArts > 快速入门
训练预测分析模型 - AI开发平台ModelArts

训练预测分析模型创建自动学习后，将会进行模型的训练，得到预测分析的模型。模型部署步骤将使用预测模型发布在线预测服务。操作步骤在新版自动学习页面，单击创建成功的项目名称，查看当前工作流的执行情况。在“预测分析”节点中，待节点状态由“运行中”变为“运行成功”，即完成了模型的自动训练。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现预测分析
Standard功能介绍 - AI开发平台ModelArts

Standard自动学习 Standard Workflow Standard数据管理 Standard开发环境 Standard模型训练 Standard模型部署 Standard资源管理 Standard支持的AI框架父主题：功能介绍

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍
计费项 - AI开发平台ModelArts
计费项 - AI开发平台ModelArts

计费项自动学习/Workflow计费项数据管理计费项开发环境计费项模型训练计费项 AI应用计费项推理部署计费项专属资源池计费项

 帮助中心 > AI开发平台ModelArts > 计费说明
自动学习 - AI开发平台ModelArts
自动学习 - AI开发平台ModelArts

自动学习准备数据模型训练部署上线模型发布

 帮助中心 > AI开发平台ModelArts > 故障排除
创建OBS桶用于ModelArts存储数据 - AI开发平台ModelArts

数据标注 ModelArts标注的数据存储在OBS中。自动训练训练作业结束后，其生成的模型存储在OBS中。部署上线 ModelArts将存储在OBS中的模型部署上线为在线服务。 Standard AI全流程开发数据管理数据集存储在OBS中。数据集的标注信息存储在OBS中。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard准备工作
预训练任务 - AI开发平台ModelArts

预处理说明。 Step2 修改训练超参配置以 llama2-70b 和 llama2-13b 预训练为例，执行脚本为 0_pl_pretrain_70b.sh 和 0_pl_pretrain_13b.sh 。修改模型训练脚本中的超参配置，必须修改的参数如表1所示。其他超参均

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905）
LoRA微调训练 - AI开发平台ModelArts

明和训练的数据集预处理说明。步骤2 修改训练超参配置以Llama2-70b和Llama2-13b的LoRA微调为例，执行脚本为0_pl_lora_70b.sh和0_pl_lora_13b.sh 。修改模型训练脚本中的超参配置，必须修改的参数如表1所示。其他超参均有默认值，可以参考表1按照实际需求修改。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906）
资源选择推荐 - AI开发平台ModelArts

桶（存放代码）”，采用分布式训练。表1 不同场景所需服务及购买推荐场景 OBS SFS SWR DEW ModelArts VPC ECS EVS 单机单卡按需购买。（并行文件系统） × 免费。免费。包月购买。免费。 × 按需购买。单机多卡 × 包月购买。（HPC型500G）

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练
FAQ - AI开发平台ModelArts
FAQ - AI开发平台ModelArts

FAQ CUDA和CUDNN run.sh脚本测试ModelArts训练整体流程 ModelArts环境挂载目录说明 infiniband驱动的安装如何保证训练和调试时文件路径保持一致父主题：专属资源池训练

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练
训练脚本说明 - AI开发平台ModelArts

训练脚本说明训练启动脚本说明和参数配置训练的数据集预处理说明训练的权重转换说明训练tokenizer文件说明父主题：主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905）
训练脚本说明 - AI开发平台ModelArts

训练脚本说明训练启动脚本说明和参数配置训练的数据集预处理说明训练的权重转换说明训练tokenizer文件说明父主题：主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906）

总条数： 1238

上一页
1
...
50
51
52
...
62
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

重装的包与镜像装CUDA版本不匹配 - AI开发平台ModelArts

开发环境 - AI开发平台ModelArts

规格限制 - AI开发平台ModelArts

使用自动学习实现预测分析 - AI开发平台ModelArts

使用自定义镜像创建训练作业找不到启动文件 - AI开发平台ModelArts

日志提示"write line error" - AI开发平台ModelArts

托管镜像到AI Gallery - AI开发平台ModelArts

查看模型评估结果 - AI开发平台ModelArts

ModelArts入门指引 - AI开发平台ModelArts

训练预测分析模型 - AI开发平台ModelArts

Standard功能介绍 - AI开发平台ModelArts

计费项 - AI开发平台ModelArts

自动学习 - AI开发平台ModelArts

创建OBS桶用于ModelArts存储数据 - AI开发平台ModelArts

预训练任务 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

资源选择推荐 - AI开发平台ModelArts

FAQ - AI开发平台ModelArts

训练脚本说明 - AI开发平台ModelArts

训练脚本说明 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线