搜索_华为云

日志提示"No CUDA-capable device is detected" - AI开发平台ModelArts

配的情况。如果上述方法还出现了错误，可以去notebook里面调试打印CUDA_VISIBLE_DEVICES变量，或者用以下代码测试，查看结果是否返回的是True。 import torch torch.cuda.is_available() 建议与总结在创建训练作业前，推

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题
创建训练作业 - AI开发平台ModelArts

表30 remote_constraint 参数是否必选参数类型描述 data_type 否 String 数据输入类型，包括数据存储位置、数据集两种方式。 attributes 否 String 数据输入为数据集时的相关属性。枚举值： data_format 数据格式； data_segmentation

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
发布镜像到AI Gallery - AI开发平台ModelArts

支持1~90个字符，请勿在描述中输入涉政、迷信、违禁等相关敏感词，否则发布审核无法通过。可见范围 “所有用户可见”：表示公开资产，所有用户都可以查看该资产。 “指定用户可见”：输入账号名、账号ID或用户昵称搜索并选择用户，使其可见该资产。可用范围选择是否启用“申请用户可用”。勾选

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery镜像
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

kubectl。图2 kubectl 访问集群配置在节点机器中，输入命令，查看Kubernetes集群信息。若显示如图图3的内容，则配置成功。 kubectl cluster-info 图3 查看 Kubernetes 集群信息正确弹出内容创建SFS Turbo SFS Turbo

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作
SFT全参微调训练任务 - AI开发平台ModelArts

m_train/saved_dir_for_output/llama2-13b/saved_models/。训练完成后，请参考查看日志和性能章节查看SFT微调的日志和性能。父主题：主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.906）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.906）
如何登录并上传镜像到SWR？ - AI开发平台ModelArts

com/deep-learning/tf-1.13.2:latest 图2 上传镜像完成镜像上传后，在“容器镜像服务控制台>我的镜像”页面可查看已上传的自定义镜像。 “swr.example.com/deep-learning/tf-1.13.2:latest”即为此自定义镜像的“SWR_URL”。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard镜像相关
ECS获取基础镜像 - AI开发平台ModelArts

#检查docker是否安装如尚未安装，运行以下命令安装docker。 yum install -y docker 配置IP转发，用于容器内的网络访问。执行以下命令查看net.ipv4.ip_forward配置项的值，如果为1，可跳过此步骤。 sysctl -p | grep net.ipv4.ip_forward

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912） > 准备工作 > 准备镜像
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

kubectl。图2 kubectl 访问集群配置在节点机器中，输入命令，查看Kubernetes集群信息。若显示如图图3的内容，则配置成功。 kubectl cluster-info 图3 查看 Kubernetes 集群信息正确弹出内容创建SFS Turbo SFS Turbo

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

kubectl。图2 kubectl 访问集群配置在节点机器中，输入命令，查看Kubernetes集群信息。若显示如图图3的内容，则配置成功。 kubectl cluster-info 图3 查看 Kubernetes 集群信息正确弹出内容创建SFS Turbo SFS Turbo

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

kubectl。图2 kubectl 访问集群配置在节点机器中，输入命令，查看Kubernetes集群信息。若显示如图图3的内容，则配置成功。 kubectl cluster-info 图3 查看 Kubernetes 集群信息正确弹出内容创建SFS Turbo SFS Turbo

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作
预训练任务 - AI开发平台ModelArts

执行训练启动命令后，等待模型载入，当出现“training”关键字时，表示开始训练。训练过程中，训练日志会在最后的Rank节点打印。图1 等待模型载入更多查看训练日志和性能操作，请参考查看日志和性能章节。父主题：主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.905）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.905）
LoRA微调训练 - AI开发平台ModelArts

m_train/saved_dir_for_output/llama2-13b/saved_models/。训练完成后，请参考查看日志和性能章节查看LoRA微调训练的日志和性能。父主题：主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.906）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.906）
在ModelArts自动学习中，如何进行增量训练？ - AI开发平台ModelArts

其他参数请根据界面提示填写。设置完成后，单击“确定”，即进行增量训练。系统将自动跳转至“模型训练”页面，待训练完成后，您可以在此页面中查看训练详情，如“训练精度”、“评估结果”、“训练参数”等。图1 选择增量训练版本父主题： Standard自动学习

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习
发布模型到AI Gallery - AI开发平台ModelArts

支持1~90个字符，请勿在描述中输入涉政、迷信、违禁等相关敏感词，否则发布审核无法通过。可见范围 “所有用户可见”：表示公开资产，所有用户都可以查看该资产。 “指定用户可见”：输入账号名、账号ID或用户昵称搜索并选择用户，使其可见该资产。可用范围选择是否启用“申请用户可用”。勾选

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型
训练过程中无法找到so文件 - AI开发平台ModelArts

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64 执行如下命令，查看训练环境的cuda版本，确认当前cuda版本是否支持so文件。 os.system("cat /usr/local/cuda/version

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
ma-cli auto-completion自动补全命令 - AI开发平台ModelArts

ma-cli)" 此外，可以通过“ma-cli auto-completion Fish”或“ma-cli auto-completion Fish”命令查看“Zsh”、“Fish”中的自动补全命令。命令概览 $ ma-cli auto-completion -h Usage: ma-cli auto-completion

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
预训练任务 - AI开发平台ModelArts

s/llm_train/saved_dir_for_output/llama2-13b/saved_models/。更多查看训练日志和性能操作，请参考查看日志和性能章节。父主题：主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.906）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.906）
训练作业卡死检测 - AI开发平台ModelArts

set_auth(is_secure=False) 复制单个大文件5G以上时可采用： from moxing.framework.file import file_io 查看当前moxing调用的接口版本：file_io._LARGE_FILE_METHOD，如果输出值为1则为V1版本，如果输出值为2，则为V2版本。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
SFT全参微调训练任务 - AI开发平台ModelArts

/llm_train/saved_dir_for_output/llama2-13b/saved_models/。最后，请参考查看日志和性能章节查看sft微调的日志和性能。步骤五删除config.yaml创建出的所有工作负载Pod 若要删除config.yaml创建出的所有工作负载Pod，需要先找到config

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.910）
执行训练任务（历史版本） - AI开发平台ModelArts

/llm_train/saved_dir_for_output/llama2-13b/saved_models/。最后，请参考查看日志和性能章节查看预训练的日志和性能。步骤五删除config.yaml创建出的所有工作负载Pod 若要删除config.yaml创建出的所有工作负载Pod，需要先找到config

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练任务

总条数： 1416

上一页
1
...
60
61
62
...
71
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

日志提示"No CUDA-capable device is detected" - AI开发平台ModelArts

创建训练作业 - AI开发平台ModelArts

发布镜像到AI Gallery - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

SFT全参微调训练任务 - AI开发平台ModelArts

如何登录并上传镜像到SWR？ - AI开发平台ModelArts

ECS获取基础镜像 - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

预训练任务 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

在ModelArts自动学习中，如何进行增量训练？ - AI开发平台ModelArts

发布模型到AI Gallery - AI开发平台ModelArts

训练过程中无法找到so文件 - AI开发平台ModelArts

ma-cli auto-completion自动补全命令 - AI开发平台ModelArts

预训练任务 - AI开发平台ModelArts

训练作业卡死检测 - AI开发平台ModelArts

SFT全参微调训练任务 - AI开发平台ModelArts

执行训练任务（历史版本） - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线