搜索_华为云

自定义镜像训练作业失败定位思路 - AI开发平台ModelArts

&& \ chmod 770 /root && \ usermod -a -G root ma-user 其他现象，可以在已有的训练故障案例查找。建议与总结用户使用自定义镜像训练作业时，建议按照训练作业自定义镜像规范制作镜像。文档中同时提供了端到端的示例供用户参考。父主题：训练作业运行失败

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败
使用预置镜像制作自定义镜像用于训练模型 - AI开发平台ModelArts

timeout = 120 在华为开源镜像站https://mirrors.huaweicloud.com/home中，搜索pypi，可以查看pip.conf文件内容。参考如下Dockerfile文件内容来基于ModelArts提供的训练基础镜像来构建一个新镜像。将编写好的Do

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

rts服务声明》”，然后单击“创建”。图1 配置委托访问授权完成配置后，在ModelArts控制台的权限管理列表，可查看到此账号的委托配置信息。图2 查看委托配置信息步骤一：准备训练数据本案例使用的数据是MNIST数据集，您可以在浏览器中搜索“MNIST数据集”下载如图3所示的4个文件。

帮助中心 > AI开发平台ModelArts > 快速入门
创建并管理工作空间 - AI开发平台ModelArts

管理工作空间配额工作空间创建成功后，可以查看配额信息或修改配额值。在ModelArts管理控制台的左侧导航栏中，选择“工作空间”进入工作空间列表。在工作空间列表，单击操作列的“配额管理”进入工作空间详情页。在配额信息页面可以查看工作空间设置的配额值、已用的配额、最后修改时间等配额信息。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard准备工作
预训练任务 - AI开发平台ModelArts

执行训练启动命令后，等待模型载入，当出现“training”关键字时，表示开始训练。训练过程中，训练日志会在最后的Rank节点打印。图1 等待模型载入最后，请参考查看日志和性能章节查看预训练的日志和性能。父主题：主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907）
LoRA微调训练 - AI开发平台ModelArts

scripts/llama2/0_pl_lora_13b.sh 或者： sh scripts/llama2/0_pl_lora_13b.sh 最后，请参考查看日志和性能章节查看LoRA微调的日志和性能。父主题：主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907）
使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

rts服务声明》”，然后单击“创建”。图1 配置委托访问授权完成配置后，在ModelArts控制台的权限管理列表，可查看到此账号的委托配置信息。图2 查看委托配置信息步骤一：准备训练数据本案例使用的数据是MNIST数据集，您可以在浏览器中搜索“MNIST数据集”下载如图3所示的4个文件。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练
训练图像分类模型 - AI开发平台ModelArts

在“图像分类”节点中，待训练状态由“运行中”变为“运行成功”，即完成了模型的自动训练。训练完成后，您可以单击“图像分类”节点上方的按钮，查看相关指标信息，如“准确率”、“评估结果”等。评估结果参数说明请参见表1。图1 模型评估报告表1 评估结果参数说明参数名称参数含义说明

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现图像分类
VS Code连接远端Notebook时报错“XHR failed” - AI开发平台ModelArts

it”的ID码。确认创建Notebook实例使用的镜像的系统架构，可以在Notebook中打开Terminal，通过命令uname -m查看。下载对应版本的vscode-server，根据Commit码和Notebook实例镜像架构下载。如果下载报错“Not Found”，请下载别的版本VS

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
从Manifest文件导入数据到数据集 - AI开发平台ModelArts

ard”属性中数据信息。图1 导入manifest文件导入成功后，数据将自动同步到数据集中。您可以在“数据集”页面，单击数据集的名称，查看详细数据，并可以通过创建标注任务进行数据标注。文件型数据标注状态数据标注状态分为“未标注”和“已标注”。未标注：仅导入标注对象（指待

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导入数据到ModelArts数据集 > 从OBS导入数据到ModelArts数据集
场景描述 - AI开发平台ModelArts
场景描述 - AI开发平台ModelArts

Administrator权限。 Tenant Administrator 可选 CES云监控授予子账号使用CES云监控服务的权限。通过CES云监控可以查看ModelArts的在线服务和对应模型负载运行状态的整体情况，并设置监控告警。 CES FullAccess 可选 SMN消息服务授予子

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践 > 配置ModelArts基本使用权限
推理性能测试 - AI开发平台ModelArts

benchmark_parallel.csv 参数说明 --backend：服务类型，支持tgi、vllm、mindspore、openai等。本文档使用的推理接口是vllm。 --host ${docker_ip}：服务部署的IP，${docker_ip}替换为宿主机实际的IP地址。 --port：推理服务端口8080。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.907）
升级Lite Cluster资源池驱动 - AI开发平台ModelArts

隔离节点并滚动升级。无业务节点定义：在资源池详情“节点管理”页签下，如果GPU/Ascend的可用数等于总数，则为无业务节点。图1 查看无业务节点滚动驱动升级时，驱动异常的节点对升级无影响，会和驱动正常的节点一起升级。图2 驱动升级选择完成后，单击“确定”开始驱动升级。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
Notebook如何离线安装VS Code Server - AI开发平台ModelArts

it”的ID码。确认创建Notebook实例使用的镜像的系统架构，可以在Notebook中打开Terminal，通过命令uname -m查看。下载对应版本的vscode-server，根据Commit码和Notebook实例镜像架构下载。如果下载报错“Not Found”，请下载别的版本VS

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > VS Code使用技巧
执行训练任务 - AI开发平台ModelArts

3指使用0-3卡执行训练任务。训练成功标志 “***** train metrics *****”关键字打印训练完成后，请参考查看日志和性能章节查看指令微调的日志和性能。 1、如训练过程中遇到“NPU out of memory”“Permission denied” 问题可参考

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.909）
语言模型推理性能测试 - AI开发平台ModelArts

benchmark_parallel.csv 参数说明 --backend：服务类型，支持tgi、vllm、mindspore、openai等后端。本文档使用的推理接口是openai。 --host：服务部署的IP，${docker_ip}替换为宿主机实际的IP地址。 --port：推理服务端口。 --

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909） > 推理性能测试
训练作业的自定义镜像制作流程 - AI开发平台ModelArts

Ascend/driver目录。 X86 CPU架构和ARM CPU架构的自定义镜像分别只能运行于对应CPU架构的规格中。执行如下命令，查看自定义镜像的CPU架构。 docker inspect {自定义镜像地址} | grep Architecture ARM CPU架构的自定义镜像，上述命令回显如下。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
升级Standard专属资源池驱动 - AI开发平台ModelArts

节点，隔离节点并滚动升级。无业务节点定义：在资源池详情“节点”页签下，如果GPU/Ascend的可用数等于总数，则为无业务节点。图1 查看无业务节点滚动驱动升级时，驱动异常的节点对升级无影响，会和驱动正常的节点一起升级。图2 驱动升级选择完成后，单击“确定”开始驱动升级。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

备的数据集。准备镜像准备训练模型适用的容器镜像。微调训练指令监督微调训练介绍如何进行SFT全参微调/lora微调、训练任务、性能查看。父主题：主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907）
Hunyuan-DiT基于DevServer部署适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

docker-engine-selinux.noarch docker-runc.aarch64 配置IP转发，用于容器内的网络访问。执行以下命令查看net.ipv4.ip_forward配置项的值，如果为1，可跳过此步骤。 sysctl -p | grep net.ipv4.ip_forward

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理

总条数： 1516

上一页
1
...
70
71
72
...
76
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

自定义镜像训练作业失败定位思路 - AI开发平台ModelArts

使用预置镜像制作自定义镜像用于训练模型 - AI开发平台ModelArts

使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

创建并管理工作空间 - AI开发平台ModelArts

预训练任务 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

训练图像分类模型 - AI开发平台ModelArts

VS Code连接远端Notebook时报错“XHR failed” - AI开发平台ModelArts

从Manifest文件导入数据到数据集 - AI开发平台ModelArts

场景描述 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

升级Lite Cluster资源池驱动 - AI开发平台ModelArts

Notebook如何离线安装VS Code Server - AI开发平台ModelArts

执行训练任务 - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

训练作业的自定义镜像制作流程 - AI开发平台ModelArts

升级Standard专属资源池驱动 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

Hunyuan-DiT基于DevServer部署适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线