搜索_华为云

使用PyCharm ToolKit创建并调试训练作业 - AI开发平台ModelArts

在弹出的对话框中，设置训练作业相关参数，详细参数说明请参见表1。表1 训练作业配置参数说明参数说明 Job Name 训练作业的名称。系统会自动生成一个名称，您可以根据业务需求重新命名，命名规则如下：支持1~64位字符。并包含大小写字母、数字、中划线（-）或下划线（_）。 Job Description

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 创建调试训练作业
迁移效果校验 - AI开发平台ModelArts

的效果是否满足要求，通过对比原始onnx pipeline的最终输出结果确认迁移效果。如果精度和性能都没有问题，则代表迁移完成。对比图片生成效果在CPU上推理onnx，将原始onnx和适配完成的MindSpore Lite pipeline输出的结果图片进行对比，在这里保证输

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
开启训练故障自动重启功能 - AI开发平台ModelArts

即便模型训练中断，也可以基于checkpoint接续训练。当训练作业发生故障中断本次作业时，代码可自动从训练中断的位置接续训练，加载中断生成的checkpoint，中间不需要改动任何参数（支持预训练、LoRA微调、SFT微调）。如果要使用自动重启功能，资源规格必须选择八卡规格。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906）
推理性能测试 - AI开发平台ModelArts

ca_data.json 方法二：使用generate_dataset.py脚本生成数据集方法：客户通过业务数据，在generate_dataset.py脚本，指定输入输出长度的均值和标准差，生成一定数量的正态分布的数据。具体操作命令如下，可以根据参数说明修改参数。 cd benchmark_tools

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.907）
常见的磁盘空间不足的问题和解决办法 - AI开发平台ModelArts

接成/home/ma-user/），导致数据占满系统目录。系统目录仅支持系统功能基本运行，无法支持大数据存储。部分训练任务会在训练过程中生成checkpoint文件，并进行更新。如更新过程中，未删除历史的checkpoint文件，会导致/cache目录逐步被用完。实际存储空间足够，却依旧报错“No

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
使用SDK调测单机训练作业 - AI开发平台ModelArts

fit(inputs=[input_data], job_name="cifar10-dis") 参数解释： inputs：可选参数，一个list，每个元素都是2生成的实例。 job_name：可选参数，训练任务名，便于区分和记忆。本地单机调试训练任务开始后，SDK会依次帮助用户完成以下流程：初始化

 帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业 > 训练作业调测
Open-Sora1.2基于DevServer适配PyTorch NPU训练推理指导（6.3.910） - AI开发平台ModelArts

-OpenSoraVAE_V1_2/epochX-global_step1000/model，X为按顺序自动生成的数字）具体位置打印在日志中，注意：输出文件夹是自动生成，只有日志中打印的位置才是保存权重的位置。图3 VAE第一阶段训练日志第二阶段训练 export pret

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生视频模型训练推理
ma-cli image镜像构建支持的命令 - AI开发平台ModelArts

参数说明 FILE_PATH String 是 Dockerfile文件所在的路径。 -t / --target String 否表示构建生成的tar包保存在本地的路径，默认是当前文件夹目录。 -swr / --swr-path String 是 SWR镜像名称，遵循organi

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
demo.sh方式启动（历史版本） - AI开发平台ModelArts

ate列 output_dir /home/ma-user/ws/Qwen2-72B/sft-4096 必须修改。指定输出目录。训练过程中生成的模型参数和日志文件将保存在这个目录下。用户根据自己实际要求适配。 per_device_train_batch_size 1 指定每个设备的训练批次大小

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 执行训练任务
日志提示"write line error" - AI开发平台ModelArts

5T存储空间满了，具体规格的空间大小可参见训练环境中不同规格资源“/cache”目录的大小。处理方法如果在训练作业的工作目录下有core文件生成，可以在启动脚本最前面加上如下代码，来关闭core文件产生。 import os os.system("ulimit -c 0") 排查数

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
在ModelArts中数据标注完成后，标注结果存储在哪里？ - AI开发平台ModelArts

“数据集输入位置”即原始数据存储的OBS路径。 “数据集输出位置”，指在ModelArts完成数据标注后，执行数据集发布操作后，在此指定路径下，按数据集版本，生成相关目录。包含ModelArts中使用的Manifest文件（包含数据及标注信息）。详细文件说明可参见数据集发布后，相关文件的目录结构说明。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据准备
准备W8A8权重 - AI开发平台ModelArts

准备W8A8权重前提条件已完成准备BF16权重。 W8A8量化权重生成介绍如何将BF16权重量化为W8A8的权重，具体操作步骤如下。在Server机器上创建权重量化后的存放目录${path-to-file}/deepseekV3-w8a8或${path-to-file}/deepseekR1-w8a8目录。

帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek系列模型推理 > DeepSeek模型基于ModelArts Lite Server适配MindIE推理部署指导 > 准备权重
准备镜像环境 - AI开发平台ModelArts

RestartJob plugins: configmap1980: - --rank-table-version=v2 # 保持不动，生成v2版本ranktablefile env: [] svc: - --publish-not-ready-addresses=true

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
准备镜像环境 - AI开发平台ModelArts

RestartJob plugins: configmap1980: - --rank-table-version=v2 # 保持不动，生成v2版本ranktablefile env: [] svc: - --publish-not-ready-addresses=true

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作
准备镜像环境 - AI开发平台ModelArts

RestartJob plugins: configmap1980: - --rank-table-version=v2 # 保持不动，生成v2版本ranktablefile env: [] svc: - --publish-not-ready-addresses=true

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作
准备镜像环境 - AI开发平台ModelArts

RestartJob plugins: configmap1980: - --rank-table-version=v2 # 保持不动，生成v2版本ranktablefile env: [] svc: - --publish-not-ready-addresses=true

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
Paraformer基于DevServer适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

python infer.py --model_path 模型文件所在的绝对路径 --input_file aishell.scp 执行完生成推理结果文件infer_result.txt。父主题：内容审核模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 内容审核模型训练推理
以PyTorch框架创建训练作业（新版训练） - AI开发平台ModelArts

法的输入输出管道。可以按照实例指定“data_url”和“train_url”，在代码中解析超参分别指定训练所需要的数据文件本地路径和训练生成的模型输出本地路径。 “job_config”字段下的“parameters_customization”表示是否支持自定义超参，此处填true。

帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
推理性能测试 - AI开发平台ModelArts

/alpaca_data.json 方法二：使用generate_dataset.py脚本生成数据集方法： generate_dataset.py脚本通过指定输入输出长度的均值和标准差，生成一定数量的正态分布的数据。具体操作命令如下，可以根据参数说明修改参数。 python generate_dataset

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）
推理性能测试 - AI开发平台ModelArts

/alpaca_data.json 方法二：使用generate_dataset.py脚本生成数据集方法： generate_dataset.py脚本通过指定输入输出长度的均值和标准差，生成一定数量的正态分布的数据。具体操作命令如下，可以根据参数说明修改参数。 python generate_dataset

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）

总条数： 961

上一页
1
...
43
44
45
...
49
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用PyCharm ToolKit创建并调试训练作业 - AI开发平台ModelArts

迁移效果校验 - AI开发平台ModelArts

开启训练故障自动重启功能 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

常见的磁盘空间不足的问题和解决办法 - AI开发平台ModelArts

使用SDK调测单机训练作业 - AI开发平台ModelArts

Open-Sora1.2基于DevServer适配PyTorch NPU训练推理指导（6.3.910） - AI开发平台ModelArts

ma-cli image镜像构建支持的命令 - AI开发平台ModelArts

demo.sh方式启动（历史版本） - AI开发平台ModelArts

日志提示"write line error" - AI开发平台ModelArts

在ModelArts中数据标注完成后，标注结果存储在哪里？ - AI开发平台ModelArts

准备W8A8权重 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

Paraformer基于DevServer适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

以PyTorch框架创建训练作业（新版训练） - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线