搜索_华为云

OBS复制过程中提示“BrokenPipeError: Broken pipe” - AI开发平台ModelArts

原因分析出现该问题的可能原因如下：在大规模分布式作业上，每个节点都在复制同一个桶的文件，导致OBS桶限流。 OBS Client连接数过多，进程/线程之间的轮询，导致一个OBS Client与服务端连接30S内无响应，超过超时时间，服务端断开了连接。处理方法如果是限流问题，

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
通过Token认证的方式访问在线服务 - AI开发平台ModelArts

在Body页签，根据模型的输入参数不同，可分为2种类型：文件输入、文本输入。文件输入选择“form-data”。在“KEY”值填写模型的入参，和在线服务的输入参数对应，比如本例中预测图片的参数为“images”。然后在“VALUE”值，选择文件，上传一张待预测图片（当前仅支持单张图片预测），如图4所示。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的认证方式
数据存储 - AI开发平台ModelArts
数据存储 - AI开发平台ModelArts

数据存储如何对OBS的文件重命名？ Notebook停止或者重启后，“/cache”下的文件还存在么？如何避免重启？如何使用pandas库处理OBS桶中的数据？在Notebook中，如何访问其他账号的OBS桶？ JupyterLab默认工作路径是什么？父主题： Standard

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
训练中的权重转换说明 - AI开发平台ModelArts

etrain_hf中的文件与原始Hugging Face模型中的文件进行对比，查看是否缺少如tokenizers.json、tokenizer_config.json、special_tokens_map.json等tokenizer文件或者其他json文件。若缺少则需要直接复制

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906） > 训练脚本说明
训练中的权重转换说明 - AI开发平台ModelArts

etrain_hf中的文件与原始Hugging Face模型中的文件进行对比，查看是否缺少如tokenizers.json、tokenizer_config.json、special_tokens_map.json等tokenizer文件或者其他json文件。如果缺少则需要直接复

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907） > 训练脚本说明
训练中的权重转换说明 - AI开发平台ModelArts

etrain_hf中的文件与原始Hugging Face模型中的文件进行对比，查看是否缺少如tokenizers.json、tokenizer_config.json、special_tokens_map.json等tokenizer文件或者其他json文件。如果缺少则需要直接复

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.908） > 训练脚本说明参考
训练中的权重转换说明 - AI开发平台ModelArts

etrain_hf中的文件与原始Hugging Face模型中的文件进行对比，查看是否缺少如tokenizers.json、tokenizer_config.json、special_tokens_map.json等tokenizer文件或者其他json文件。如果缺少则需要直接复

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.910） > 训练脚本说明参考
训练中的权重转换说明 - AI开发平台ModelArts

etrain_hf中的文件与原始Hugging Face模型中的文件进行对比，查看是否缺少如tokenizers.json、tokenizer_config.json、special_tokens_map.json等tokenizer文件或者其他json文件。如果缺少则需要直接复

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明参考
开发用于预置框架训练的代码 - AI开发平台ModelArts

失败的风险。建议训练代码目录大小小于或等于50MB。代码目录路径中的启动文件代码目录路径中的启动文件作为训练启动的入口，当前只支持python格式。预置框架启动文件的启动流程说明请参见预置框架启动文件的启动流程说明。训练输入路径参数训练数据需上传至OBS桶或者存储至数据集

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 准备模型训练代码
使用kv-cache-int8量化 - AI开发平台ModelArts

th kv_cache_scales.json #输入Step2 抽取kv-cache量化系数生成的json文件路径; 如果只测试推理功能和性能，不需要此json文件，此时scale系数默认为1，但是可能会造成精度下降。父主题：推理模型量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

码和模型文件，实现安全、高可靠和低成本的存储需求。因此，在使用ModelArts之前通常先创建一个OBS桶，然后在OBS桶中创建文件夹用于存放数据。本文档也以将运行代码存放OBS为例，请参考创建OBS桶，例如桶名：standard-qwen-14b。并在该桶下创建文件夹目录用于后续存储代码使用，例如：code。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905） > 准备工作
上传数据和算法至SFS（首次使用时需要） - AI开发平台ModelArts

/mnt/sfs_turbo/code/ -f -r 本案例中以obsutils方式上传文件，除此之外也可通过SCP方式上传文件，具体操作步骤可参考本地Linux主机使用SCP上传文件到Linux云服务器。在SFS中将文件设置归属为ma-user。 chown -R ma-user:ma-group

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机多卡
自定义引擎创建模型规范 - AI开发平台ModelArts

步骤提前验证：将自定义引擎镜像下载至本地机器，假设镜像名为custom_engine:v1。将模型包文件夹复制到本地机器，假设模型包文件夹名字为model。在模型包文件夹的同级目录下验证如下命令拉起服务： docker run --user 1000:100 -p 8080:8080

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
训练脚本说明 - AI开发平台ModelArts

训练脚本说明 Yaml配置文件参数配置说明模型NPU卡数、梯度累积值取值表各个模型训练前文件替换 NPU_Flash_Attn融合算子约束 BF16和FP16说明录制Profiling 父主题：主流开源大模型基于DevServer适配LlamaFactory PyTorch

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.909）
使用MaaS调优模型 - AI开发平台ModelArts

选择存放训练数据集的OBS路径，必须选择到文件。说明：数据集必须满足要求（请参见约束限制），否则调优会失败。调优后模型权重保存路径选择存放调优后的模型权重文件的OBS路径。说明：权重文件要存放在空文件夹中，否则会覆盖原有文件。超参设置数据条数输入数据集中的总数据条数。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
如何禁止Ubuntu 20.04内核自动升级？ - AI开发平台ModelArts

d/20auto-upgrades”文件： vi /etc/apt/apt.conf.d/20auto-upgrades 将其中的“Unattended-Upgrade "1"; ”改为“Unattended-Upgrade "0";”以禁用自动更新，然后保存文件并退出。将当前内核版本锁定。

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
批量删除样本 - AI开发平台ModelArts

delete_source 否 Boolean 是否删除源文件，对非文本类型数据集有效(文本类型数据集因为是导入的整个文本文件，故删除一条样本不会对源文本有影响)。可选值如下： false：不删除源文件（默认值） true：删除源文件(注意：此操作可能影响已使用这些文件的数据集版本或其他数据集，导致页面展示异常或者训练/推理异常)

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
使用kv-cache-int8量化 - AI开发平台ModelArts

th kv_cache_scales.json #输入Step2 抽取kv-cache量化系数生成的json文件路径; 如果只测试推理功能和性能，不需要此json文件，此时scale系数默认为1，但是可能会造成精度下降。父主题：推理模型量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
查看日志和性能 - AI开发平台ModelArts

节点打印。图1 打印训练日志训练完成后，如果需要单独获取训练日志文件，日志存放在第一个的Rank节点中；日志存放路径为：对应表1表格中output_dir参数值路径下的trainer_log.jsonl文件查看性能训练性能主要通过训练日志中的2个指标查看，吞吐量和loss收敛情况。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.909）
LoRA训练 - AI开发平台ModelArts
LoRA训练 - AI开发平台ModelArts

训练前需要修改数据集路径、模型路径。脚本里写到datasets路径即可。 run_lora_sdxl中的vae路径要准确写到sdxl_vae.safetensors文件路径。 vim run_lora.sh vim run_lora_sdxl.sh 启动SD1.5 LoRA训练服务使用ma-user用户执行如下命令运行训练脚本。

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理 > SD1.5&SDXL Koyha框架基于DevServer适配PyTorch NPU训练指导（6.3.908）

总条数： 1270

上一页
1
...
30
31
32
...
64
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

OBS复制过程中提示“BrokenPipeError: Broken pipe” - AI开发平台ModelArts

通过Token认证的方式访问在线服务 - AI开发平台ModelArts

数据存储 - AI开发平台ModelArts

训练中的权重转换说明 - AI开发平台ModelArts

训练中的权重转换说明 - AI开发平台ModelArts

训练中的权重转换说明 - AI开发平台ModelArts

训练中的权重转换说明 - AI开发平台ModelArts

训练中的权重转换说明 - AI开发平台ModelArts

开发用于预置框架训练的代码 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

上传数据和算法至SFS（首次使用时需要） - AI开发平台ModelArts

自定义引擎创建模型规范 - AI开发平台ModelArts

训练脚本说明 - AI开发平台ModelArts

使用MaaS调优模型 - AI开发平台ModelArts

如何禁止Ubuntu 20.04内核自动升级？ - AI开发平台ModelArts

批量删除样本 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

LoRA训练 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线