搜索_华为云

准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

代码上传至OBS 代码包解压后，在OBS中创建mllm_train目录，并将train/<commit_id>上传至该目录中。结合准备数据、准备权重、准备代码，将数据集、原始权重、代码文件都上传至OBS后，OBS桶的目录结构如下。 obs://standard-qwenvl-7b ├── training_data

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912） > 准备工作
GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

--workers 8 若发生如下“np.float”报错，按照报错提示修改为“float”即可。图1 预处理数据报错数据预处理完成标识。图2 数据预处理完成新建data目录并移动处理好的数据。 mkdir data mv meg-gpt2* ./data mv gpt2* ./data

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源使用
训练作业进程被kill - AI开发平台ModelArts

在解压大量文件可能会出现此情况并造成节点重启。可以适当在解压大量文件时，加入sleep。比如每解压1w个文件，就停止1s。存储限制根据规格情况合理使用数据盘，数据盘大小请参考训练环境中不同规格资源大小。 CPU过载减少线程数。排查办法根据错误信息判断，报错原因来源于用户代码。您可以通过以下两种方式排查：

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
推理部署使用场景 - AI开发平台ModelArts

Service，并且提供在线的测试UI与监控功能，部署成功的在线服务，将为用户提供一个可调用的API。将模型部署为批量推理服务批量服务可对批量数据进行推理，完成数据处理后自动停止。图2 不同类型的推理作业使用场景父主题：使用ModelArts Standard部署模型并推理预测

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测
Lite Server资源配置流程 - AI开发平台ModelArts

件环境时需要Server服务器能够访问网络，因此需要先完成网络配置。 2 配置Lite Server存储 Server资源需要挂载数据盘用于存储数据文件，当前支持SFS、OBS、EVS三种云存储服务，提供了多种场景下的存储解决方案。 3 配置Lite Server软件环境不同镜像中预安装的软件不同，您通过Lite

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置
创建训练作业版本 - AI开发平台ModelArts

String 训练作业需要的数据集OBS路径URL，默认为空。如：“/usr/data/”。不可与data_source或者dataset_id/dataset_version_id同时出现，但必须有其一。 dataset_id 否 String 训练作业的数据集ID。应与datase

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
SD3基于Lite Server适配PyTorch NPU的训练指导（6.3.912） - AI开发平台ModelArts

享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。 SSH登录机器后，检查NPU卡状态。运行如下命令，返回NPU设备信息。 npu-smi info

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
查看训练作业日志 - AI开发平台ModelArts

目录下执行上述ma-pre-start脚本，使用该机制可以更新容器镜像内安装的Ascend RUN包，或者设置一些训练运行时额外需要的全局环境变量。如何查看训练作业日志在训练作业详情页，训练日志窗口提供日志预览、日志下载、日志中搜索关键字、系统日志过滤能力。预览系统日志窗口提供训练日

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
自动学习 - AI开发平台ModelArts
自动学习 - AI开发平台ModelArts

自动学习准备数据模型训练部署上线模型发布

 帮助中心 > AI开发平台ModelArts > 故障排除
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

|── data # 预处理后数据 |── pretrain # 预训练加载的数据 |── finetune # 微调加载的数据 |──converted_weights #

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

|── data # 预处理后数据 |── pretrain # 预训练加载的数据 |── finetune # 微调加载的数据 |──converted_weights #

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
使用MaaS压缩模型 - AI开发平台ModelArts

（PTQ）方法，W8A8可实现8-bit权重、8-bit激活（W8A8）量化，引入平滑因子来平滑激活异常值，将量化难度从较难量化的激活转移到容易量化的权重上。 AWQ-W4A16：AWQ是一种大模型低比特权重的训练后量化（PTQ）方法，W4A16可实现4-bit权重、16-bit

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
发布分享 - AI开发平台ModelArts
发布分享 - AI开发平台ModelArts

发布分享发布免费算法发布免费模型发布数据发布Notebook 父主题： AI Gallery（旧版）

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版）
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

|── data # 预处理后数据 |── pretrain # 预训练加载的数据 |── finetune # 微调加载的数据 |──converted_weights #

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作
创建训练作业 - AI开发平台ModelArts

dataset_id 否 String 训练作业的数据集ID，可参考数据管理获取。需要与dataset_version_id同时出现，但是不可与inputs同时出现。 dataset_version_id 否 String 训练作业的数据集版本ID，可参考数据管理获取。需要与dataset_id

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
IAM - AI开发平台ModelArts
IAM - AI开发平台ModelArts

控制台功能依赖服务需配置角色/策略数据管理（数据集/ 数据标注/数据处理）对象存储服务OBS OBS Administrator 数据湖探索DLI DLI FullAccess MapReduce服务MRS MRS Administrator 数据仓库服务GaussDB(DWS)

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 权限控制方式
准备镜像环境 - AI开发平台ModelArts

享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。 SSH登录机器后，检查NPU卡状态。运行如下命令，返回NPU设备信息。 npu-smi info

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理 > SD1.5&SDXL Kohya框架基于DevServer适配PyTorch NPU训练指导（6.3.908）
ModelArts Standard准备工作 - AI开发平台ModelArts

ModelArts Standard准备工作配置ModelArts Standard访问授权创建并管理工作空间创建OBS桶用于ModelArts存储数据

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard）
日志提示"Permission denied" - AI开发平台ModelArts

directory 原因分析出现该问题的可能原因如下： [Errno 13]Permission denied: '/xxx/xxxx' 上传数据时文件所属与文件权限未修改，导致训练作业以work用户组访问时没有权限了。在代码目录中的.sh复制到容器之后，需要添加“x”可执行权限。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 权限问题
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

|──ascendcloud_patch/ # patch补丁包 |──benchmark/ #工具包，存放数据集及基线数据 |──trainer.py # 训练启动脚本 |──performance

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 准备工作

总条数： 1683

上一页
1
...
70
71
72
...
85
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备代码 - AI开发平台ModelArts

GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

训练作业进程被kill - AI开发平台ModelArts

推理部署使用场景 - AI开发平台ModelArts

Lite Server资源配置流程 - AI开发平台ModelArts

创建训练作业版本 - AI开发平台ModelArts

SD3基于Lite Server适配PyTorch NPU的训练指导（6.3.912） - AI开发平台ModelArts

查看训练作业日志 - AI开发平台ModelArts

自动学习 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

使用MaaS压缩模型 - AI开发平台ModelArts

发布分享 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

创建训练作业 - AI开发平台ModelArts

IAM - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

ModelArts Standard准备工作 - AI开发平台ModelArts

日志提示"Permission denied" - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线