搜索_华为云

准备Notebook（可选） - AI开发平台ModelArts

下，该目录下的内容在实例停止后会被保留。可以自定义磁盘空间，如果需要存储数据集、模型等大型文件，建议申请规格300GB+。存储支持在线按需扩容。图2 自定义存储配置使用Notebook将OBS数据导入云硬盘EVS 打开已创建的Notebook实例，选择Notebook的python-3

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.909） > 准备工作
查询Notebook实例详情 - AI开发平台ModelArts

MANAGED：托管，即资源在服务上。 DEDICATED：非托管，即资源在用户账号上，只有在category为EFS时支持。 status String EVS扩容状态，扩容时的状态为RESIZING，此时实例可以正常使用。表9 user 参数参数类型描述 domain domain object 账号domain信息

 帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
启动Notebook实例 - AI开发平台ModelArts

MANAGED：托管，即资源在服务上。 DEDICATED：非托管，即资源在用户账号上，只有在category为EFS时支持。 status String EVS扩容状态，扩容时的状态为RESIZING，此时实例可以正常使用。表10 user 参数参数类型描述 domain domain object 账号domain信息

 帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
增量模型训练 - AI开发平台ModelArts

增量模型训练什么是增量训练增量训练（Incremental Learning）是机器学习领域中的一种训练方法，它允许人工智能（AI）模型在已经学习了一定知识的基础上，增加新的训练数据到当前训练流程中，扩展当前模型的知识和能力，而不需要从头开始。增量训练不需要一次性存储所有的

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
停止Notebook实例 - AI开发平台ModelArts

MANAGED：托管，即资源在服务上。 DEDICATED：非托管，即资源在用户账号上，只有在category为EFS时支持。 status String EVS扩容状态，扩容时的状态为RESIZING，此时实例可以正常使用。表9 user 参数参数类型描述 domain domain object 账号domain信息

 帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
创建节点池 - AI开发平台ModelArts

name}/nodepools 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 pool_name 是 String 资源池名称。请求参数表2 请求Body参数参数是否必选参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
删除Notebook实例 - AI开发平台ModelArts

MANAGED：托管，即资源在服务上。 DEDICATED：非托管，即资源在用户账号上，只有在category为EFS时支持。 status String EVS扩容状态，扩容时的状态为RESIZING，此时实例可以正常使用。表9 user 参数参数类型描述 domain domain object 账号domain信息

 帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
读取文件报错，如何正确读取文件 - AI开发平台ModelArts

'/cache/data_url') 读取“json”文件，请您在代码中尝试如下方法： json.loads(mox.file.read(json_path, binary=True)) 使用“numpy.load”读取“npy”文件，请您在代码中尝试如下方法：使用MoXing API读取OBS中的文件 np

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
实时推理的部署及使用流程 - AI开发平台ModelArts

的认证方式可以搭配不同的访问通道、不同的传输协议）。图1 认证方式、访问通道、传输协议当前ModelArts支持访问在线服务的认证方式有以下方式（案例中均以HTTPS请求为例）： Token认证：Token具有时效性，有效期为24小时，需要使用同一个Token鉴权时，可以缓存起来，避免频繁调用。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

获取对应模型的权重文件，获取链接参考表1。权重文件下载有如下几种方式，但不仅限于以下方式：方法一：网页下载：通过单击表格中权重文件获取地址的访问链接，即可在模型主页的Files and Version中下载文件。方法二：huggingface-cli：huggingface-cli是

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.910） > 准备工作
自定义镜像导入模型部署上线调用API报错 - AI开发平台ModelArts

自定义镜像导入模型部署上线调用API报错部署上线调用API报错，排查项如下：确认配置文件模型的接口定义中有没有POST方法。确认配置文件里url是否有定义路径。例如：“/predictions/poetry”（默认为“/”）。确认API调用中body体中的调用路径是否拼接

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
附录：大模型推理常见问题 - AI开发平台ModelArts

附录：大模型推理常见问题问题1：在推理预测过程中遇到NPU out of memory 解决方法：调整推理服务启动时的显存利用率，将--gpu-memory-utilization的值调小。问题2：在推理预测过程中遇到ValueError:User-specified max_model_len

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.905）
附录：指令微调训练常见问题 - AI开发平台ModelArts

附录：指令微调训练常见问题问题1：在训练过程中遇到NPU out of memory 解决方法：将yaml文件中的per_device_train_batch_size调小，重新训练如未解决则执行下一步。替换深度学习训练加速的工具或增加zero等级，可参考各个模型深度学习训

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907）
附录：大模型推理常见问题 - AI开发平台ModelArts

附录：大模型推理常见问题问题1：在推理预测过程中遇到NPU out of memory 解决方法：调整推理服务启动时的显存利用率，将--gpu-memory-utilization的值调小。问题2：在推理预测过程中遇到ValueError:User-specified max_model_len

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906）
删除节点池 - AI开发平台ModelArts

{nodepool_name} 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 pool_name 是 String 资源池名称。 nodepool_name 是 String 节点池名称。

帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
示例：创建DDP分布式训练（PyTorch+GPU） - AI开发平台ModelArts

示例：创建DDP分布式训练（PyTorch+GPU）本文介绍三种使用训练作业来启动PyTorch DDP训练的方法及对应代码示例。使用PyTorch预置框架功能，通过mp.spawn命令启动使用自定义镜像功能通过torch.distributed.launch命令启动通过torch

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
查询指定节点池详情 - AI开发平台ModelArts

{nodepool_name} 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 pool_name 是 String 资源池名称。 nodepool_name 是 String 节点池名称。

帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
从DLI导入数据到ModelArts数据集 - AI开发平台ModelArts

从DLI导入数据到ModelArts数据集表格数据集支持从DLI导入数据。从DLI导入数据，用户需要选择DLI队列、数据库和表名称。所选择的表的schema(列名和类型)需与数据集一致，支持自动获取所选择表的schema。DLI的详细功能说明，请参考DLI用户指南。图1 DLI导入数据

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导入数据到ModelArts数据集
安装远端插件时不稳定，需尝试多次 - AI开发平台ModelArts

vsix文件拖动到远端Notebook中。右键单击该文件，选择Install Extension VSIX。方法二：设置远端默认安装的插件按照VS Code中设置远端默认安装的插件配置，即会在连接远端时自动安装，减少等待时间。方法三：VS Code官网排查方式https://code.visualstudio

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > VS Code使用技巧
附录：微调训练常见问题 - AI开发平台ModelArts

附录：微调训练常见问题问题1：在训练过程中遇到NPU out of memory 解决方法：容器内执行以下命令，指定NPU内存分配策略的环境变量，开启动态内存分配，即在需要时动态分配内存，可以提高内存利用率，减少OOM错误的发生。 export PYTORCH_NPU_ALLOC_CONF

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908）

总条数： 926

上一页
1
...
8
9
10
...
47
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备Notebook（可选） - AI开发平台ModelArts

查询Notebook实例详情 - AI开发平台ModelArts

启动Notebook实例 - AI开发平台ModelArts

增量模型训练 - AI开发平台ModelArts

停止Notebook实例 - AI开发平台ModelArts

创建节点池 - AI开发平台ModelArts

删除Notebook实例 - AI开发平台ModelArts

读取文件报错，如何正确读取文件 - AI开发平台ModelArts

实时推理的部署及使用流程 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

自定义镜像导入模型部署上线调用API报错 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

附录：指令微调训练常见问题 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

删除节点池 - AI开发平台ModelArts

示例：创建DDP分布式训练（PyTorch+GPU） - AI开发平台ModelArts

查询指定节点池详情 - AI开发平台ModelArts

从DLI导入数据到ModelArts数据集 - AI开发平台ModelArts

安装远端插件时不稳定，需尝试多次 - AI开发平台ModelArts

附录：微调训练常见问题 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线