搜索_华为云

删除训练作业 - AI开发平台ModelArts

删除训练作业功能介绍删除训练作业。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI DELETE /v2/{project_id}/training-jobs/{training_job_id}

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
OOM导致训练作业失败 - AI开发平台ModelArts

initialized”。原因分析按照之前支撑的经验，出现该问题的可能原因如下：绝大部分都是确实是显存不够用。还有较少数原因是节点故障，跑到特定节点必现OOM，其他节点正常。处理方法如果是正常的OOM，就需要修改一些超参，释放一些不需要的tensor。修改网络参数，比如bat

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

软件包名称中的xxx表示时间戳。包含了本教程中使用到的模型训练代码、推理部署代码和推理评测代码。代码包具体说明请参见模型软件包结构说明。 AscendSpeed是用于模型并行计算的框架，其中包含了许多模型的输入处理方法。获取路径：Support-E 请联系您所在企业的华为方技术支持下载获取。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905） > 准备工作
创建预测分析自动学习项目时，对训练数据有什么要求？ - AI开发平台ModelArts

y-mm-dd等）的数据。如果某一列的取值只有一种，会被视为无效列。请确保标签列的取值至少有两个且无数据缺失。标签列指的是在训练任务中被指定为训练目标的列，即最终通过该数据集训练得到模型时的输出（预测项）。除标签列外数据集中至少还应包含两个有效特征列（列的取值至少有两个且数据缺失比例低于10%）。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习 > 准备数据
发布Workflow到ModelArts - AI开发平台ModelArts

Workflow中所有出现占位符相关的配置对象时，均需要设置默认值，或者直接使用固定的数据对象方法的执行依赖于Workflow对象的名称：当该名称的工作流不存在时，则创建新工作流并创建新执行；当该名称的工作流已存在时，则更新存在的工作流并基于新的工作流结构创建新的执行 workflow.release_and_run()

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 发布Workflow
创建资源池 - AI开发平台ModelArts

String 用户在cbc选择的折扣信息。 os.modelarts/service.console.url 否 String 订购订单支付完成后跳转的url地址。 os.modelarts/order.id 否 String 订单id，包周期资源池创建或者计费模式变更的时候该参数必需。

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
启动DevServer实例 - AI开发平台ModelArts

DELETING: 删除中； ERROR: 错误； RUNNING: 运行中； STARTING: 启动中； START_FAILED: 启动失败； STOPPED: 已停止； STOPPING: 停止中； STOP_FAILED: 停止失败： REBOOTING: 重启中： REBOOT_FAILED:

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

Snt9B硬件，为用户提供了常见主流开源大模型在ModelArts Standard上的预训练和全量微调方案。本方案目前仅适用于部分企业客户，完成本方案的部署，需要先联系您所在企业的华为方技术支持。提示：本文档适用于仅使用OBS对象存储服务（Object Storage Service）作为存储的方案，OBS

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.909）
配置Lite Cluster网络 - AI开发平台ModelArts

访问公网的目的。使用华为云账号登录CCE管理控制台。找到购买Cluster资源时选择的CCE集群，单击名称进入CCE集群详情页面，单击“节点管理”页签，在“节点”页签中单击需要登录的节点名称，跳转至弹性云服务器页面。图1 节点管理绑定弹性公网IP。若已有未绑定的弹性公网

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

略优化”的技巧来避免过大的策略更新，从而减少了训练过程中的不稳定性和样本复杂性。指令监督式微调(Self-training Fine-tuning)：是一种利用有标签数据进行模型训练的方法。它基于一个预先训练好的模型，通过调整模型的参数，使其能够更好地拟合特定任务的数据分布。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

Snt9B硬件，为用户提供了常见主流开源大模型在ModelArts Standard上的预训练和全量微调方案。本方案目前仅适用于部分企业客户，完成本方案的部署，需要先联系您所在企业的华为方技术支持。提示：本文档适用于OBS+SFS Turbo的数据存储方案，不适用于仅OBS存储方案。通过OBS对象存储服务（Object

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.909）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

略优化”的技巧来避免过大的策略更新，从而减少了训练过程中的不稳定性和样本复杂性。指令监督式微调(Self-training Fine-tuning)：是一种利用有标签数据进行模型训练的方法。它基于一个预先训练好的模型，通过调整模型的参数，使其能够更好地拟合特定任务的数据分布。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.911）
VS Code连接Notebook方式介绍 - AI开发平台ModelArts

(VS Code) 是一个流行的代码编辑器，它支持多种编程语言和开发环境。支持通过VS Code连接和使用Jupyter Notebook。当用户创建完成支持SSH的Notebook实例后，使用VS Code的开发者可以通过以下方式连接到开发环境中： VS Code一键连接Notebook（推荐）

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过VS Code远程使用Notebook实例
查询标注团队详情 - AI开发平台ModelArts

参数类型描述 create_time Long 标注团队的创建时间。 description String 标注团队的描述。 update_time Long 标注团队的更新时间。 worker_count Integer 标注团队的成员总数。 workforce_id String 标注团队ID。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
创建多机多卡的分布式训练（DistributedDataParallel） - AI开发平台ModelArts

创建分布式并行模型，每个进程都会有相同的模型和参数。创建数据分发Sampler，使每个进程加载一个mini batch中不同部分的数据。网络中相邻参数分桶，一般为神经网络模型中需要进行参数更新的每一层网络。每个进程前向传播并各自计算梯度。模型某一层的参数得到梯度后会马上进行通讯并进行梯度平均。各GPU更新模型参数。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
自动学习模型训练图片异常？ - AI开发平台ModelArts

自动学习模型训练图片异常？使用自动学习的图像分类或物体检测算法时，标注完成的数据在进行模型训练后，训练结果为图片异常。针对不同的异常情况说明及解决方案参见表1。表1 自动学习训练中图片异常情况说明（图像分类和物体检测）序号图片异常显示字段图片异常说明解决方案字段解决方案说明

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习 > 模型训练
更新训练作业描述 - AI开发平台ModelArts

description 否 String 对训练作业的描述，默认为“NULL”，字符串的长度限制为[0, 256]。响应参数无请求示例如下以修改uuid为3faf5c03-aaa1-4cbe-879d-24b05d997347的训练作业为例。修改成功后再调用查询训练作业接口即可看到description已被修改。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
创建团队标注验收任务 - AI开发平台ModelArts

创建团队标注验收任务功能介绍创建团队标注验收任务。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI POST /v2/{project_id}/datasets/

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

仅支持FP16和BF16数据类型推理。本案例仅支持在专属资源池上运行。专属资源池驱动版本要求23.0.6。适配的CANN版本是cann_8.0.rc3。支持的模型列表和权重文件本方案支持vLLM的v0.5.0版本。不同vLLM版本支持的模型列表有差异，具体如表1所示。表1 支持的模型列表和权重获取地址

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
创建APP - AI开发平台ModelArts
创建APP - AI开发平台ModelArts

app_type String APP类型。枚举值如下： APIC：该APP注册在roma connect网关上 APIG：该APP注册在共享API网关上 DEDICATE_APIG：该APP注册在专享API网关上 bounded_api_count Integer APP绑定API数量。

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理

总条数： 1691

上一页
1
...
76
77
78
...
85
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

删除训练作业 - AI开发平台ModelArts

OOM导致训练作业失败 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

创建预测分析自动学习项目时，对训练数据有什么要求？ - AI开发平台ModelArts

发布Workflow到ModelArts - AI开发平台ModelArts

创建资源池 - AI开发平台ModelArts

启动DevServer实例 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

配置Lite Cluster网络 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

VS Code连接Notebook方式介绍 - AI开发平台ModelArts

查询标注团队详情 - AI开发平台ModelArts

创建多机多卡的分布式训练（DistributedDataParallel） - AI开发平台ModelArts

自动学习模型训练图片异常？ - AI开发平台ModelArts

更新训练作业描述 - AI开发平台ModelArts

创建团队标注验收任务 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

创建APP - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线