搜索_华为云

BF16和FP16说明 - AI开发平台ModelArts

下溢，从而提供更好的稳定性和可靠性，在大模型训练和推理以及权重存储方面更受欢迎。 FP16：用于深度学习训练和推理过程中，可以加速计算并减少内存的占用，对模型准确性的影响在大多数情况下较小。与BF16相比在处理非常大或非常小的数值时遇到困难，导致数值的精度损失。综上所述，BF1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 训练脚本说明
BF16和FP16说明 - AI开发平台ModelArts

下溢，从而提供更好的稳定性和可靠性，在大模型训练和推理以及权重存储方面更受欢迎。 FP16：用于深度学习训练和推理过程中，可以加速计算并减少内存的占用，对模型准确性的影响在大多数情况下较小。与BF16相比在处理非常大或非常小的数值时遇到困难，导致数值的精度损失。综上所述，BF1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 训练脚本说明
BF16和FP16说明 - AI开发平台ModelArts

下溢，从而提供更好的稳定性和可靠性，在大模型训练和推理以及权重存储方面更受欢迎。 FP16：用于深度学习训练和推理过程中，可以加速计算并减少内存的占用，对模型准确性的影响在大多数情况下较小。与BF16相比在处理非常大或非常小的数值时遇到困难，导致数值的精度损失。综上所述，BF1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.909） > 训练脚本说明
BF16和FP16说明 - AI开发平台ModelArts

下溢，从而提供更好的稳定性和可靠性，在大模型训练和推理以及权重存储方面更受欢迎。 FP16：用于深度学习训练和推理过程中，可以加速计算并减少内存的占用，对模型准确性的影响在大多数情况下较小。与BF16相比在处理非常大或非常小的数值时遇到困难，导致数值的精度损失。综上所述，BF1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练脚本说明
重试/停止/运行Workflow节点 - AI开发平台ModelArts

动工作流。在当前节点的运行状况页面，单击“重试”。在重试之前您也可以前往权限管理页面修改配置，节点重试启动后新修改的配置信息可以在当前执行中立即生效。停止单击指定节点查看详情，可以对运行中的节点进行停止操作。继续运行对于单个节点中设置了需要运行中配置的参数时，节点运行会处

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 管理Workflow
构建条件节点控制分支执行 - AI开发平台ModelArts

主要用于执行流程的条件分支选择，可以简单的进行数值比较来控制执行流程，也可以根据节点输出的metric相关信息决定后续的执行流程。主要应用场景如下：可以用于需要根据不同的输入值来决定后续执行流程的场景。例如：需要根据训练节点输出的精度信息来决定是重新训练还是进行模型的注册操作时可以使用该节点来实现流程的控制。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 构建Workflow多分支运行场景
Standard资源池节点故障定位 - AI开发平台ModelArts

通过nvidia-smi -a查询到存在Pending Page Blacklist为Yes的记录，或多比特Register File大于0。对于Ampere架构的GPU，存在以下场景：存在不可纠正的SRAM错误。存在Remapping Failure记录。 dmsg中存在Xid 95事件。

帮助中心 > AI开发平台ModelArts > 故障排除 > 资源池
在ModelArts中如何将图片划分到验证集或者训练集？ - AI开发平台ModelArts

验证集，不支持指定。切分比例的指定：在发布数据集时，仅“图像分类”、“物体检测”、“文本分类”和“声音分类”类型数据集支持进行数据切分功能。一般默认不启用该功能。启用后，需设置对应的训练验证比例。输入“训练集比例”，数值只能是0~1区间内的数。设置好“训练集比例”后，“验

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据准备
使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

识别出此图片的数字是“2”。本案例中使用的MNIST是比较简单的用做demo的数据集，配套算法也是比较简单的用于教学的神经网络算法。这样的数据和算法生成的模型仅适用于教学模式，并不能应对复杂的预测场景。即生成的模型对预测图片有一定范围和要求，预测图片必须和训练集中的图片相似（黑底白字）才可能预测准确。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练
管理Lite Cluster节点池 - AI开发平台ModelArts

每个资源池至少需要有一个节点池，当只有一个节点池时不支持删除。查看节点池的存储配置在节点池管理的更新页面，可以查看该节点池配置的系统盘、容器盘或数据盘的磁盘类型、大小、数量、写入模式、容器引擎空间大小、挂载路径磁盘配置等参数。在Lite资源池的扩缩容页面，也可以查看节点池的存储配置信息。查找搜索节点池在节点

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
配置节点参数控制分支执行 - AI开发平台ModelArts

支持单节点通过参数配置或者获取训练输出的metric指标信息来决定执行是否跳过，同时可以基于此能力完成对执行流程的控制。应用场景主要用于存在多分支选择执行的复杂场景，在每次启动执行后需要根据相关配置信息决定哪些分支需要执行，哪些分支需要跳过，达到分支部分执行的目的，与ConditionStep的使用场景类

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 构建Workflow多分支运行场景
管理和查看数据处理任务 - AI开发平台ModelArts

管理和查看数据处理任务删除数据处理任务当已有的数据处理任务不再使用时，您可以删除数据处理任务。请注意，数据处理任务删除后不可恢复，请谨慎操作。处于“完成”、“失败”、“已停止”、“运行失败”、“部署中”状态的训练作业，您可以单击操作列的“删除”，删除对应的数据处理任务。查看数据处理任务详情

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 处理ModelArts数据集中的数据
Standard模型训练 - AI开发平台ModelArts

Standard模型训练提供容器化服务和计算资源管理能力，负责建立和管理机器学习训练工作负载所需的基础设施，减轻用户的负担，为用户提供灵活、稳定、易用和极致性能的深度学习训练环境。通过ModelArts Standard模型训练，用户可以专注于开发、训练和微调模型。 ModelArts

帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
删除算法 - AI开发平台ModelArts
删除算法 - AI开发平台ModelArts

用户项目ID。获取方法请参见获取项目ID和名称。 algorithm_id 是 String 算法ID。请求参数无响应参数无请求示例如下以修改uuid为2e5451fe-913f-4492-821a-2981031382f7的算法为例。 DELETE https://

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
启动停止边缘节点服务实例 - AI开发平台ModelArts

（响应消息头中X-Subject-Token的值）。表3 请求Body参数参数是否必选参数类型描述 status 是 String 服务状态，取值为： running：running为启动节点实例，只有处于stopped状态的节点实例支持启动。 stopped：stop

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
Cluster资源池节点故障如何定位 - AI开发平台ModelArts

掉卡 NPU卡丢失。节点规格的NPU卡数和k8sNode中可调度卡数不一致。可能是亚健康，建议先重启节点，如果重启节点后未恢复，发起维修流程。 NT_NPU_OTHER NPU 其他 NPU其他错误。检测到的其他NPU错误，通常为不可自纠正的异常，请联系技术人员支持。发起维修流程。

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
获取Workflow工作流节点度量信息 - AI开发平台ModelArts

用户项目ID。获取方法请参见获取项目ID和名称。 workflow_id 是 String 工作流的ID。 execution_id 是 String 工作流执行ID。 step_execution_id 是 String 工作流的一次执行中一个节点的执行ID。请求参数无响应参数

 帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

抽象处理。因此，与模型前向运算相关的所有源代码都被直接复制粘贴到同一个文件中，而不是调用某些抽象提取出的模块化库。Diffusers的这种设计原则的好处是代码简单易用、对代码贡献者友好。然而，这种反软件结构化的设计也有明显的缺点。由于缺乏统一的模块化库，对于昇腾适配而言变得更加复

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
修复Standard专属资源池故障节点 - AI开发平台ModelArts

如果是“按需计费”的资源池，您可单击操作列的“删除”，即可实现对单个节点的资源释放。如果想批量删除节点，勾选待删除节点名称前的复选框，然后单击名称上方的“删除”，即可实现对多个节点的资源释放。如果是“包年/包月”且资源未到期的资源池，您可单击操作列的“退订”，即可实现对单个节点的资源释放。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
在ModelArts的Notebook中JupyterLab的目录、Terminal的文件和OBS的文件之间的关系是什么？ - AI开发平台ModelArts

在ModelArts的Notebook中JupyterLab的目录、Terminal的文件和OBS的文件之间的关系是什么？ JupyterLab目录的文件与Terminal中work目录下的文件相同。即用户在Notebook中新建的，或者是从OBS目录中同步的文件。挂载OBS存储的Note

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook

总条数： 1984

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

BF16和FP16说明 - AI开发平台ModelArts

BF16和FP16说明 - AI开发平台ModelArts

BF16和FP16说明 - AI开发平台ModelArts

BF16和FP16说明 - AI开发平台ModelArts

重试/停止/运行Workflow节点 - AI开发平台ModelArts

构建条件节点控制分支执行 - AI开发平台ModelArts

Standard资源池节点故障定位 - AI开发平台ModelArts

在ModelArts中如何将图片划分到验证集或者训练集？ - AI开发平台ModelArts

使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

管理Lite Cluster节点池 - AI开发平台ModelArts

配置节点参数控制分支执行 - AI开发平台ModelArts

管理和查看数据处理任务 - AI开发平台ModelArts

Standard模型训练 - AI开发平台ModelArts

删除算法 - AI开发平台ModelArts

启动停止边缘节点服务实例 - AI开发平台ModelArts

Cluster资源池节点故障如何定位 - AI开发平台ModelArts

获取Workflow工作流节点度量信息 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

修复Standard专属资源池故障节点 - AI开发平台ModelArts

在ModelArts的Notebook中JupyterLab的目录、Terminal的文件和OBS的文件之间的关系是什么？ - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线