搜索_华为云

附录：指令微调训练常见问题 - AI开发平台ModelArts

附录：指令微调训练常见问题问题1：在训练过程中遇到NPU out of memory 解决方法：将yaml文件中的per_device_train_batch_size调小，重新训练如未解决则执行下一步。替换深度学习训练加速的工具或增加zero等级，可参考各个模型深度学习训练加速框架的选择，如原使

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907）
AI Gallery使用流程 - AI开发平台ModelArts

Gallery提供了模型、数据集、AI应用等AI数字资产的共享，为高校科研机构、AI应用开发商、解决方案集成商、企业级/个人开发者等群体，提供安全、开放的共享及交易环节，加速AI资产的开发与落地，保障AI开发生态链上各参与方高效地实现各自的商业价值。使用流程本节主要介绍在AI Gallery中管理资产的整体流程。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
使用DCGM监控Lite Server资源 - AI开发平台ModelArts

xx为Grafana的所在宿主机的IP地址图1 Prometheus 在HTTP的URL输入框中输入Prometheus的IP地址和端口号，单击Save&Test：图2 IP地址和端口号至此，指标监控方案安装完成。指标监控效果展示如下：图3 指标监控效果这里使用的是Grafan

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理 > 监控Lite Server资源
精度调优前准备工作 - AI开发平台ModelArts

Parallelism）是大规模深度学习训练中常用的并行模式，它会在每个进程(设备)或模型并行组中维护完整的模型和参数，但在每个进程上或模型并行组中处理不同的数据。因此，数据并行非常适合大数据量的训练任务。 TP：张量并行也叫层内并行，通过将网络中的权重切分到不同的设备，从而降低单个设备的显存消耗，使

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
训练脚本说明 - AI开发平台ModelArts

训练脚本说明 yaml配置文件参数配置说明各个模型深度学习训练加速框架的选择模型NPU卡数取值表各个模型训练前文件替换父主题：主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907）
安全边界 - AI开发平台ModelArts
安全边界 - AI开发平台ModelArts

k8s的版本更新和漏洞修复虚拟机OS的版本生命周期维护 ModelArts推理平台自身的安全合规性容器应用服务加固模型运行环境的版本更新和漏洞定期修复客户侧资源的授权，访问控制保证应用的供应链安全，依赖和自身的安全性，安全扫描、审计和准入校验机制，保证制品源头的安全性权限配置和凭证下发权限最小化

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
在ModelArts上如何创建引用第三方依赖包的训练作业？ - AI开发平台ModelArts

在“代码目录”中创建一个命名为“pip-requirements.txt”的文件，并且在文件中写明依赖包的包名及其版本号，格式为“包名==版本号”。例如，“代码目录”对应的OBS路径下，包含模型文件，同时还存在“pip-requirements.txt”文件。“代码目录”的结构如下所示：

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
在ModelArts中物体检测标注时能否自定义标签？ - AI开发平台ModelArts

在ModelArts中物体检测标注时能否自定义标签？可以通过修改数据集给标签添加自定义属性来设置一些自定义的属性。图1 修改数据集父主题： Standard数据准备

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据准备
模型适配 - AI开发平台ModelArts
模型适配 - AI开发平台ModelArts

动态分档模型转换（可选）如果迁移的模型有多个shape档位的需求，可以通过如下方式对模型进行分档转换。动态分档是指将模型输入的某一维或者某几维设置为“动态”可变，但是需要提前设置可变维度的“档位”范围。即转换得到的模型能够在指定的动态轴上使用预设的几种shape（保证模型支持的shape），相

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 应用迁移
在ModelArts中智能标注完成后新加入数据需要重新训练吗？ - AI开发平台ModelArts

在ModelArts中智能标注完成后新加入数据需要重新训练吗？智能标注完成后，需要对标注结果进行确认。如果未确认标注结果，直接加入新数据，重新智能标注，会将待确认的数据和新加入的数据全部重新训练。如果确认标注结果后，再加入新数据，只重新训练标注新的数据。父主题： Standard数据准备

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据准备
模型的自定义镜像制作流程 - AI开发平台ModelArts

{"mnist_result": 7} （可选）健康检查接口如果在滚动升级时要求不中断业务，那么必须在config.json文件中配置健康检查的接口，供ModelArts调用，在config.json文件中配置。当业务可提供正常服务时，健康检查接口返回健康状态，否则返回异常状态。如果要实现无损滚动升级，必须配置健康检查接口。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
重置AppSecret - AI开发平台ModelArts

app_id String APP编号。 app_key String APP的key。 app_name String APP名称。 app_remark String APP描述，默认为空。不超过200个字符。 app_secret String APP密钥。 app_type String

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
如何在ModelArts的Notebook中配置Conda源？ - AI开发平台ModelArts

如何在ModelArts的Notebook中配置Conda源？用户可以在Notebook开发环境中自行安装开发依赖包，方便使用。常见的依赖安装支持pip和Conda，pip源已经配置好，可以直接使用安装，Conda源需要多一步配置。本章节介绍如何在Notebook开发环境中配置Conda源。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard镜像相关
删除AppCode - AI开发平台ModelArts
删除AppCode - AI开发平台ModelArts

删除AppCode 功能介绍删除指定API网关应用的指定的AppCode，只有APP的创建用户才可以删除AppCode，且只有共享/专享版APIG的APP才支持AppCode。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自

 帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
重置AppCode - AI开发平台ModelArts
重置AppCode - AI开发平台ModelArts

重置AppCode 功能介绍重置指定API网关应用的指定的AppCode，只有APP的创建用户才可以重置AppCode，且只有共享/专享版APIG的APP才支持AppCode。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自

 帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
在AOM控制台查看ModelArts所有监控指标 - AI开发平台ModelArts

物理专属池对应的资源池id。 pool_name 物理专属池对应的资源池name。 logical_pool_id 逻辑子池的id。 logical_pool_name 逻辑子池的name。 gpu_uuid 容器使用的GPU的UUID。 gpu_index 容器使用的GPU的索引。 gpu_type

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控
在ModelArts的Notebook中使用VS Code如何查看远端日志？ - AI开发平台ModelArts

在ModelArts的Notebook中使用VS Code如何查看远端日志？在VS Code环境中执行Ctrl+Shift+P 搜show logs 选择Remote Server。也可在如下截图的红框处切换至其他的Log 父主题： Standard Notebook

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
增加AppCode - AI开发平台ModelArts
增加AppCode - AI开发平台ModelArts

增加AppCode 功能介绍为指定API网关应用创建新的AppCode，只有APP的创建用户才可以创建AppCode，且只有共享/专享版APIG的APP才能创建AppCode。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自

 帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
pipeline代码适配 - AI开发平台ModelArts

完成模型初始化后，您需要将onnx模型推理的代码等价替换为对应的mindir模型推理接口。以vae_encoder模型为例，在pipeline代码中查找vae_encoder推理调用的地方，然后修改为对应的MindSpore Lite版本的推理接口模型。使用MindSpore Lite

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 应用迁移
Lite Server使用流程 - AI开发平台ModelArts

Server提供多样化的xPU裸金属服务器，赋予用户以root账号自主安装和部署AI框架、应用程序等第三方软件的能力，为用户打造专属的云上物理服务器环境。用户只需轻松选择服务器的规格、镜像、网络配置及密钥等基本信息，即可迅速创建弹性裸金属服务器，获取所需的云上物理资源，充分满足算法工程师在日常训练和推理工作中的需求。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server使用前必读

总条数： 1803

上一页
1
...
5
6
7
...
91
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

附录：指令微调训练常见问题 - AI开发平台ModelArts

AI Gallery使用流程 - AI开发平台ModelArts

使用DCGM监控Lite Server资源 - AI开发平台ModelArts

精度调优前准备工作 - AI开发平台ModelArts

训练脚本说明 - AI开发平台ModelArts

安全边界 - AI开发平台ModelArts

在ModelArts上如何创建引用第三方依赖包的训练作业？ - AI开发平台ModelArts

在ModelArts中物体检测标注时能否自定义标签？ - AI开发平台ModelArts

模型适配 - AI开发平台ModelArts

在ModelArts中智能标注完成后新加入数据需要重新训练吗？ - AI开发平台ModelArts

模型的自定义镜像制作流程 - AI开发平台ModelArts

重置AppSecret - AI开发平台ModelArts

如何在ModelArts的Notebook中配置Conda源？ - AI开发平台ModelArts

删除AppCode - AI开发平台ModelArts

重置AppCode - AI开发平台ModelArts

在AOM控制台查看ModelArts所有监控指标 - AI开发平台ModelArts

在ModelArts的Notebook中使用VS Code如何查看远端日志？ - AI开发平台ModelArts

增加AppCode - AI开发平台ModelArts

pipeline代码适配 - AI开发平台ModelArts

Lite Server使用流程 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线