搜索_华为云

附录：工作负载Pod异常问题和解决方法 - AI开发平台ModelArts

若重启后，还是会Pending，建议多重复重启几次。其他实例调度失败问题首先通过打印Pod日志信息。根据错误信息，可通过访问官网链接：工作负载异常：实例调度失败，进行查找。父主题：主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
在ModelArts Standard上运行GPU训练作业的场景介绍 - AI开发平台ModelArts

26:10:25 4机8卡Vnt1 10 07:08:44 表3 训练各步骤性能参考步骤说明预计时长镜像下载首次下载镜像的时间（25G）。 8分钟资源调度点创建训练作业开始到变成运行中的时间（资源充足、镜像已缓存）。 20秒训练列表页打开已有50条训练作业，单击训练模块后的时间。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
创建Workflow数据集版本发布节点 - AI开发平台ModelArts

数据集版本发布节点的输入列表是 ReleaseDatasetInput或者ReleaseDatasetInput的列表 outputs 数据集版本发布节点的输出列表是 ReleaseDatasetOutput或者ReleaseDatasetOutput的列表 title title信息，主要用于前端的名称展示

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
工作负载Pod异常 - AI开发平台ModelArts

若重启后，还是会Pending，建议多重复重启几次。其他实例调度失败问题首先通过打印Pod日志信息。根据错误信息，可通过访问官网链接：工作负载异常：实例调度失败，进行查找。如何删除config.yaml创建出的所有工作负载Pod 若要删除config.yaml创建出的所有工作负载Pod，需要先找到config

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 常见错误原因和解决方法
工作负载Pod异常 - AI开发平台ModelArts

若重启后，还是会Pending，建议多重复重启几次。其他实例调度失败问题首先通过打印Pod日志信息。根据错误信息，可通过访问官网链接：工作负载异常：实例调度失败，进行查找。如何删除config.yaml创建出的所有工作负载Pod 若要删除config.yaml创建出的所有工作负载Pod，需要先找到config

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.911） > 常见错误原因和解决方法
工作负载Pod异常 - AI开发平台ModelArts

若重启后，还是会Pending，建议多重复重启几次。其他实例调度失败问题首先通过打印Pod日志信息。根据错误信息，可通过访问官网链接：工作负载异常：实例调度失败，进行查找。如何删除config.yaml创建出的所有工作负载Pod 若要删除config.yaml创建出的所有工作负载Pod，需要先找到config

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.910） > 常见错误原因和解决方法
ECS中上传新镜像 - AI开发平台ModelArts

${dockerfile_image_name}：在step5中，使用Dockerfile创建的新镜像名称。 <镜像仓库地址>：可在SWR控制台上查询，容器镜像服务中登录指令末尾的域名即为镜像仓库地址。 <组织名称>：前面步骤中自己创建的组织名称。示例：ma-group <镜像名称>:<

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912） > 准备工作 > 准备镜像
ECS中上传新镜像 - AI开发平台ModelArts

${dockerfile_image_name}：在step5中，使用Dockerfile创建的新镜像名称。 <镜像仓库地址>：可在SWR控制台上查询，容器镜像服务中登录指令末尾的域名即为镜像仓库地址。 <组织名称>：前面步骤中自己创建的组织名称。示例：ma-group <镜像名称>:<

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 准备工作 > 准备镜像
创建算法 - AI开发平台ModelArts
创建算法 - AI开发平台ModelArts

否 String 指标名称。 mode 否 String 搜索方向。 - max指定时表示指标值越大越好； - min指定时表示指标值越小越好。 regex 否 String 指标正则表达式。表16 SearchParams 参数是否必选参数类型描述 name 否 String

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
创建Workflow数据集标注节点 - AI开发平台ModelArts

是 str inputs 数据集标注节点的输入列表是 LabelingInput或者LabelingInput的列表 outputs 数据集标注节点的输出列表是 LabelingOutput或者LabelingOutput的列表 properties 数据集标注相关的配置信息

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
Notebook无法执行代码，如何处理？ - AI开发平台ModelArts

会保留无法使用之前的所有变量空间。如果重新打开的Notebook仍然无法使用，则进入ModelArts管理控制台页面的Notebook列表页面，“停止”此无法使用的Notebook。待Notebook处于“停止”状态后，再单击“启动”，重新启动此Notebook，并打开Note

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 代码运行故障
创建Workflow数据集导入节点 - AI开发平台ModelArts

inputs 数据集导入节点的输入列表。是 DatasetImportInput或者DatasetImportInput的列表 outputs 数据集导入节点的输出列表。是 DatasetImportOutput或者DatasetImportOutput的列表 properties 数据集导入相关的配置信息。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
MoXing Framework功能介绍 - AI开发平台ModelArts

MoXing Framework功能介绍 MoXing Framework模块为MoXing提供基础公共组件，例如访问华为云的OBS服务，和具体的AI引擎解耦，在ModelArts支持的所有AI引擎(TensorFlow、MXNet、PyTorch、MindSpore等)下均可以使用。目前，提供的MoXing

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 在Notebook中使用Moxing命令
Step3 为用户配置ModelArts的委托访问授权 - AI开发平台ModelArts

项即可。自定义：如果对用户有更精细化的权限管理需求，可使用自定义模式灵活按需配置ModelArts创建的委托权限。可以根据实际需在权限列表中勾选要配置的权限。勾选“我已经详细阅读并同意《ModelArts服务声明》”，单击“创建”，完成委托授权配置。父主题：配置ModelArts基本使用权限

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践 > 配置ModelArts基本使用权限
在ModelArts上训练模型如何配置输入输出数据？ - AI开发平台ModelArts

在使用预置框架创建算法时，根据1中的代码参数设置定义的输入输出参数。训练数据是算法开发中必不可少的输入。“输入”参数建议设置为“data_url”，表示数据输入来源，也支持用户根据1的算法代码自定义代码参数。模型训练结束后，训练模型以及相关输出信息需保存在OBS路径。“输出”数据默认配置

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
附录：微调训练常见问题 - AI开发平台ModelArts

atch_size调小，重新训练如未解决则执行下一步。替换深度学习训练加速的工具或增加zero等级，可参考模型NPU卡数、梯度累积值取值表，如原使用Accelerator可替换为Deepspeed-ZeRO-1，Deepspeed-ZeRO-1替换为Deepspeed-ZeRO

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.908）
ModelArts SDK、OBS SDK和MoXing的区别是什么？ - AI开发平台ModelArts

h、MindSpore等)下均可以使用。 MoXing Framework模块提供了OBS中常见的数据文件操作，如读写、列举、创建文件夹、查询、移动、复制、删除等。在ModelArts Notebook中使用MoXing接口时，可直接调用接口，无需下载或安装SDK，使用限制比ModelArts

帮助中心 > AI开发平台ModelArts > 常见问题 > API/SDK
创建模型不同方式的场景介绍 - AI开发平台ModelArts

6的运行环境搭载的TensorFlow版本为1.8.0。 python3.6、python2.7、tf2.1-python3.7，表示该模型可同时在CPU或GPU运行。其他Runtime的值，如果后缀带cpu或gpu，表示该模型仅支持在CPU或GPU中运行。默认使用的Runtime为python2.7。默认启动命令：sh

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
自动模型优化介绍 - AI开发平台ModelArts

Function），下一个搜索点为采集函数的极大值点。相比网格搜索，贝叶斯优化会利用之前的评估结果，从而降低迭代次数、缩短搜索时间；缺点是不容易找到全局最优解。表1 贝叶斯优化的参数说明参数说明取值参考 num_samples 搜索尝试的超参组数 int，一般在10-20之间，值越大，搜索时间越长，效果越好

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 自动模型优化（AutoSearch）
昇腾云服务6.3.905版本说明 - AI开发平台ModelArts

zip 大模型推理框架代码包 AscendCloud-OPP-6.3.905-20240611170314.zip 算子依赖包支持的特性表1 本版本支持的特性说明分类软件包特性说明参考文档三方大模型，包名：AscendCloud-3rdLLM 支持如下模型适配PyTorch-NPU的训练。

帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明

总条数： 1878

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

附录：工作负载Pod异常问题和解决方法 - AI开发平台ModelArts

在ModelArts Standard上运行GPU训练作业的场景介绍 - AI开发平台ModelArts

创建Workflow数据集版本发布节点 - AI开发平台ModelArts

工作负载Pod异常 - AI开发平台ModelArts

工作负载Pod异常 - AI开发平台ModelArts

工作负载Pod异常 - AI开发平台ModelArts

ECS中上传新镜像 - AI开发平台ModelArts

ECS中上传新镜像 - AI开发平台ModelArts

创建算法 - AI开发平台ModelArts

创建Workflow数据集标注节点 - AI开发平台ModelArts

Notebook无法执行代码，如何处理？ - AI开发平台ModelArts

创建Workflow数据集导入节点 - AI开发平台ModelArts

MoXing Framework功能介绍 - AI开发平台ModelArts

Step3 为用户配置ModelArts的委托访问授权 - AI开发平台ModelArts

在ModelArts上训练模型如何配置输入输出数据？ - AI开发平台ModelArts

附录：微调训练常见问题 - AI开发平台ModelArts

ModelArts SDK、OBS SDK和MoXing的区别是什么？ - AI开发平台ModelArts

创建模型不同方式的场景介绍 - AI开发平台ModelArts

自动模型优化介绍 - AI开发平台ModelArts

昇腾云服务6.3.905版本说明 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线