搜索_华为云

创建Workflow数据集版本发布节点 - AI开发平台ModelArts

注任务进行版本发布，每个版本相当于数据的一个快照，可用于后续的数据溯源。主要应用场景如下：对于数据标注这种操作，可以在标注完成后自动帮助用户发布新的数据集版本，结合as_input的能力提供给后续节点使用。当模型训练需要更新数据时，可以使用数据集导入节点先导入新的数据，然后再通过该节点发布新的版本供后续节点使用。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
run.sh脚本测试ModelArts训练整体流程 - AI开发平台ModelArts

自定义容器在ModelArts上训练和本地训练的区别如下图：图1 本地与ModelArts上训练对比 ModelArts上进行训练比本地训练多了一步OBS和容器环境的数据迁移工作。增加了和OBS交互工作的整个训练流程如下：建议使用OBSutil作为和OBS交互的工具，如何在本机安

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > FAQ
日志提示“Please set the train_url to an empty obs directory” - AI开发平台ModelArts

the train_url to an empty obs directory”。原因分析对于不支持断点训练的模型，如果选择训练输出路径不是空目录，会出现该报错。处理方法对于不支持断点训练的模型，请您将模型的输出路径train_url设置为空目录。父主题：预置算法运行故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 预置算法运行故障
确认智能标注作业的数据难例 - AI开发平台ModelArts

其加入训练数据集中，使用此数据集训练模型，可得到精度更高的模型。首先，针对智能标注和采集筛选任务，难例的发现操作是系统自动执行的，无需人工介入，仅需针对标注后的数据进行确认和修改即可，提升数据管理和标注效率。其次，您可以基于难例的情况，补充类似数据，提升数据集的丰富性，进一步提升模型训练的精度。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过智能标注方式标注数据
使用自定义引擎在ModelArts Standard创建模型 - AI开发平台ModelArts

S模型包和文件大小需要满足以下规范： SWR镜像规范：镜像必须内置一个用户名为“ma-user”，组名为“ma-group”的普通用户，且必须确保该用户的uid=1000、gid=100。内置用户的dockerfile指令如下： groupadd -g 100 ma-group

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
使用大模型在ModelArts Standard创建模型部署在线服务 - AI开发平台ModelArts

部署、启动、升级和修改时，资源不足如何处理？图2 查看专属资源池磁盘信息创建模型使用大模型创建模型，选择从对象存储服务（OBS）中导入，需满足以下参数配置：采用自定义引擎，开启动态加载使用大模型要求用户使用自定义引擎，并开启动态加载的模式导入模型。用户可以制作自定义引擎

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
Cluster资源池节点故障如何定位 - AI开发平台ModelArts

NPU 链路 npu dcmi net异常。 NPU网络链接异常。可能是亚健康，建议先重启节点，如果重启节点后未恢复，发起维修流程。 NT_NPU_CARD_LOSE NPU 掉卡 NPU卡丢失。节点规格的NPU卡数和k8sNode中可调度卡数不一致。可能是亚健康，建议先重

 帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
Notebook自定义镜像故障基础排查 - AI开发平台ModelArts

当制作的自定义镜像使用出现故障时，请用户按照如下方法排查：用户自定义镜像没有ma-user用户及ma-group用户组；用户自定义镜像中/home/ma-user目录，属主和用户组不是ma-user和ma-group；用户自定义镜像必须满足用户目录/home/ma-user权限为750，不能为其他权限；

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 自定义镜像故障
查询模型runtime - AI开发平台ModelArts

查询模型runtime 功能介绍查询模型AI引擎以及runtime。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v1/{project_id}/mo

帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
查询训练作业参数列表 - AI开发平台ModelArts

功能介绍根据指定条件查询用户创建的训练作业参数。 URI GET /v1/{project_id}/training-job-configs 参数说明如表1所示。表1 参数说明参数是否必选参数类型说明 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业参数配置
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

/scripts/llama2/0_pl_pretrain_13b.sh 选择用户自己的专属资源池，以及规格与节点数。防止训练过程中出现内存溢出的情况，用户可参考表2进行配置。图2 选择资源池规格新增SFS Turbo挂载配置，并选择用户创建的SFS Turbo文件系统。云上挂载路径：输入镜像容器中的工作路径

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905）
委托授权ModelArts云服务使用SFS Turbo - AI开发平台ModelArts

新增委托授权操作SFS Turbo 登录ModelArts管理控制台，在左侧导航栏选择“权限管理”，进入“权限管理”页面。单击“添加授权”，进入“访问授权”配置页面，根据参数说明进行配置。 “授权对象类型”：根据需要选择"IAM子用户"、"联邦用户"、"委托用户"、"所有用户" “授权对象”：选择授权对象

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
查看训练作业事件 - AI开发平台ModelArts

查看训练作业事件训练作业的（从用户可看见训练作业开始）整个生命周期中，每一个关键事件点在系统后台均有记录，用户可随时在对应训练作业的详情页面进行查看。方便用户更清楚的了解训练作业运行过程，遇到任务异常时，更加准确的排查定位问题。当前支持的作业事件如下所示：训练作业创建成功训练作业创建失败报错：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
在ModelArts的Notebook中内置引擎不满足使用需要时，如何自定义引擎IPython Kernel？ - AI开发平台ModelArts

Python Kernel？使用场景当前Notebook默认内置的引擎环境不能满足用户诉求，用户可以新建一个conda env按需搭建自己的环境。本小节以搭建一个“python3.6.5和tensorflow1.2.0”的IPython Kernel为例进行展示。操作步骤创建conda

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
管理Lite Cluster节点池 - AI开发平台ModelArts

需注意，更新节点池配置时，高级配置仅对新增的节点生效，其中“存量节点标签及污点”、“存量节点资源标签”支持对存量节点同步改动（勾选对应的复选框）。节点池中更新的“资源标签”信息会同步到节点上。图2 更新节点池删除节点池当有多个节点池时，支持删除节点池，此时在操作列会显示“删除”按钮，单击“删除”后输入“DELETE”并单击“确定”即可。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
执行训练任务 - AI开发平台ModelArts

PPO强化学习目前仅限制支持于llama3系列 2、PPO训练暂不支持 ZeRO-3存在通信问题，如llama3-70B使用ZeRO-3暂不支持训练策略类型全参full，配置如下： finetuning_type: full lora，如dpo仅支持此策略；配置如下： finetuning_type:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910）
Standard数据管理 - AI开发平台ModelArts

Standard数据管理 ModelArts Standard数据管理提供了一套高效便捷的管理和标注数据框架。支持图片、文本、语音、视频等多种数据类型，涵盖图像分类、目标检测、音频分割、文本分类等多个标注场景，适用于计算机视觉、自然语言处理、音视频分析等AI项目场景。 ModelArts

帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
Notebook中快速使用MoXing - AI开发平台ModelArts

进入ModelArts，创建Notebook实例登录ModelArts管理控制台，在左侧菜单栏中选择“开发空间>Notebook”，进入“Notebook”管理页面。单击“创建”进入“创建Notebook”页面，参考创建Notebook实例填写信息并完成Notebook实例创建。当Notebook实例创建完成

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 在Notebook中使用Moxing命令
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

/scripts/llama2/0_pl_pretrain_13b.sh 选择用户自己的专属资源池，以及规格与节点数。防止训练过程中出现内存溢出的情况，用户可参考表2进行配置。图2 选择资源池规格新增SFS Turbo挂载配置，并选择用户创建的SFS Turbo文件系统。云上挂载路径：输入镜像容器中的工作路径

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906）
免费体验MaaS预置服务 - AI开发平台ModelArts

免费体验MaaS预置服务 ModelArts Studio大模型即服务平台给新用户分配了每个模型100万Tokens的免费调用额度，无需部署即可一键体验通义千问、ChatGLM、DeepSeek等预置模型服务。登录ModelArts管理控制台。在左侧导航栏中，选择“ModelArts

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）

总条数： 2327

上一页
1
...
70
71
72
...
117
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建Workflow数据集版本发布节点 - AI开发平台ModelArts

run.sh脚本测试ModelArts训练整体流程 - AI开发平台ModelArts

日志提示“Please set the train_url to an empty obs directory” - AI开发平台ModelArts

确认智能标注作业的数据难例 - AI开发平台ModelArts

使用自定义引擎在ModelArts Standard创建模型 - AI开发平台ModelArts

使用大模型在ModelArts Standard创建模型部署在线服务 - AI开发平台ModelArts

Cluster资源池节点故障如何定位 - AI开发平台ModelArts

Notebook自定义镜像故障基础排查 - AI开发平台ModelArts

查询模型runtime - AI开发平台ModelArts

查询训练作业参数列表 - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

委托授权ModelArts云服务使用SFS Turbo - AI开发平台ModelArts

查看训练作业事件 - AI开发平台ModelArts

在ModelArts的Notebook中内置引擎不满足使用需要时，如何自定义引擎IPython Kernel？ - AI开发平台ModelArts

管理Lite Cluster节点池 - AI开发平台ModelArts

执行训练任务 - AI开发平台ModelArts

Standard数据管理 - AI开发平台ModelArts

Notebook中快速使用MoXing - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

免费体验MaaS预置服务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线