搜索_华为云

在Lite Cluster资源池上使用ranktable路由规划完成Pytorch NPU分布式训练 - AI开发平台ModelArts

单击“编辑”，查看高级配置的“plugins”参数下是否有“{"name":"cabinet"}”，如图2所示。图2 Volcano调度器的高级配置是，则执行2。否，则在高级配置的“plugins”参数下添加“{"name":"cabinet"}”，单击下方的“安装”使Volcano调度器更新配置，完成滚动重启。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
InternVL2&2.5系列模型基于Lite Server适配PyTorch NPU训练指导（6.5.901) - AI开发平台ModelArts

如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载。请先正常安装固件和驱动，或释放被挂载的NPU。检查是否安装docker。 docker -v #检查docker是否安装如尚未安装，运行以下命令安装docker。 yum install -y

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
在ModelArts中进行团队标注时，为什么团队成员收不到邮件？ - AI开发平台ModelArts

只有当创建团队标注任务时，标注人员才会收到邮件。创建标注团队及添加标注团队的成员并不会发送邮件。请确保您的邮箱已完成配置且配置无误。可参考管理成员，完成邮箱配置。团队成员自检其邮箱是否有拦截设置。父主题： Standard数据准备

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据准备
管理Lite Cluster节点池 - AI开发平台ModelArts

点池时不支持删除。查看节点池的存储配置在节点池管理的更新页面，可以查看该节点池配置的系统盘、容器盘或数据盘的磁盘类型、大小、数量、写入模式、容器引擎空间大小、挂载路径磁盘配置等参数。在Lite资源池的扩缩容页面，也可以查看节点池的存储配置信息。查找搜索节点池在节点池管理

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
日志提示“errorMessage:The specified key does not exist” - AI开发平台ModelArts

在创建训练作业前，推荐您先使用ModelArts开发环境调试训练代码，避免代码迁移过程中的错误。直接使用线上notebook环境调试请参考使用JupyterLab开发模型。配置本地IDE（Pycharm或者VSCode）联接云上环境调试请参考使用本地IDE开发模型。父主题： OBS操作相关故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
推理精度测试 - AI开发平台ModelArts

e-Models at Evaluation）。配置需要使用的NPU卡，例如：实际使用的是第1张和第2张卡，此处填写为“0,1”，以此类推。 export ASCEND_RT_VISIBLE_DEVICES=0,1 步骤一：配置精度测试环境精度评测可以在原先conda环境，进入到一个固定目录下，执行如下命令。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
工作空间管理权限 - AI开发平台ModelArts

lete modelarts:model:delete modelarts:tensorboard:delete modelarts:trainJob:delete modelarts:exemlProject:deletemodelarts:notebook:delete mo

帮助中心 > AI开发平台ModelArts > API参考 > 权限策略和授权项
查询训练作业日志 - AI开发平台ModelArts

查询训练作业日志功能介绍按行来查询训练作业日志详细信息。 URI GET /v1/{project_id}/training-jobs/{job_id}/versions/{version_id}/aom-log 参数说明如表1所示。表1 路径参数参数是否必选参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
在运行finetune_ds.sh 时遇到报错 - AI开发平台ModelArts

[type=int_from_float, input_value=15099494.4, input_type=float] 将deepspeed配置文件的 stage3_prefetch_bucket_size 参数值从 auto 改成整数15099494 父主题：常见错误原因和解决方法

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912） > 常见错误原因和解决方法
VS Code连接开发环境失败故障处理 - AI开发平台ModelArts

or directory”如何解决？报错“Host key verification failed.'或者'Port forwarding is disabled.”如何解决？报错“Failed to install the VS Code Server.”或“tar: Error

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境
使用AWQ量化 - AI开发平台ModelArts

containers: - image: ${image_name} # 推理镜像名称 imagePullPolicy: IfNotPresent name: ${container_name}

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
训练精度测试 - AI开发平台ModelArts

径，不填则使用工具自带基线配置，包含loss、score、mmlu_score、ceval_score基线值；默认基线配置样例如下：客户使用工具自带精度基线Yaml则需使用modellink_accuracy_baseline.yaml文件中默认配置，权重使用表1 模型权重中指

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.5.901） > 训练评测
创建数据集 - AI开发平台ModelArts

data_sources['path'] = "/obs-gaia-test/data/text/text-classification/" work_path = dict() work_path['type'] = 0 work_path['path'] = "/obs-gaia-test/data/output/work_path/"

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > 数据集管理
停止训练作业版本 - AI开发平台ModelArts

此接口为异步接口，作业状态请通过查询训练作业列表和查询训练作业版本详情接口获取。 URI POST /v1/{project_id}/training-jobs/{job_id}/versions/{version_id}/stop 参数说明如表1所示。表1 参数说明参数是否必选

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
在运行finetune_ds.sh 时遇到报错 - AI开发平台ModelArts

[type=int_from_float, input_value=15099494.4, input_type=float] 将deepspeed配置文件的 stage3_prefetch_bucket_size 参数值从 auto 改成整数15099494 父主题：常见错误原因和解决方法

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 常见错误原因和解决方法
上传文件夹至OBS - AI开发平台ModelArts

上传文件夹至OBS 示例代码在ModelArts Notebook平台，Session鉴权无需输入鉴权参数。其它平台的Session鉴权请参考Session鉴权。 1 2 3 from modelarts.session import Session session = Session()

帮助中心 > AI开发平台ModelArts > SDK参考 > OBS管理
解析Pascal VOC文件 - AI开发平台ModelArts

解析Pascal VOC文件解析xml文件支持本地和OBS，如果是OBS，需要Session信息。 PascalVoc.parse_xml(xml_file_path, session=None) 示例代码指定xml路径，通过调用parse_xml来解析获取xml文件的信息。

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > Manifest管理
ModelArts的Notebook有代理吗？如何关闭？ - AI开发平台ModelArts

ModelArts的Notebook有代理吗？如何关闭？ Notebook有代理。执行env|grep proxy命令查询Notebook代理。执行unset https_proxy unset http_proxy命令关闭代理。父主题： Standard Notebook

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
批量删除标签 - AI开发平台ModelArts

批量删除标签功能介绍批量删除标签。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI POST /v2/{project_id}/datasets/{dataset

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
删除处理任务 - AI开发平台ModelArts

删除处理任务功能介绍删除处理任务，支持删除“特征分析”任务和“数据处理”两大类任务。可通过指定路径参数“task_id”来删除某个具体任务。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）

总条数： 2910

上一页
1
...
84
85
86
...
146
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在Lite Cluster资源池上使用ranktable路由规划完成Pytorch NPU分布式训练 - AI开发平台ModelArts

InternVL2&2.5系列模型基于Lite Server适配PyTorch NPU训练指导（6.5.901) - AI开发平台ModelArts

在ModelArts中进行团队标注时，为什么团队成员收不到邮件？ - AI开发平台ModelArts

管理Lite Cluster节点池 - AI开发平台ModelArts

日志提示“errorMessage:The specified key does not exist” - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

工作空间管理权限 - AI开发平台ModelArts

查询训练作业日志 - AI开发平台ModelArts

在运行finetune_ds.sh 时遇到报错 - AI开发平台ModelArts

VS Code连接开发环境失败故障处理 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

训练精度测试 - AI开发平台ModelArts

创建数据集 - AI开发平台ModelArts

停止训练作业版本 - AI开发平台ModelArts

在运行finetune_ds.sh 时遇到报错 - AI开发平台ModelArts

上传文件夹至OBS - AI开发平台ModelArts

解析Pascal VOC文件 - AI开发平台ModelArts

ModelArts的Notebook有代理吗？如何关闭？ - AI开发平台ModelArts

批量删除标签 - AI开发平台ModelArts

删除处理任务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线