搜索_华为云

模型训练使用流程 - AI开发平台ModelArts

当训练数据可以直接使用，无需二次处理时，可以直接将数据上传至OBS桶。在创建训练作业时，训练的输入参数位置可以直接填写OBS桶路径。当训练数据集的数据未标注或者需要进一步的数据预处理，可以先将数据导入ModelArts数据管理模块进行数据预处理。在创建训练作业时，训练的输入参数位置可以选择数据管理模块的数据集。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
Notebook运行代码报错，在'/tmp'中到不到文件 - AI开发平台ModelArts

'home/ma-user/work/SR/RDN_train_base'] 图1 运行代码报错原因分析根据报错提示，需要排查是否将大量数据被保存在“/tmp”中。处理方法进入到“Terminal”界面。在“/tmp”目录下，执行命令du -sh *，查看该目录下的空间占用情况。 sh-4.3$cd /tmp

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 代码运行故障
订阅的模型一直处于等待同步状态 - AI开发平台ModelArts

您未被授权执行该操作。执行同步操作时报错：ModelArts.0108: 您未被授权执行该操作。订阅已过期。执行同步操作时报错：ModelArts.5055: 订阅已过期。处理方法在权限管理页面进行依赖服务的授权。完成委托授权请参考了解ModelArts权限配置。检查是否有OBS权限或者接口操作权限。订阅已过期，可以在AI

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
LoRA微调训练 - AI开发平台ModelArts

表示流水线并行中一个micro batch所处理的样本量。在流水线并行中，为了减少气泡时间，会将一个step的数据切分成多个micro batch。该值与TP和PP以及模型大小相关，可根据实际情况进行调整。 GBS 512 表示训练中所有机器一个step所处理的样本量。影响每一次训练迭代的时长。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.910）
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

表示流水线并行中一个micro batch所处理的样本量。在流水线并行中，为了减少气泡时间，会将一个step的数据切分成多个micro batch。该值与TP和PP以及模型大小相关，可根据实际情况进行调整。 GBS 512 表示训练中所有机器一个step所处理的样本量。影响每一次训练迭代的时长。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.909）
LoRA微调训练 - AI开发平台ModelArts

表示流水线并行中一个micro batch所处理的样本量。在流水线并行中，为了减少气泡时间，会将一个step的数据切分成多个micro batch。该值与TP和PP以及模型大小相关，可根据实际情况进行调整。 GBS 512 表示训练中所有机器一个step所处理的样本量。影响每一次训练迭代的时长。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.909）
Yaml配置文件参数配置说明 - AI开发平台ModelArts

则不会进行模型训练。 cutoff_len 4096 文本处理时的最大长度，此处为4096，用户可根据自己要求适配。 packing true 可选项。当选用静态数句长度时，可将不足于文本处理时的最大长度数据弥补到文本处理时的最大长度;当选用动态数句长度则去掉此参数。 deepspeed

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练脚本说明
GPU裸金属服务器更换NVIDIA驱动后执行nvidia-smi提示Failed to initialize NVML - AI开发平台ModelArts

（2）执行nvidia-smi失败，提示Failed to initialize NVML: Driver/library version mismatch 处理方法执行命令：lsmod | grep nvidia，查看内核中是否残留旧版nvidia，显示如下： nvidia_uvm

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
VS Code连接开发环境失败常见问题 - AI开发平台ModelArts

VS Code连接开发环境失败常见问题在ModelArts控制台界面上单击VS Code接入并在新界面单击打开，未弹出VS Code窗口在ModelArts控制台界面上单击VS Code接入并在新界面单击打开，VS Code打开后未进行远程连接 VS Code连接开发环境失败时的排查方法

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
什么是图像分类和物体检测？ - AI开发平台ModelArts

什么是图像分类和物体检测？图像分类是根据各自在图像信息中所反映的不同特征，把不同类别的目标区分开来的图像处理方法。它利用计算机对图像进行定量分析，把图像或图像中的每个像元或区域划归为若干个类别中的某一种，以代替人的视觉判读。简单的说就是识别一张图中是否是某类/状态/场景，适合图

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习 > 功能咨询
启动智能任务 - AI开发平台ModelArts

找到难例。 “预标注”表示选择用户模型管理里面的模型进行智能标注。 “自动分组”是指先使用聚类算法对未标注图片进行聚类，再根据聚类结果进行处理，可以分组打标或者清洗图片。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成S

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
重装的包与镜像装CUDA版本不匹配 - AI开发平台ModelArts

GPU,but CUDA is not enabled” 原因分析出现该问题的可能原因如下：新安装的包与镜像中带的CUDA版本不匹配。处理方法必现的问题，使用本地Pycharm远程连接Notebook调试安装。先远程登录到所选的镜像，使用“nvcc -V”查看目前镜像自带的CUDA版本。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
日志提示“Please upgrade numpy to >= xxx to use this pandas version” - AI开发平台ModelArts

to use this pandas version 原因分析出现该问题的可能原因如下： conda和pip包混装，有一些包卸载不掉。处理方法参考如下代码，三步走。先卸载numpy中可以卸载的组件。删除你环境中site-packages路径下的numpy文件夹。重新进行安装需要的版本。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
推理部署使用场景 - AI开发平台ModelArts

Service，并且提供在线的测试UI与监控功能，部署成功的在线服务，将为用户提供一个可调用的API。将模型部署为批量推理服务批量服务可对批量数据进行推理，完成数据处理后自动停止。图2 不同类型的推理作业使用场景父主题：使用ModelArts Standard部署模型并推理预测

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测
创建Standard专属资源池 - AI开发平台ModelArts

隔离的、由用户自主配置和管理的虚拟网络环境。为云服务器、云容器、云数据库等资源构建隔离的、用户自主配置和管理的虚拟网络环境，提升用户资源的安全性，简化用户的网络部署。登录ModelArts管理控制台，在左侧导航栏中选择“AI专属资源池 > 弹性集群Cluster”，默认进入“Standard资源池”页面。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理
批量服务输入/输出obs目录不存在或者权限不足 - AI开发平台ModelArts

3551：数据输入或者输出的obs目录不存在 ModelArts.3567：使用的数据输入或者输出obs目录存在，但是当前账号无权限访问处理方法 ModelArts.3551：到obs检查输入数据目录是否存在，如果不存在，请按照实际需要创建obs目录；如果检查发现目录存在，但依然报同样的错，可以提工单申请技术支持

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
克隆GitHub开源仓库文件到JupyterLab - AI开发平台ModelArts

输入有效的GitHub开源仓库地址 Clone仓库的过程中会将进度展示出来。图4 Clone仓库的过程 Clone仓库成功。图5 Clone仓库成功异常处理 Clone仓库失败。可能是网络原因问题。可以在JupyterLab的Terminal中通过执行git clone https://github

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发 > 上传文件至JupyterLab
【下线公告】华为云ModelArts旧版自动学习下线公告 - AI开发平台ModelArts

用户将无法再使用旧版自动学习的功能，且因旧版自动学习文件均存储于ModelArts统一管理账号下，用户无法找回旧版自动学习的作业记录。旧版自动学习如何升级到新版自动学习？请参考新版自动学习指导文档来体验新版自动学习。父主题：下线公告

 帮助中心 > AI开发平台ModelArts > 服务公告 > 下线公告
查询服务详情 - AI开发平台ModelArts

String 在线服务实例所在的子网的网络ID，服务自定义网络配置时返回。 security_group_id String 在线服务实例所在的安全组，服务自定义网络配置时返回。 status String 服务状态，取值包含： running：运行中，服务正常运行。 deployin

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
创建数据集 - AI开发平台ModelArts

MRS集群ID。可登录MRS控制台查看。 cluster_mode 否 String MRS集群运行模式。可选值如下： 0：普通集群 1：安全集群 cluster_name 否 String MRS集群名称。可登录MRS控制台查看。 database_name 否 String 导入表格数据集，数据库名字。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）

总条数： 913

上一页
1
...
35
36
37
...
46
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

模型训练使用流程 - AI开发平台ModelArts

Notebook运行代码报错，在'/tmp'中到不到文件 - AI开发平台ModelArts

订阅的模型一直处于等待同步状态 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

GPU裸金属服务器更换NVIDIA驱动后执行nvidia-smi提示Failed to initialize NVML - AI开发平台ModelArts

VS Code连接开发环境失败常见问题 - AI开发平台ModelArts

什么是图像分类和物体检测？ - AI开发平台ModelArts

启动智能任务 - AI开发平台ModelArts

重装的包与镜像装CUDA版本不匹配 - AI开发平台ModelArts

日志提示“Please upgrade numpy to >= xxx to use this pandas version” - AI开发平台ModelArts

推理部署使用场景 - AI开发平台ModelArts

创建Standard专属资源池 - AI开发平台ModelArts

批量服务输入/输出obs目录不存在或者权限不足 - AI开发平台ModelArts

克隆GitHub开源仓库文件到JupyterLab - AI开发平台ModelArts

【下线公告】华为云ModelArts旧版自动学习下线公告 - AI开发平台ModelArts

查询服务详情 - AI开发平台ModelArts

创建数据集 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线