搜索_华为云

创建训练作业界面无云存储名称和挂载路径排查思路 - AI开发平台ModelArts

问题现象创建训练作业界面没有云存储名称和挂载路径这两个选项。原因分析用户的专属资源池没有进行网络打通，或者用户没有创建过SFS。处理方法在专属资源池列表中，单击资源池“ID/名称”，进入详情页。单击右上角“配置NAS VPC”，检查是否开启了NAS VPC。详情页面的“NAS

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 专属资源池创建训练作业
训练作业找不到GPU - AI开发平台ModelArts

no CUDA-capable device is detected 原因分析根据错误信息判断，报错原因为训练作业运行程序读取不到GPU。处理方法根据报错提示，请您排查代码，是否已添加以下配置，设置该程序可见的GPU： os.environ['CUDA_VISIBLE_DEVICES']

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题
ModelArts SDK下载文件目标路径设置为文件名，部署服务时报错 - AI开发平台ModelArts

directory'). update products failed! 原因分析用户代码中设置的目标路径（local_path）有误。处理方法需要将local_path路径设置为文件夹且后缀必须以“/”结尾。父主题： API/SDK

帮助中心 > AI开发平台ModelArts > 故障排除 > API/SDK
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

在训练中，程序会自动执行对数据集预处理、权重转换、执行训练等操作，具体可通过训练启动脚本说明和参数配置、训练的数据集预处理说明、训练的权重转换说明了解其中的操作。训练完成后在SFS Turbo中保存训练的模型结果。（多机情况下，只有在rank_0节点进行数据预处理，权重转换等工作，所以原

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 准备工作
日志报错“DataFrame.dtypes for data must be int, float or bool” - AI开发平台ModelArts

be int, float or bool 原因分析出现该问题的可能原因如下：训练数据中出现了非int、float、bool类型数据。处理方法可参考如下代码，将错误列进行转换： from sklearn import preprocessing lbl = preprocessing

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
查看ModelArts相关审计日志 - AI开发平台ModelArts

查看ModelArts相关审计日志在您开启了云审计服务后，系统会记录ModelArts的相关操作，且控制台保存最近7天的操作记录。本节介绍如何在云审计服务管理控制台查看最近7天的操作记录。操作步骤登录云审计服务管理控制台。在管理控制台左上角单击图标，选择区域。在左侧导航栏

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用CTS审计ModelArts服务
下载代码目录失败 - AI开发平台ModelArts

object key failed: 'Contents' 图1 获取内容失败原因分析在创建训练作业时指定的代码目录不存在导致训练失败。处理方法请您根据报错原因排查创建训练作业时指定的代码目录，即OBS桶的路径是否正确。有两种方法判断是否存在。使用当前账户登录OBS管理控制

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
复制数据至容器中空间不足 - AI开发平台ModelArts

容器中。 OSError:[Errno 28] No space left on device 原因分析数据下载至容器的位置空间不足。处理方法请排查是否将数据下载至“/cache”目录下，GPU规格资源的每个节点会有一个“/cache”目录，空间大小为4TB。并确认该目录下

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
导入模型后部署服务，提示磁盘不足 - AI开发平台ModelArts

ModelArts部署使用的是容器化部署，容器运行时有空间大小限制，当用户的模型文件或者其他自定义文件，系统文件超过Docker size大小时，会提示镜像内空间不足。处理方法公共资源池容器Docker size的大小最大支持50G，专属资源池Docker size的大小最大支持50G。如果使用的是OBS

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
模型的自定义镜像制作流程 - AI开发平台ModelArts

优雅退出容器可能会导致在滚动升级的过程中业务概率中断。要保证容器优雅退出，从收到SIGTERM信号开始，业务需要将收到的请求全部处理完毕再结束，这个处理时长最多不超过90秒。例如run.sh如下所示： #!/bin/bash gunicorn_pid="" handle_sigterm()

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
ModelArts Standard数据管理相关计费FAQ - AI开发平台ModelArts

建议您前往OBS服务，了解OBS计费详情，创建相应的OBS桶用于存储ModelArts使用的数据。 ModelArts标注完样本集后，如何保证退出后不再产生计费？标注样本集本身不计费，数据集存储在OBS中，收取OBS的费用。建议您前往OBS控制台，删除存储的数据和OBS桶，即可停止收费。

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费FAQ
MindSpore Lite问题定位指南 - AI开发平台ModelArts

多数场景下的问题可以通过日志报错信息直接定位。如果日志的信息不能定位问题，您可以通过设置环境变量调整日志等级，打印更多调试日志。关于如何对MindSpore Lite遇到的问题进行定位与解决，请参见MindSpore Lite官网提供的问题定位指南。父主题：常见问题

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导 > 常见问题
创建模型失败，提示模型镜像构建任务超时，没有构建日志 - AI开发平台ModelArts

未能完成构建任务，构建超时中断，即会出现“Model image build task timed out”提示，不显示详细的构建日志。处理方法预先准备需要编译下载的依赖包，减少依赖包下载和编译的时间。可通过线下wheel包方式安装运行环境依赖。线下wheel包安装，需确保wheel包与模型文件放在同一目录。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
日志提示“errorMessage:The specified key does not exist” - AI开发平台ModelArts

exist. 原因分析出现该问题的可能原因如下：桶中的对象不存在，请检查OBS路径中的内容是否存在。具体错误码请参见OBS官方文档。处理方法检查OBS路径及内容格式是否正常。必现的问题，使用本地Pycharm远程连接Notebook调试。建议与总结在创建训练作业前，

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
日志提示“Out of bounds nanosecond timestamp” - AI开发平台ModelArts

nanosecond timestamp: 1-01-02 13:20:00 原因分析出现该问题的可能原因如下：时间值越界，请参考官方文档。处理方法校验时间数据，pandas以纳秒表示时间戳。最小时间：1677-09-22 00:12:43.145225 最大时间：2262-04-11

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

准备训练数据，可以用本案使用的数据集，也可以使用自己准备的数据集。准备镜像准备训练模型适用的容器镜像。训练预训练/微调介绍如何进行训练，包括训练数据处理、超参配置、训练任务、性能查看。父主题：主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912）
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

"num_turns": 3, "chat": { "turn_1": { "Human": "<|Human|>: 如何保障工作中遵循正确的安全准则？<eoh>\n", "Inner Thoughts": "<|Inner Thoughts|>:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
使用AI市场物体检测YOLOv3 - AI开发平台ModelArts

does not exist. The operation, 'images', does not exist in the graph。处理方法如果切分了数据集，需要删除推理代码中“Yolov3Service”类中的如下代码： self.model_inputs = {'images':

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
查询Notebook支持的有效规格列表 - AI开发平台ModelArts

用户项目ID，获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述 category 否 String 规格处理器类型。 CPU GPU ASCEND limit 否 Integer 每一页的数量，默认不限制。 offset 否 Integer 分页记录的起始位置偏移量，默认值0。

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

表示流水线并行中一个micro batch所处理的样本量。在流水线并行中，为了减少气泡时间，会将一个step的数据切分成多个micro batch。该值与TP和PP以及模型大小相关，可根据实际情况进行调整。 GBS 512 表示训练中所有机器一个step所处理的样本量。影响每一次训练迭代的时长。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.910）

总条数： 1628

上一页
1
...
62
63
64
...
82
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建训练作业界面无云存储名称和挂载路径排查思路 - AI开发平台ModelArts

训练作业找不到GPU - AI开发平台ModelArts

ModelArts SDK下载文件目标路径设置为文件名，部署服务时报错 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

日志报错“DataFrame.dtypes for data must be int, float or bool” - AI开发平台ModelArts

查看ModelArts相关审计日志 - AI开发平台ModelArts

下载代码目录失败 - AI开发平台ModelArts

复制数据至容器中空间不足 - AI开发平台ModelArts

导入模型后部署服务，提示磁盘不足 - AI开发平台ModelArts

模型的自定义镜像制作流程 - AI开发平台ModelArts

ModelArts Standard数据管理相关计费FAQ - AI开发平台ModelArts

MindSpore Lite问题定位指南 - AI开发平台ModelArts

创建模型失败，提示模型镜像构建任务超时，没有构建日志 - AI开发平台ModelArts

日志提示“errorMessage:The specified key does not exist” - AI开发平台ModelArts

日志提示“Out of bounds nanosecond timestamp” - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

使用AI市场物体检测YOLOv3 - AI开发平台ModelArts

查询Notebook支持的有效规格列表 - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线