搜索_华为云

超过最大递归深度导致训练作业失败 - AI开发平台ModelArts

RuntimeError: maximum recursion depth exceeded in __instancecheck__ 原因分析递归深度超过了Python默认的递归深度，导致训练失败。处理方法如果超过最大递归深度，建议您在启动文件中增大递归调用深度，具体操作如下： import sys

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
训练作业卡死检测 - AI开发平台ModelArts

及时发现，就会导致无法及时释放资源，从而造成极大的资源浪费。为了节省训练资源成本，提高使用体验，ModelArts提供了卡死检测功能，能自动识别作业是否卡死，并在日志详情界面上展示，同时能配置通知及时提醒用户作业卡死。检测规则卡死检测主要是通过监控作业进程的状态和资源利用率来

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
自如何获取ModelArts训练容器中的文件实际路径？ - AI开发平台ModelArts

自如何获取ModelArts训练容器中的文件实际路径？如果容器中的文件实际路径不清楚，可以使用Python获取当前文件路径的方法获取。 os.getcwd() #获取文件当前工作目录路径（绝对路径） os.path.realpath(__ file __) #获得文件所在的路径（绝对路径）

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
VS Code一键连接Notebook - AI开发平台ModelArts

Code中打开要执行的代码文件，在执行代码之前需要选择合适的Python版本路径，单击下方默认的Python版本路径，此时在上方会出现该远程环境上所有的python版本，选择自己需要的版本即可。图14 选择Python版本对于打开的代码文件，单击run按钮，即可执行，可以在下

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过VS Code远程使用Notebook实例
VS Code手动连接Notebook - AI开发平台ModelArts

开发环境远程连接成功 Step3 安装云端Python插件在新打开的VS Code界面，单击左侧列表的Extensions选项，在搜索框中输入Python，在下拉列表中单击“Install”进行安装。图8 安装云端Python插件如果安装云端的Python插件不成功时，建议通过离线包的

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过VS Code远程使用Notebook实例
日志提示“RuntimeError: Cannot re-initialize CUDA in forked subprocess” - AI开发平台ModelArts

multiprocessing启动方式有误。处理方法可以参考官方文档，如下： """run.py:""" #!/usr/bin/env python import os import torch import torch.distributed as dist import torch

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题
启动推理服务 - AI开发平台ModelArts

启动推理服务本章节主要介绍大语言模型的推理服务启动方式，包括离线推理和在线推理2种方式。离线推理编辑一个python脚本，脚本内容如下，运行该脚本使用ascend-vllm进行模型离线推理。 from vllm import LLM, SamplingParams def

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务部署
如何在Notebook中安装外部库？ - AI开发平台ModelArts

ernel，并激活需要安装依赖的python环境。 cat /home/ma-user/README source /home/ma-user/anaconda3/bin/activate TensorFlow-1.8 如果需要在其他python环境里安装，请将命令中“TensorFlow-1

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
在ModelArts的Notebook中如何在代码中打印GPU使用信息？ - AI开发平台ModelArts

在ModelArts的Notebook中如何在代码中打印GPU使用信息？用户可通过shell命令或python命令查询GPU使用信息。使用shell命令执行nvidia-smi命令。依赖CUDA nvcc watch -n 1 nvidia-smi 执行gpustat命令。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
ModelArts SDK、OBS SDK和MoXing的区别是什么？ - AI开发平台ModelArts

Notebook中直接调用。 ModelArts SDK提供了OBS管理、训练管理、模型管理、服务管理等几个模块功能。目前，仅提供了Python语言的ModelArts SDK接口。详细指导文档：《ModelArts SDK参考》 OBS SDK OBS服务提供的SDK，对O

帮助中心 > AI开发平台ModelArts > 常见问题 > API/SDK
离线训练安装包准备说明 - AI开发平台ModelArts

若用户的机器或资源池无法连通网络，并无法git clone下载代码、安装python依赖包的情况下，用户则需要找到已联网的机器（本章节以Linux系统机器为例）提前下载资源，以实现离线安装。用户可遵循以下步骤：步骤一：资源下载 Python依赖包下载：进入 scripts/install.sh

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明参考
在ModelArts的Notebook中，如何使用昇腾多卡进行调试？ - AI开发平台ModelArts

在ModelArts的Notebook中，如何使用昇腾多卡进行调试？昇腾多卡训练任务是多进程多卡模式，跑几卡需要起几个python进程。昇腾底层会读取环境变量：RANK_TABLE_FILE，开发环境已经设置，用户无需关注。比如跑八卡，可以如下片段代码： export RANK_SIZE=8

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
如何处理使用opencv.imshow造成的内核崩溃？ - AI开发平台ModelArts

而matplotlib不存在这个问题。解决方法参考如下示例进行图片显示。注意opencv加载的是BGR格式，而matplotlib显示的是RGB格式。 Python语言： 1 2 3 4 5 6 from matplotlib import pyplot as plt import cv2 img

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 代码运行故障
AIGC工具tailor使用指导 - AI开发平台ModelArts

安装命令： pip install tailor-0.3.4-py3-none-any.whl 使用指导 tailor支持“命令行”和“Python API”两种方式使用。命令行方式命令行运行示例： tailor --model_path="./resnet50-v2-7.onnx"--config_path="

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
在ModelArts上如何创建引用第三方依赖包的训练作业？ - AI开发平台ModelArts

包。在训练代码目录下放置“pip-requirements.txt”文件后，在训练启动文件被执行前系统会执行如下命令，以安装用户指定的Python Packages。 pip install -r pip-requirements.txt 仅使用预置框架创建的训练作业支持在训练模型时引用依赖包。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
使用ModelArts Standard一键完成商超商品识别模型部署 - AI开发平台ModelArts

使用ModelArts Standard一键完成商超商品识别模型部署 ModelArts的AI Gallery中提供了大量免费的模型供用户一键部署，进行AI体验学习。本文以“商超商品识别”模型为例，完成从AI Gallery订阅模型，到ModelArts一键部署为在线服务的免费体验过程。

帮助中心 > AI开发平台ModelArts > 快速入门
使用ModelArts Standard一键完成商超商品识别模型部署 - AI开发平台ModelArts

使用ModelArts Standard一键完成商超商品识别模型部署 ModelArts的AI Gallery中提供了大量免费的模型供用户一键部署，进行AI体验学习。本文以“商超商品识别”模型为例，完成从AI Gallery订阅模型，到ModelArts一键部署为在线服务的免费体验过程。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
使用自定义镜像创建Notebook后打开没有kernel - AI开发平台ModelArts

问题现象使用自定义镜像创建实例启动后，打开JupyterLab>新建Notebook，选不到kernel。原因分析自定义镜像的python环境没有注册。解决方案在Terminal里执行命令排查实例存在几个Conda环境。 conda env list 执行如下命令分别

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 自定义镜像故障
ModelArts的Notebook是否支持Keras引擎？ - AI开发平台ModelArts

ModelArts的Notebook是否支持Keras引擎？开发环境中的Notebook支持。训练作业和模型部署（即推理）暂时不支持。 Keras是一个用Python编写的高级神经网络API，它能够以TensorFlow、CNTK或者Theano作为后端运行。Notebook开发环境支持“tf.keras”。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
在ModelArts的Notebook中内置引擎不满足使用需要时，如何自定义引擎IPython Kernel？ - AI开发平台ModelArts

"language": "python" } 按需添加env字段的值，可参考下述配置。其中，PATH中增加了该虚拟环境python包所在路径： { "argv": [ "/home/ma-user/anaconda3/envs/my-env/bin/python3", "-m"

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook

总条数： 592

上一页
1
2
3
4
5
...
30
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

超过最大递归深度导致训练作业失败 - AI开发平台ModelArts

训练作业卡死检测 - AI开发平台ModelArts

自如何获取ModelArts训练容器中的文件实际路径？ - AI开发平台ModelArts

VS Code一键连接Notebook - AI开发平台ModelArts

VS Code手动连接Notebook - AI开发平台ModelArts

日志提示“RuntimeError: Cannot re-initialize CUDA in forked subprocess” - AI开发平台ModelArts

启动推理服务 - AI开发平台ModelArts

如何在Notebook中安装外部库？ - AI开发平台ModelArts

在ModelArts的Notebook中如何在代码中打印GPU使用信息？ - AI开发平台ModelArts

ModelArts SDK、OBS SDK和MoXing的区别是什么？ - AI开发平台ModelArts

离线训练安装包准备说明 - AI开发平台ModelArts

在ModelArts的Notebook中，如何使用昇腾多卡进行调试？ - AI开发平台ModelArts

如何处理使用opencv.imshow造成的内核崩溃？ - AI开发平台ModelArts

AIGC工具tailor使用指导 - AI开发平台ModelArts

在ModelArts上如何创建引用第三方依赖包的训练作业？ - AI开发平台ModelArts

使用ModelArts Standard一键完成商超商品识别模型部署 - AI开发平台ModelArts

使用ModelArts Standard一键完成商超商品识别模型部署 - AI开发平台ModelArts

使用自定义镜像创建Notebook后打开没有kernel - AI开发平台ModelArts

ModelArts的Notebook是否支持Keras引擎？ - AI开发平台ModelArts

在ModelArts的Notebook中内置引擎不满足使用需要时，如何自定义引擎IPython Kernel？ - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线