搜索_华为云

华为云CCE集群纳管GPU裸金属服务器由于CloudInit导致纳管失败的解决方案 - AI开发平台ModelArts

userdata机制拉取cce-agent，但是在服务器上查看没有拉cce-agent的动作，理论上该动作是cloudinit中的脚本在创建时自动执行的，可能是由于安装脚本没有注入userdata或者注入了但未执行。经查看是由于userdata未执行，可能原因为服务器A制作镜像时没有清理残留目录导致，即：

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
查询训练作业参数详情 - AI开发平台ModelArts

String 自定义镜像训练作业的自定义镜像的SWR-URL。 user_command String 自定义镜像训练作业的自定义镜像的容器的启动命令。 spec_code String 训练作业资源规格。 gpu_type String 资源规格gpu的类型。 create_time

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业参数配置
使用CES监控Lite Server资源 - AI开发平台ModelArts

RestartAIProcess 提示当前故障很可能需要客户退出当前的AI任务并尝试重新执行在收集必要信息后，尝试退出当前AI任务并尝试重新执行退出当前AI任务以便重新执行 NPU: errorcode告警 NPUErrorCodeWarning 重要这里涵盖了大量重要及以上的NPU错误码，您可以根据这些错误码进一步定位错误原因

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理 > 监控Lite Server资源
报错“Bad owner or permissions on C:\Users\Administrator/.ssh/config”如何解决？ - AI开发平台ModelArts

ssh/config”如何解决？问题现象 VS Code连接开发环境时报错“Bad owner or permissions on C:\Users\Administrator/.ssh/config”。原因分析文件夹“.ssh”的权限不仅是Windows当前用户拥有，或者当前用户权限不足，故修改权限即可。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
GPU A系列裸金属服务器节点内如何进行NVLINK带宽性能测试方法？ - AI开发平台ModelArts

A系列裸金属服务器节点内如何进行NVLINK带宽性能测试方法？场景描述本文指导如何进行节点内NVLINK带宽性能测试，适用的环境为：Ant8或者Ant1 GPU裸金属服务器，且服务器中已经安装相关GPU驱动软件，以及Pytorch2.0。 GPU A系列裸金属服务器，单台服务

 帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
ModelArts CLI命令功能介绍 - AI开发平台ModelArts

yaml配置文件； -P表示鉴权文件中的某一组鉴权信息，默认是DEFAULT； -D表示是否开启debug模式（默认关闭），当开启debug模式后，命令的报错堆栈信息将会打印出来，否则只会打印报错信息； -h表示显示命令的帮助提示信息。命令说明表1 ma-cli支持的命令命令命令详情 configure

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
从OBS中导入模型文件创建模型 - AI开发平台ModelArts

使用容器化部署，导入的元模型有大小限制，详情请参见导入模型对于镜像大小限制。前提条件已完成模型开发和训练，使用的AI引擎为ModelArts支持的类型和版本，详细请参见推理支持的AI引擎。已完成训练的模型包，及其对应的推理代码和配置文件，且已上传至OBS目录中。确保您使用的OBS与ModelArts在同一区域。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
Notebook中已安装对应库，仍报错import numba ModuleNotFoundError: No module named 'numba' - AI开发平台ModelArts

然后使用DataArts执行此脚本的任务时提示没有这个库。原因分析客户创建了多个虚拟环境，numba库安装在了python-3.7.10中，如图1所示。图1 查询创建的虚拟环境解决方案在Terminal中执行conda deactivate命令退出当前虚拟环境，默认进入base环境。执行pip

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 环境配置故障
个人用户快速配置ModelArts访问权限 - AI开发平台ModelArts

选要配置的权限。然后勾选“我已经详细阅读并同意《ModelArts服务声明》”，单击“创建”，即可完成委托配置。查看授权的权限列表用户可以在“权限管理”页面的授权列表中，查看已经配置的委托授权内容。单击授权内容列的“查看权限”，可以查看该授权的权限详情。图4 查看权限图5

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
git插件密码失效如何解决？ - AI开发平台ModelArts

push文件时需要在授权方式框中输入token。解决方案使用token替换原先的密码授权方式，在git clone私有仓库和git push文件时，需要在授权方式框中输入token（见下图）；具体获取token方式请参考查看GitHub中Personal Access Token信息。父主题： JupyterLab插件故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > JupyterLab插件故障
Lite Server资源开通 - AI开发平台ModelArts

基础配置参数说明参数名称说明资源类型裸金属服务器是一款兼具弹性云服务器和物理机性能的计算类服务器，为您和您的企业提供专属的云上物理服务器。弹性云服务器是一种可随时自助获取、可弹性伸缩的云服务器，可帮助您打造可靠、安全、灵活、高效的应用环境，确保服务持久稳定运行，提升运维效率。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server）
如何减小本地或ECS构建镜像的目的镜像的大小？ - AI开发平台ModelArts

如何减小本地或ECS构建镜像的目的镜像的大小？减小目的镜像大小的最直接的办法就是选择尽可能小且符合自己诉求的镜像，比如您需要制作一个PyTorch2.1+Cuda12.2的镜像，官方如果没有提供对应的PyTorch或者Cuda版本的镜像，优选一个没有PyTorch环境或没有安装

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard镜像相关
在ModelArts的Notebook中，如何访问其他账号的OBS桶？ - AI开发平台ModelArts

在ModelArts的Notebook中，如何访问其他账号的OBS桶？创建Notebook时选择OBS存储，这种情况下只能访问到自己账号下的桶，无法访问到其他账号的OBS桶。如果需要在Notebook中，访问其他账号的OBS文件，前提是，需获取目标OBS桶的读写权限。首先，请

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
训练日志失败分析 - AI开发平台ModelArts

及对应的日志（底色标红部分）。图1 训练故障识别 ModelArts Standard会对部分常见训练错误给出分析建议，目前还不能识别所有错误，提供的失败可能原因仅供参考。针对分布式作业，只会显示当前节点的一个分析结果，作业的失败需要综合各个节点的失败原因做一个综合判断。常见训练问题定位思路如下：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
导出ModelArts数据集中的数据到AI Gallery - AI开发平台ModelArts

Gallery显示的资产名称。来源可选择“ModelArts”、“对象存储服务（OBS）”、“本地上传”。 ModelArts区域选择当前控制台所在的区域。 OBS区域选择与当前控制台一致的区域。存储位置用来存储发布的资产。数据类型当前数据集的数据类型。选择数据集

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导出ModelArts数据集中的数据
VS Code连接后长时间未操作，连接自动断开 - AI开发平台ModelArts

比如防火墙配置是2小时空闲就关闭连接，那客户端配置ServerAliveInterval小于2小时（比如1小时），就可以避免防火墙将连接断开。服务器端配置（Notebook当前已经配置，24h应该是长于防火墙的断连时间配置，该配置无需用户手工修改，写在这里仅是帮助理解ssh配置原理）配置文件路径：/home/ma-user/

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
使用PyCharm ToolKit创建并调试训练作业 - AI开发平台ModelArts

”停止训练作业。图6 停止作业查看训练日志查看训练日志有2种方式，在OBS查看和在PyCharm ToolKit工具中查看。在OBS查看训练日志提交训练作业时，系统将自动在您配置的OBS Path中，使用作业名称创建一个新的文件夹，用于存储训练输出的模型、日志和代码。例如“t

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 创建调试训练作业
如何安装第三方包，安装报错的处理方法 - AI开发平台ModelArts

当出现“xxx.whl”文件无法安装，在启动文件中添加如下代码，查看当前pip命令支持的文件名和版本。 import pip print(pip.pep425tags.get_supported()) 获取到支持的文件名和版本如下： [('cp36', 'cp36m', 'manylinux1_x86_64')

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
JupyterLab常用功能介绍 - AI开发平台ModelArts

Help JupyterLab工具自带的帮助参考。图15 ipynb文件菜单栏中的快捷键表4 ipynb文件菜单栏中的快捷键快捷键说明保存文件。添加新代码块。剪切选中的代码块。复制选中的代码块。粘贴选中的代码块。执行选中的代码块。终止kernel。重启kernel。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
MindSpore Lite问题定位指南 - AI开发平台ModelArts

可以先查看日志信息进行定位分析。多数场景下的问题可以通过日志报错信息直接定位。如果日志的信息不能定位问题，您可以通过设置环境变量调整日志等级，打印更多调试日志。关于如何对MindSpore Lite遇到的问题进行定位与解决，请参见MindSpore Lite官网提供的问题定位指南。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导 > 常见问题

总条数： 1765

上一页
1
...
10
11
12
...
89
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

华为云CCE集群纳管GPU裸金属服务器由于CloudInit导致纳管失败的解决方案 - AI开发平台ModelArts

查询训练作业参数详情 - AI开发平台ModelArts

使用CES监控Lite Server资源 - AI开发平台ModelArts

报错“Bad owner or permissions on C:\Users\Administrator/.ssh/config”如何解决？ - AI开发平台ModelArts

GPU A系列裸金属服务器节点内如何进行NVLINK带宽性能测试方法？ - AI开发平台ModelArts

ModelArts CLI命令功能介绍 - AI开发平台ModelArts

从OBS中导入模型文件创建模型 - AI开发平台ModelArts

Notebook中已安装对应库，仍报错import numba ModuleNotFoundError: No module named 'numba' - AI开发平台ModelArts

个人用户快速配置ModelArts访问权限 - AI开发平台ModelArts

git插件密码失效如何解决？ - AI开发平台ModelArts

Lite Server资源开通 - AI开发平台ModelArts

如何减小本地或ECS构建镜像的目的镜像的大小？ - AI开发平台ModelArts

在ModelArts的Notebook中，如何访问其他账号的OBS桶？ - AI开发平台ModelArts

训练日志失败分析 - AI开发平台ModelArts

导出ModelArts数据集中的数据到AI Gallery - AI开发平台ModelArts

VS Code连接后长时间未操作，连接自动断开 - AI开发平台ModelArts

使用PyCharm ToolKit创建并调试训练作业 - AI开发平台ModelArts

如何安装第三方包，安装报错的处理方法 - AI开发平台ModelArts

JupyterLab常用功能介绍 - AI开发平台ModelArts

MindSpore Lite问题定位指南 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线