搜索_华为云

创建Notebook实例后无法打开页面，如何处理？ - AI开发平台ModelArts

创建Notebook实例后无法打开页面，如何处理？如果您在创建Notebook实例之后，打开Notebook时，因报错导致无法打开页面，您可以根据以下对应的错误码来排查解决。打开Notebook显示黑屏 Notebook打开后黑屏，由于代理问题导致，切换代理。打开Notebook显示空白

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 实例故障
使用自定义镜像创建Notebook后打开没有kernel - AI开发平台ModelArts

使用自定义镜像创建Notebook后打开没有kernel 问题现象使用自定义镜像创建实例启动后，打开JupyterLab>新建Notebook，选不到kernel。原因分析自定义镜像的python环境没有注册。解决方案在Terminal里执行命令排查实例存在几个Conda环境。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 自定义镜像故障
运行第一条Workflow - AI开发平台ModelArts

配置完成后单击右上方“保存配置”并确认保存。单击右上方“启动”并在弹框中单击“确认”后开始运行工作流。工作流在运行过程中，需要用户在“数据标注”节点以及“服务部署”节点完成相关操作或者配置，其余节点不需要用户做操作。数据标注节点：标注节点启动后会等待用户确认数据标注是否完成，用户在数据标

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发
Notebook如何离线安装VS Code Server - AI开发平台ModelArts

Notebook如何离线安装VS Code Server 背景介绍 VS Code执行remote-ssh远程连接时，会根据用户的VS Code版本去自动更新vscode-server和Vscode-client的版本，通过本地和远端尝试下载相关的安装脚本和包。当远端网络和本地网

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > VS Code使用技巧
配置Workflow参数 - AI开发平台ModelArts

lavor、train_flavor、swr、pacific。否 str delay 参数是否运行时输入，默认为“False”，在工作流启动运行前进行配置。设置为“True”，则在使用的相应节点运行时卡点配置。否 bool description 参数描述信息。否 str enum_list

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
创建Workflow训练作业节点 - AI开发平台ModelArts

code_dir 代码目录否 str、Placeholder、Storage boot_file 启动文件否 str、Placeholder、Storage command 启动命令否 str、Placeholder parameters 算法超参否 AlgorithmParameters的列表

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
Cluster资源池节点故障如何定位 - AI开发平台ModelArts

Cluster资源池节点故障如何定位故障说明和处理建议图1 Lite池故障处理流程对于ModelArts Lite资源池，每个节点会以DaemonSet方式部署node-agent组件，该组件会检测节点状态，并将检测结果写到K8S NodeCondtition中。同时，节点

 帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
如何安装第三方包，安装报错的处理方法 - AI开发平台ModelArts

如何安装第三方包，安装报错的处理方法问题现象 ModelArts如何安装自定义库函数，例如“apex”。 ModelArts训练环境安装第三方包时出现如下报错： xxx.whl is not a supported wheel on this platform 原因分析由于安装的文件名格式不支持，导致出现“xxx

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
Cluster资源池如何进行NCCl Test？ - AI开发平台ModelArts

Cluster资源池如何进行NCCl Test？ ModelArts提供AI诊断功能，用户可以通过NCCl Test，测试节点GPU状态，并且测试多个节点间的通信速度。操作步骤单击资源池名称，进入资源池详情。单击左侧“AI组件管理 > AI诊断”。单击“诊断”，选择“日志上传路径”和NCCL

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Cluster
创建Notebook实例后无法打开页面，如何处理？ - AI开发平台ModelArts

创建Notebook实例后无法打开页面，如何处理？如果您在创建Notebook实例之后，打开Notebook时，因报错导致无法打开页面，您可以根据以下对应的错误码来排查解决。打开Notebook显示黑屏 Notebook打开后黑屏，由于代理问题导致，切换代理。打开Notebook显示空白

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > Notebook实例常见错误
PyTorch1.0引擎提示“RuntimeError: std:exception” - AI开发平台ModelArts

0镜像中的libmkldnn软连接与原生torch的冲突，具体可参看文档。处理方法按照issues中的说明，应该是环境中的库冲突了，因此在启动脚本最开始之前，添加如下代码。 import os os.system("rm /home/work/anaconda3/lib/libmkldnn

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
附录：训练常见问题 - AI开发平台ModelArts

附录：训练常见问题问题1：在训练过程中遇到NPU out of memory 解决方法：容器内执行以下命令，指定NPU内存分配策略的环境变量，开启动态内存分配，即在需要时动态分配内存，可以提高内存利用率，减少OOM错误的发生。 export PYTORCH_NPU_ALLOC_CONF

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.909）
GPU裸金属服务器无法Ping通如何解决 - AI开发平台ModelArts

GPU裸金属服务器无法Ping通如何解决问题现象在华为云使用GPU裸金属服务器时，服务器绑定EIP（华为云弹性IP服务）后，出现无法ping通弹性公网IP现象。原因分析查看当前GPU裸金属服务器的安全组的入方向规则的配置，发现仅开通了TCP协议的22端口。 ping命令

 帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
训练作业日志中提示“No such file or directory” - AI开发平台ModelArts

使用自定义镜像创建训练作业时，在代码目录下载完成后，镜像的启动命令会被自动执行。启动命令的填写规范如下：如果训练启动脚本用的是py文件，例如train.py，运行命令可以写为python ${MA_JOB_DIR}/demo-code/train.py。如果训练启动脚本用的是sh文件，例如main.sh，运行命令可以写为bash

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
发布Workflow到AI Gallery - AI开发平台ModelArts

发布Workflow到AI Gallery Workflow支持发布到AI Gallery，分享给其他用户使用，执行如下代码即可完成发布。 workflow.release_to_gallery() 发布完成后可前往gallery查看相应的资产信息，资产权限默认为private，可在资产的console页面自行修改。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 发布Workflow
示例：从 0 到 1 制作自定义镜像并用于训练（MindSpore+Ascend） - AI开发平台ModelArts

示例：从 0 到 1 制作自定义镜像并用于训练（MindSpore+Ascend）本案例介绍如何从0到1制作Ascend容器镜像，并使用该镜像在ModelArts平台上进行训练。镜像中使用的AI引擎是MindSpore，训练使用的资源是专属资源池的Ascend芯片。约束限制

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
在Lite Cluster资源池上使用ranktable路由规划完成Pytorch NPU分布式训练 - AI开发平台ModelArts

执行如下命令，根据“config.yaml”创建并启动pod。容器启动后会自动执行训练作业。 kubectl apply -f config.yaml 执行如下命令，检查pod启动情况。如果显示“1/1 running”状态代表启动成功。 kubectl get pod 图3 启动成功的回显执行如下命令

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
附录：微调训练常见问题 - AI开发平台ModelArts

附录：微调训练常见问题问题1：在训练过程中遇到NPU out of memory 解决方法：容器内执行以下命令，指定NPU内存分配策略的环境变量，开启动态内存分配，即在需要时动态分配内存，可以提高内存利用率，减少OOM错误的发生。 export PYTORCH_NPU_ALLOC_CONF

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908）
附录：训练常见问题 - AI开发平台ModelArts

附录：训练常见问题问题1：在训练过程中遇到NPU out of memory 解决方法：容器内执行以下命令，指定NPU内存分配策略的环境变量，开启动态内存分配，即在需要时动态分配内存，可以提高内存利用率，减少OOM错误的发生。 export PYTORCH_NPU_ALLOC_CONF

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910）
管理开发环境实例 - AI开发平台ModelArts

管理开发环境实例功能介绍该接口用于启动、停止、重启、排队、取消排队开发环境Notebook实例。 URI POST /v1/{project_id}/demanager/instances/{instance_id}/action 参数说明如表1所示。表1 参数说明参数是否必选

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）

总条数： 1998

上一页
1
...
7
8
9
...
100
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建Notebook实例后无法打开页面，如何处理？ - AI开发平台ModelArts

使用自定义镜像创建Notebook后打开没有kernel - AI开发平台ModelArts

运行第一条Workflow - AI开发平台ModelArts

Notebook如何离线安装VS Code Server - AI开发平台ModelArts

配置Workflow参数 - AI开发平台ModelArts

创建Workflow训练作业节点 - AI开发平台ModelArts

Cluster资源池节点故障如何定位 - AI开发平台ModelArts

如何安装第三方包，安装报错的处理方法 - AI开发平台ModelArts

Cluster资源池如何进行NCCl Test？ - AI开发平台ModelArts

创建Notebook实例后无法打开页面，如何处理？ - AI开发平台ModelArts

PyTorch1.0引擎提示“RuntimeError: std:exception” - AI开发平台ModelArts

附录：训练常见问题 - AI开发平台ModelArts

GPU裸金属服务器无法Ping通如何解决 - AI开发平台ModelArts

训练作业日志中提示“No such file or directory” - AI开发平台ModelArts

发布Workflow到AI Gallery - AI开发平台ModelArts

示例：从 0 到 1 制作自定义镜像并用于训练（MindSpore+Ascend） - AI开发平台ModelArts

在Lite Cluster资源池上使用ranktable路由规划完成Pytorch NPU分布式训练 - AI开发平台ModelArts

附录：微调训练常见问题 - AI开发平台ModelArts

附录：训练常见问题 - AI开发平台ModelArts

管理开发环境实例 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线