搜索_华为云

如何查看Notebook使用的cuda版本？ - AI开发平台ModelArts

如何查看Notebook使用的cuda版本？执行如下命令查看环境中的cuda版本。 ll /usr/local | grep cuda 举例：图1 查看当前环境的cuda版本如图1所示，当前环境中cuda版本为10.2 父主题：环境配置相关

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 环境配置相关
构建条件节点控制分支执行 - AI开发平台ModelArts

存储的是节点名称；此时if_then_steps中的step跳过不执行。使用案例根据需求参考简单示例或进阶示例。简单示例通过参数配置实现 import modelarts.workflow as wf left_value = wf.Placeholder(name="left_value"

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 构建Workflow多分支运行场景
是否支持本地安装MoXing？ - AI开发平台ModelArts

是否支持本地安装MoXing？不支持，目前MoXing只支持在ModelArts里面使用。父主题：规格限制

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 规格限制
请求超时返回Timeout - AI开发平台ModelArts

关）和模型。处理方法优先排查APIG（API网关）是否是通的，可以在本地使用curl命令排查，命令行：curl -kv {预测地址}。如返回Timeout则需排查本地防火墙，代理和网络配置。检查模型是否启动成功或者模型处理单个消息的时长。因APIG（API网关）的限制，模型

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
NPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

本的固件驱动安装。图6 检查npu-smi工具工具检查正常后，进行固件和驱动安装。固件和驱动安装时，注意安装顺序：首次安装场景：硬件设备刚出厂时未安装驱动，或者硬件设备前期安装过驱动固件但是当前已卸载，上述场景属于首次安装场景，需按照“驱动->固件”的顺序安装驱动固件。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置 > 配置Lite Server软件环境
在ModelArts Standard上运行GPU多机多卡训练任务 - AI开发平台ModelArts

购买服务资源（VPC/SFS/OBS/SWR/ECS）配置权限创建专属资源池（打通VPC） ECS服务器挂载SFS Turbo存储在ECS中设置ModelArts用户可读权限安装和配置OBS命令行工具（可选）工作空间配置模型训练：线下容器镜像构建及调试上传镜像上传数据至OBS（首次使用时需要）

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练任务
在ModelArts Standard上运行GPU单机多卡训练任务 - AI开发平台ModelArts

准备工作：购买服务资源（VPC、SFS、SWR和ECS）配置权限创建专属资源池（打通VPC）在ECS服务器挂载SFS Turbo存储在ECS中设置ModelArts用户可读权限安装和配置OBS命令行工具（可选）工作空间配置模型训练：本地构建镜像及调试上传镜像上传数据和算法至SFS（首次使用时需要）

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练任务
训练模型时引用依赖包，如何创建训练作业？ - AI开发平台ModelArts

放置在配置的“代码目录”下，“启动方式”必须选择“预置框架”。需要在创建训练作业前将相关文件上传至OBS路径下，文件打包要求请参见安装文件规范。安装文件规范请根据依赖包的类型，在代码目录下放置对应文件：依赖包为开源安装包时暂时不支持直接从github的源码中安装。在“

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 编写训练代码
在ModelArts Standard使用run.sh脚本实现OBS和训练容器间的数据传输 - AI开发平台ModelArts

数据迁移工作。增加了和OBS交互工作的整个训练流程如下：建议使用OBSutil作为和OBS交互的工具，如何在本机安装obsutil可以参考安装和配置OBS命令行工具。训练数据、代码、模型下载。（本地使用硬盘挂载或者docker cp，在ModelArts上使用OBSutil）

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练任务
VS Code连接远端Notebook时报错“XHR failed” - AI开发平台ModelArts

VS Code Server，请手动安装。解决方法打开VS Code，选择“Help>About”，并记下“Commit”的ID码。确认创建Notebook实例使用的镜像的系统架构，可以在Notebook中打开Terminal，通过命令uname -m查看。下载对应版本的

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > VS Code连接开发环境失败常见问题
使用基础镜像 - AI开发平台ModelArts

业，在“选择镜像”中选择SWR中基础镜像。由于基础镜像内需要安装固定版本依赖包，如果直接使用基础镜像进行训练，每次创建训练作业时，训练作业的图1中都需要执行install.sh文件，来安装依赖以及下载完整代码。命令如下： cd /home/ma-user/modelarts/u

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.908） > 准备工作 > 准备镜像
Moxing安装文件如何获取？ - AI开发平台ModelArts

Moxing安装文件如何获取？ Moxing安装文件不支持下载和用户自主安装。在ModelArts的Notebook和训练作业镜像中预置了Moxing安装包，用户可以直接引用。父主题：功能咨询

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 功能咨询
VS Code连接远端Notebook时报错“XHR failed” - AI开发平台ModelArts

VS Code Server，请手动安装。解决方法打开VS Code，选择“Help>About”，并记下“Commit”的ID码。确认创建Notebook实例使用的镜像的系统架构，可以在Notebook中打开Terminal，通过命令uname -m查看。下载对应版本的

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
使用基础镜像 - AI开发平台ModelArts

业，在“选择镜像”中选择SWR中基础镜像。由于基础镜像内需要安装固定版本依赖包，如果直接使用基础镜像进行训练，每次创建训练作业时，训练作业的图1中都需要执行install.sh文件，来安装依赖以及下载完整代码。命令如下： cd /home/ma-user/modelarts/u

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.909） > 准备工作 > 准备镜像
如何在代码中打印GPU使用信息 - AI开发平台ModelArts

如何在代码中打印GPU使用信息用户可通过shell命令或python命令查询GPU使用信息。使用shell命令执行nvidia-smi命令。依赖CUDA nvcc watch -n 1 nvidia-smi 执行gpustat命令。 pip install gpustat gpustat

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 更多功能咨询
示例：创建DDP分布式训练（PyTorch+GPU） - AI开发平台ModelArts

使用PyTorch预置框架功能，通过mp.spawn命令启动使用自定义镜像功能通过torch.distributed.launch命令启动通过torch.distributed.run命令启动创建训练作业方式一：使用PyTorch预置框架功能，通过mp.spawn命令启动训练作业。创建训练作业的关键参数如表1所示。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
ModelArts的SDK支持哪些安装环境？ - AI开发平台ModelArts

ModelArts的SDK支持哪些安装环境？ ModelArts的SDK支持在Notebook或本地环境中使用，但是不同环境下的不同架构，支持情况不同，如表1所示。表1 SDK安装环境开发环境架构是否支持 Notebook ARM 是 X86 是本地环境 ARM 否 X86

帮助中心 > AI开发平台ModelArts > 常见问题 > API/SDK
连接远端开发环境时，一直处于"Setting up SSH Host xxx: Downloading VS Code Server locally"超过10分钟以上，如何解决？ - AI开发平台ModelArts

当前本地网络原因，导致远程自动安装VS Code Server时间过长。解决方法打开VS Code，选择“Help>About”，并记下“Commit”的ID码。确认创建Notebook实例使用的镜像的系统架构，可以在Notebook中打开Terminal，通过命令uname -m查看。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > VS Code连接开发环境失败常见问题
部署推理服务 - AI开发平台ModelArts

如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载。请先正常安装固件和驱动，或释放被挂载的NPU。检查docker是否安装。 docker -v #检查docker是否安装如尚未安装，运行以下命令安装docker。 yum install -y docker-engine

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.905）
报错“An SSH installation couldn't be found”或者“Could not establish connection to instance xxx: 'ssh' ...”如何解决？ - AI开发平台ModelArts

原因分析当前环境未装OpenSSH或者OpenSSH未安装在默认路径下，详情请参考VS Code文档。解决方法若当前环境未安装OpenSSH，请下载并安装OpenSSH。当通过“可选功能”未能成功安装时，请手动下载OpenSSH安装包，然后执行以下步骤：下载zip包并解压放入“

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理

总条数： 1312

上一页
1
...
4
5
6
...
66
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

如何查看Notebook使用的cuda版本？ - AI开发平台ModelArts

构建条件节点控制分支执行 - AI开发平台ModelArts

是否支持本地安装MoXing？ - AI开发平台ModelArts

请求超时返回Timeout - AI开发平台ModelArts

NPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

在ModelArts Standard上运行GPU多机多卡训练任务 - AI开发平台ModelArts

在ModelArts Standard上运行GPU单机多卡训练任务 - AI开发平台ModelArts

训练模型时引用依赖包，如何创建训练作业？ - AI开发平台ModelArts

在ModelArts Standard使用run.sh脚本实现OBS和训练容器间的数据传输 - AI开发平台ModelArts

VS Code连接远端Notebook时报错“XHR failed” - AI开发平台ModelArts

使用基础镜像 - AI开发平台ModelArts

Moxing安装文件如何获取？ - AI开发平台ModelArts

VS Code连接远端Notebook时报错“XHR failed” - AI开发平台ModelArts

使用基础镜像 - AI开发平台ModelArts

如何在代码中打印GPU使用信息 - AI开发平台ModelArts

示例：创建DDP分布式训练（PyTorch+GPU） - AI开发平台ModelArts

ModelArts的SDK支持哪些安装环境？ - AI开发平台ModelArts

连接远端开发环境时，一直处于"Setting up SSH Host xxx: Downloading VS Code Server locally"超过10分钟以上，如何解决？ - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

报错“An SSH installation couldn't be found”或者“Could not establish connection to instance xxx: 'ssh' ...”如何解决？ - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线