搜索_华为云

使用ModelArts Standard专属资源池进行单机单卡训练 - AI开发平台ModelArts

gz在OBS上的路径（需将文件设置为公共读）。进入Dockerfile目录，通过Dockerfile构建镜像命令： # cd 到Dockerfile所在目录下，输入构建命令 # docker build -t ${image_name}:${image_version} . # 例如

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard专属资源池训练模型
在线服务预测报错ModelArts.4503 - AI开发平台ModelArts

基于高性能考虑，ModelArts会复用同模型服务的连接。根据tcp协议，连接的断开可以由该连接的client端发起，也可以由server端发起。断开连接需要经过四次握手，所以可能会存在作为服务端的模型服务侧发起断开连接，但是该连接正在被作为客户端的ModelArts使用，从而导致通信出错，返回此错误信息。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
Lite Cluster资源配置流程 - AI开发平台ModelArts

置，配置网络后可通过公网访问集群资源。 2 配置kubectl工具 kubectl是Kubernetes集群的命令行工具，配置kubectl后，您可通过kubectl命令操作Kubernetes集群。 3 配置Lite Cluster存储如果没有挂载任何外部存储，此时可用存储空

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
AIGC工具tailor使用指导 - AI开发平台ModelArts

4-py3-none-any.whl.sha256 安装命令： pip install tailor-0.3.4-py3-none-any.whl 使用指导 tailor支持“命令行”和“Python API”两种方式使用。命令行方式命令行运行样例： tailor --model_path="

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
如何将Ubuntu20.04内核版本从低版本升级至5.4.0-144-generic？ - AI开发平台ModelArts

/boot/efi/EFI/ubuntu/grub.cfg reboot 第一条命令为安装Linux内核头文件和内核镜像，其中版本为5.4.0-144-generic。第二条命令为重新生成GRUB引导程序的配置文件，用于在启动计算机时加载操作系统，命令将使用新安装的内核镜像更新GRUB的配置文件，以便在下次启动时加载新的内核。

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
NPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

/bin/bash 执行下述命令进入容器。 docker exec -ti 上一命令中的自定义容器名称 bash 执行下述命令进入conda环境。 source /home/ma-user/.bashrc cd ~ 查看容器中可以使用的卡信息。 npu-smi info 如果命令报如下错误，则

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置 > 配置Lite Server软件环境
作为调用发起方的客户端无法访问已经获取到的推理请求地址 - AI开发平台ModelArts

户端访问该地址不通，出现无法连接、域名无法解析的现象。原因分析在调用指南页签中显示的调用地址都是华为云APIG（API网关服务）的地址。调用发起方的客户端和华为云网络不通。处理方法如果客户端位于华为云网络之外，保证客户端所处的网络环境可以连接Internet；如果客户端

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 在线服务
GPU A系列裸金属服务器节点内如何进行NVLINK带宽性能测试方法？ - AI开发平台ModelArts

且服务器中已经安装相关GPU驱动软件，以及Pytorch2.0。 GPU A系列裸金属服务器，单台服务器GPU间是走NVLINK，可以通过相关命令查询GPU拓扑模式： nvidia-smi topo -m 图1 查询GPU拓扑模式操作步骤使用以下脚本测得GPU服务器内NVLINK带宽性能。

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
使用Gallery CLI配置工具下载文件 - AI开发平台ModelArts

/Linux等服务器）上登录Gallery CLI配置工具后，通过命令“gallery-cli download”可以从AI Gallery仓库下载资源。命令说明登录Gallery CLI配置工具后，使用命令“gallery-cli download --help”可以获取Gallery

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > Gallery CLI配置工具指南
使用Gallery CLI配置工具上传文件 - AI开发平台ModelArts

Lite云服务器或者是本地Windows/Linux等服务器）上登录Gallery CLI配置工具后，通过命令“gallery-cli upload”可以往AI Gallery仓库上传资产。命令说明登录Gallery CLI配置工具后，使用命令“gallery-cli upload --help”可以获取Gallery

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > Gallery CLI配置工具指南
ECS中构建新镜像 - AI开发平台ModelArts

件，修改git命令，填写自己的git账户信息。 git config --global user.email "you@example.com" && \ git config --global user.name "Your Name" && \ 执行以下命令制作训练镜像。安装过程需要连接互联网git

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.908） > 准备工作 > 准备镜像
上传镜像 - AI开发平台ModelArts
上传镜像 - AI开发平台ModelArts

上传镜像的容器引擎客户端版本必须为1.11.2及以上。操作步骤连接容器镜像服务。登录容器镜像服务控制台。单击右上角“创建组织”，输入组织名称完成组织创建。请自定义组织名称，本示例使用“deep-learning”，下面的命令中涉及到组织名称“deep-learning”也请替换为自定义的值。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
故障恢复 - AI开发平台ModelArts
故障恢复 - AI开发平台ModelArts

ModelArts全球基础设施围绕华为云区域和可用区构建。华为云区域提供多个在物理上独立且隔离的可用区，这些可用区通过延迟低、吞吐量高且冗余性高的网络连接在一起。利用可用区，您可以设计和操作在可用区之间无中断地自动实现故障转移的应用程序和数据库。与传统的单个或多个数据中心基础设施相比，可用区具有更高的可用性、容错性和可扩展性。

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
在Notebook中通过Dockerfile从0制作自定义镜像 - AI开发平台ModelArts

有两种方式来注册镜像。方式一：使用ma-cli image register命令来注册镜像。注册命令会返回注册好的镜像信息，包括镜像id，name等，如下图所示。该命令的更多信息可参考ma-cli镜像构建命令。 ma-cli image register --swr-path=swr

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于创建Notebook
ECS中构建新镜像 - AI开发平台ModelArts

件，修改git命令，填写自己的git账户信息。 git config --global user.email "you@example.com" && \ git config --global user.name "Your Name" && \ 执行以下命令制作训练镜像。安装过程需要连接互联网git

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.908） > 准备工作 > 准备镜像
ECS中构建新镜像 - AI开发平台ModelArts

件，修改git命令，填写自己的git账户信息。 git config --global user.email "you@example.com" && \ git config --global user.name "Your Name" && \ 执行以下命令制作训练镜像。安装过程需要连接互联网git

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 准备工作 > 准备镜像
如何查看Notebook使用的cuda版本？ - AI开发平台ModelArts

如何查看Notebook使用的cuda版本？执行如下命令查看环境中的cuda版本。 ll /usr/local | grep cuda 举例：图1 查看当前环境的cuda版本如图1所示，当前环境中cuda版本为10.2 父主题：环境配置相关

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 环境配置相关
单模型性能测试工具Mindspore lite benchmark - AI开发平台ModelArts

工具进行自助性能调优，进一步可以通过profiling工具对于性能瓶颈进行分析，并针对性的做一些调优操作。可以直接使用benchmark命令测试mindir模型性能，用来对比调优前后性能是否有所提升。 # shell cd /home_host/work benchmark -

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 性能调优
通过VS Code远程使用Notebook实例 - AI开发平台ModelArts

通过VS Code远程使用Notebook实例 VS Code连接Notebook方式介绍安装VS Code软件 VS Code一键连接Notebook VS Code ToolKit连接Notebook VS Code手动连接Notebook 在VS Code中上传下载文件父主题：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
部署推理服务 - AI开发平台ModelArts

SSH登录机器后，检查NPU设备检查。运行如下命令，返回NPU设备信息。 npu-smi info # 在每个实例节点上运行此命令可以看到NPU卡状态 npu-smi info -l | grep Total # 在每个实例节点上运行此命令可以看到总卡数如出现

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.904）

总条数： 636

上一页
1
...
7
8
9
...
32
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用ModelArts Standard专属资源池进行单机单卡训练 - AI开发平台ModelArts

在线服务预测报错ModelArts.4503 - AI开发平台ModelArts

Lite Cluster资源配置流程 - AI开发平台ModelArts

AIGC工具tailor使用指导 - AI开发平台ModelArts

如何将Ubuntu20.04内核版本从低版本升级至5.4.0-144-generic？ - AI开发平台ModelArts

NPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

作为调用发起方的客户端无法访问已经获取到的推理请求地址 - AI开发平台ModelArts

GPU A系列裸金属服务器节点内如何进行NVLINK带宽性能测试方法？ - AI开发平台ModelArts

使用Gallery CLI配置工具下载文件 - AI开发平台ModelArts

使用Gallery CLI配置工具上传文件 - AI开发平台ModelArts

ECS中构建新镜像 - AI开发平台ModelArts

上传镜像 - AI开发平台ModelArts

故障恢复 - AI开发平台ModelArts

在Notebook中通过Dockerfile从0制作自定义镜像 - AI开发平台ModelArts

ECS中构建新镜像 - AI开发平台ModelArts

ECS中构建新镜像 - AI开发平台ModelArts

如何查看Notebook使用的cuda版本？ - AI开发平台ModelArts

单模型性能测试工具Mindspore lite benchmark - AI开发平台ModelArts

通过VS Code远程使用Notebook实例 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线