搜索_华为云

GPU裸金属服务器无法Ping通如何解决 - AI开发平台ModelArts

Desktop Services 3389 Windows远程桌面服务端口，通过这个端口可以连接Windows弹性云服务器。代理 8080 8080端口常用于WWW代理服务，实现网页浏览，实现网页浏览。如果您使用8080端口，访问网站或使用代理服务器时，需要在IP地址后面加上：8080。安装Apache

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
管理训练容器环境变量 - AI开发平台ModelArts

NAME}-N.${MA_VJ_NAME} 表示不同节点的通信域名，例如0号节点的通信域名为 “${MA_VJ_NAME}-${MA_TASK_NAME}-0.${MA_VJ_NAME}”。 N表示实例数。例如，实例数为4时，此环境变量分别为 “${MA_VJ_NAME}-${MA_TASK_NAME}-0

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
（可选）配置驱动 - AI开发平台ModelArts

方式二：通过驱动升级功能对已有的资源池驱动版本进行升级方式一：购买资源池时通过自定义驱动参数进行配置在购买资源池页面，部分GPU和Ascend规格资源池允许自定义安装驱动。开启自定义驱动开关并选择需要的驱动版本即可。方式二：通过驱动升级功能对已有的资源池驱动版本进行升级如果在购

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
内存不足如何处理？ - AI开发平台ModelArts

内存不足如何处理？问题现象在部署或升级在线服务时，如果部署或升级失败，并且在事件中出现如下类似提示。图1 内存不足提示样例1 运行中服务出现告警时，在事件中出现建议：内存不足，请增加内存。图2 内存不足提示样例2 原因分析部署或升级时出现该提示，可能原因是选择的计算节点

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
在ModelArts镜像管理注册镜像报错ModelArts.6787怎么处理？ - AI开发平台ModelArts

在ModelArts镜像管理注册镜像报错ModelArts.6787怎么处理？问题现象在“镜像管理”界面注册镜像时报错“ModelArts.6787:镜像***无法使用，在SWR路径下***无法找到指定镜像，请在SWR控制台检查镜像及访问权限配置，或使用其他镜像并重试”。原因分析

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard镜像相关
工作空间 - AI开发平台ModelArts
工作空间 - AI开发平台ModelArts

INTERNAL：创建者、主账号、指定IAM子账号可访问当授权类型为INTERNAL时需要指定可访问的子账号的账号名，可选择多个。每个账号每个IAM项目都会分配1个默认工作空间，默认工作空间的访问控制为PUBLIC。通过工作空间的访问控制能力，可限制仅允许部分人访问对应的工作空间。通过此功能可实现类似如下场景：

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 权限控制方式
用户AK-SK认证模式 - AI开发平台ModelArts

在“我的凭证 > 访问密钥”中，单击“新增访问密钥”。在“新增访问密钥”弹窗中，填写该密钥的描述说明，单击“确定”。根据提示单击“立即下载”，下载密钥。密钥文件会直接保存到浏览器默认的下载文件夹中，文件名为“credentials.csv”，可打开文件查看访问密钥（Access

帮助中心 > AI开发平台ModelArts > SDK参考 > Session鉴权
部署模型为在线服务 - AI开发平台ModelArts

单击CloudShell页签，选择模型版本和计算节点，当连接状态变为时，即登录实例容器成功。如果遇到异常情况服务器主动断开或超过10分钟未操作自动断开，此时可单击“重新连接”重新登录实例容器。图5 CloudShell界面部分用户登录Cloud Shell界面时，可能会出现路径显示异常情况，此时在Cloud

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业
实时推理的部署及使用流程 - AI开发平台ModelArts

ModelArts支持通过以下几种方式调用API访问在线服务（案例中均以HTTPS请求为例）：通过公网访问通道的方式访问在线服务：ModelArts推理默认使用公网访问在线服务。在线服务部署成功后，将为用户提供一个可调用的API，此API为标准Restful API。通过VPC高速访问通道的方式访问在线服务：使

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业
DockerFile构建镜像（可选） - AI开发平台ModelArts

DockerFile构建镜像（可选）本章节主要介绍通过DockerFile文件构建训练镜像，将训练过程中依赖包封装使用，过程中需要连接互联网git clone，请确保环境可以访问公网，详解操作如下：进入代码包Dockerfile文件同级目录： cd /home/ma-user/ws/llm_train/LLaMAFactory

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 准备工作
使用PyCharm手动连接Notebook - AI开发平台ModelArts

Configurations，单击+号，增加一个SSH连接配置。 Host：云上开发环境的IP地址，即在开发环境实例页面远程访问模块获取的IP地址。例如：dev-modelarts-cnnorth4.huaweicloud.com Port：云上开发环境的端口，即在开发环境实例页面远程访问模块获取的端口号。 User

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过PyCharm远程使用Notebook实例
Standard资源池节点故障定位 - AI开发平台ModelArts

节点运维未知错误。节点被标记为具有未知故障污点。 A200001 节点管理驱动升级 GPU升级。节点正在执行GPU驱动升级。 A200002 节点管理驱动升级 NPU升级。节点正在执行NPU驱动升级。 A200008 节点管理节点准入准入检测。节点正在进行节点准入检测，

帮助中心 > AI开发平台ModelArts > 故障排除 > 资源池
通过SSH工具远程使用Notebook - AI开发平台ModelArts

前提条件创建一个Notebook实例，并开启远程SSH开发，配置远程访问IP白名单。该实例状态必须处于“运行中”，具体参见创建Notebook实例章节。在Notebook实例详情页面获取开发环境访问地址（例如：dev-modelarts-cnnorth4.huaweicloud

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
DockerFile构建镜像（可选） - AI开发平台ModelArts

clone，请确保环境可以访问公网，详解操作如下：进入代码包Dockerfile文件同级目录： cd /home/ma-user/ws/llm_train/LLaMAFactory 构建新镜像： docker build -t <镜像名称>:<版本名称> . 如无法访问公网则需配置代理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 准备工作
Notebook的自定义镜像制作方法 - AI开发平台ModelArts

Notebook的自定义镜像制作方法用户在使用ModelArts开发环境时，经常需要对开发环境进行一些改造，如安装、升级或卸载一些包。但是某些包的安装升级需要root权限，运行中的Notebook实例中无root权限，所以在Notebook实例中安装需要root权限的软件，目前

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于创建Notebook
msprobe精度比对 - AI开发平台ModelArts

降问题，对比NPU芯片中的API计算数值与CPU或GPU芯片中的API计算数值，进行问题定位。同一模型，进行迭代（模型、框架版本升级或设备硬件升级）时存在的精度下降问题，对比相同模型在迭代前后版本的API计算数值，进行问题定位。首先通过在PyTorch训练脚本中插入dump接

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > msprobe工具使用指导
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

在SWR服务页面创建镜像组织。图2 创建镜像组织 Step4 在ECS中Docker登录在SWR中单击右上角的“登录指令”，然后在跳出的登录指定窗口，单击复制临时登录指令。在创建的ECS中粘贴临时登录指令，即可完成登录。图3 复制登录指令 Step5 获取训练镜像建议使用官方提供的镜像部署训练服

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 准备工作
ECS获取和上传基础镜像 - AI开发平台ModelArts

{image_url} Step5 在ECS中Docker登录在SWR中单击右上角的“登录指令”，然后在跳出的登录指定窗口，单击复制临时登录指令。在创建的ECS中粘贴临时登录指令，即可完成登录。图3 复制登录指令 Step6 修改并上传镜像 1. 登录指令输入之后，使用下列示例命令： docker

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.908） > 准备工作 > 准备镜像
日志提示“max_pool2d_with_indices_out_cuda_frame failed with error code 0” - AI开发平台ModelArts

permute(0, 3, 1, 2).contigous()) 将版本回退至pytorch1.3。必现的问题，使用本地Pycharm远程连接Notebook调试。建议与总结在创建训练作业前，推荐您先使用ModelArts开发环境调试训练代码，避免代码迁移过程中的错误。直

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
DockerFile构建镜像（可选） - AI开发平台ModelArts

clone，请确保环境可以访问公网，详解操作如下：进入代码包Dockerfile文件同级目录： cd /home/ma-user/ws/llm_train/AscendFactory 构建新镜像： docker build -t <镜像名称>:<版本名称> . 如无法访问公网则需配置代理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 准备工作

总条数： 1135

上一页
1
...
4
5
6
...
57
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

GPU裸金属服务器无法Ping通如何解决 - AI开发平台ModelArts

管理训练容器环境变量 - AI开发平台ModelArts

（可选）配置驱动 - AI开发平台ModelArts

内存不足如何处理？ - AI开发平台ModelArts

在ModelArts镜像管理注册镜像报错ModelArts.6787怎么处理？ - AI开发平台ModelArts

工作空间 - AI开发平台ModelArts

用户AK-SK认证模式 - AI开发平台ModelArts

部署模型为在线服务 - AI开发平台ModelArts

实时推理的部署及使用流程 - AI开发平台ModelArts

DockerFile构建镜像（可选） - AI开发平台ModelArts

使用PyCharm手动连接Notebook - AI开发平台ModelArts

Standard资源池节点故障定位 - AI开发平台ModelArts

通过SSH工具远程使用Notebook - AI开发平台ModelArts

DockerFile构建镜像（可选） - AI开发平台ModelArts

Notebook的自定义镜像制作方法 - AI开发平台ModelArts

msprobe精度比对 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

ECS获取和上传基础镜像 - AI开发平台ModelArts

日志提示“max_pool2d_with_indices_out_cuda_frame failed with error code 0” - AI开发平台ModelArts

DockerFile构建镜像（可选） - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线