搜索_华为云

VS Code手动连接Notebook - AI开发平台ModelArts

Code环境访问Notebook的方式。前提条件已下载并安装VS Code。详细操作请参考安装VS Code软件。用户本地PC或服务器的操作系统中建议先安装Python环境，详见VSCode官方指导。创建一个Notebook实例，并开启远程SSH开发。该实例状态必须处于“运行中

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过VS Code远程使用Notebook实例
不同机型的对应的软件配套版本 - AI开发平台ModelArts

节点资源，不同机型的节点对应的操作系统、适用的CCE集群版本等不相同，为了便于您制作镜像、升级软件等操作，本文对不同机型对应的软件配套版本做了详细介绍。裸金属服务器的对应的软件配套版本表1 裸金属服务器类型卡类型 RDMA网络协议操作系统适用范围、约束依赖插件 NPU

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster使用前必读
ModelArts训练作业无法解析参数，日志报错 - AI开发平台ModelArts

UnrecognizedFlagError:Unknown command line flag 'task_index' 原因分析运行参数中未定义该参数。在训练环境中，系统可能会传入在Python脚本里没有定义的其他参数名称，导致参数无法解析，日志报错。处理方法参数定义中增加该参数的定义，代码示例如下： parser

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
（可选）本地安装ma-cli - AI开发平台ModelArts

（可选）本地安装ma-cli 使用场景本文以Windows系统为例，介绍如何在Windows环境中安装ma-cli。 Step1：安装ModelArts SDK 参考本地安装ModelArts SDK完成SDK的安装。 Step2：下载ma-cli 下载ma-cli软件包。完成软件包签名校验。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
在ModelArts控制台界面上单击VS Code接入并在新界面单击打开，VS Code打开后未进行远程连接 - AI开发平台ModelArts

在ModelArts控制台界面上单击VS Code接入并在新界面单击打开，VS Code打开后未进行远程连接如果本地为Linux系统，见原因分析二。原因分析一自动安装VS Code插件ModelArts-HuaweiCloud失败。解决方法一方法一：检查VS Code网络是否正常。在VS

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
配置授权 - AI开发平台ModelArts
配置授权 - AI开发平台ModelArts

境、数据管理、在线服务等功能将不能正常使用。该API支持管理员给IAM子用户设置委托，支持设置当前用户的访问密钥。调用该API需要在IAM系统里配置Security Administrator权限。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API E

帮助中心 > AI开发平台ModelArts > API参考 > 授权管理
在ModelArts中使用边缘节点部署边缘服务时能否使用http接口协议？ - AI开发平台ModelArts

在ModelArts中使用边缘节点部署边缘服务时能否使用http接口协议？系统默认使用https。如果您想使用http，可以采取以下两种方式：方式一：在部署边缘服务时添加如下环境变量： MODELARTS_SSL_ENABLED = false 图1 添加环境变量方式二：在

 帮助中心 > AI开发平台ModelArts > 常见问题 > Edge
使用Prometheus查看Lite Cluster监控指标 - AI开发平台ModelArts

Cluster监控指标 Prometheus是一款开源监控工具，ModelArts支持Exporter功能，方便用户使用Prometheus等第三方监控系统获取ModelArts采集到的指标数据。本章节主要介绍如何通过Prometheus查看Lite Cluster监控指标。约束限制需要在ModelArts

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理 > 监控Lite Cluster资源
GPU A系列裸金属服务器无法获取显卡如何解决 - AI开发平台ModelArts

Error 802原因为缺少fabricmanager，可能由于以下原因导致nvidia-fabricmanager.service不工作：可能系统资源不足、如内存不足、内存泄露。硬件故障、如IB网络或者GPU互联设备故障等。没安装nvidia-fabricmanager组件或被误卸载。

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
创建工作空间 - AI开发平台ModelArts

创建工作空间功能介绍创建工作空间（"default"为系统预留的默认工作空间名称，不能使用）。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI POST /v1/

帮助中心 > AI开发平台ModelArts > API参考 > 工作空间管理
GPU A系列裸金属服务器如何更换NVIDIA和CUDA？ - AI开发平台ModelArts

当裸金属服务器预置的NVIDIA版本和业务需求不匹配时，需要更换NVIDIA驱动和CUDA版本。本文介绍华为云A系列GPU裸金属服务器（Ubuntu20.04系统）如何从“NVIDIA 525+CUDA 12.0”更换为“NVIDIA 515+CUDA 11.7”。操作步骤卸载原有版本的NVIDIA和CUDA。

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
导入模型后部署服务，提示磁盘不足 - AI开发平台ModelArts

on device”。原因分析 ModelArts部署使用的是容器化部署，容器运行时有空间大小限制，当用户的模型文件或者其他自定义文件，系统文件超过Docker size大小时，会提示镜像内空间不足。处理方法公共资源池容器Docker size的大小最大支持50G，专属资源池Docker

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
自定义镜像导入配置运行时依赖无效 - AI开发平台ModelArts

问题现象通过API接口选择自定义镜像导入创建模型，配置了运行时依赖，没有正常安装pip依赖包。原因分析自定义镜像导入不支持配置运行时依赖，系统不会自动安装所需要的pip依赖包。处理方法重新构建镜像。在构建镜像的dockerfile文件中安装pip依赖包，例如安装Flask依赖包。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
GPU A系列裸金属服务器使用CUDA cudaGetDeviceCount()提示CUDA initializat失败 - AI开发平台ModelArts

A系列裸金属服务器使用CUDA cudaGetDeviceCount()提示CUDA initializat失败问题现象在A系列GPU裸金属服务器上，系统环境是ubuntu20.04+nvidia515+cuda11.7，使用Pytorch2.0时出现如下错误： CUDA initialization:

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
基于MaaS DeepSeek API和Dify快速构建网站智能客服 - AI开发平台ModelArts

MaaS部署模型服务。背景介绍客服系统是企业与消费者沟通的重要桥梁，然而传统的人工客服存在着人工成本高昂、数据收集和分析困难、难以24小时提供服务等痛点。随着AI大模型的崛起，如何利用先进的大语言模型构建AI智能体并应用于智能客服系统，提供更加自然、流畅的对话体验，提高用户

 帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek系列模型推理应用
AIGC工具tailor使用指导 - AI开发平台ModelArts

2/use/downloads.html 需要下载的安装包与操作系统有关，请根据需要选择合适的安装包。如果操作系统为Linux aarch64，请下载mindspore-lite-2.2.10-linux-aarch64.tar.gz。如果操作系统为Linux x86_64，请下载mindspore-lite-2

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
基于MaaS DeepSeek API和Dify快速构建网站智能客服 - AI开发平台ModelArts

MaaS部署模型服务。背景介绍客服系统是企业与消费者沟通的重要桥梁，然而传统的人工客服存在着人工成本高昂、数据收集和分析困难、难以24小时提供服务等痛点。随着AI大模型的崛起，如何利用先进的大语言模型构建AI智能体并应用于智能客服系统，提供更加自然、流畅的对话体验，提高用户

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 使用MaaS DeepSeek API搭建AI应用
训练作业失败，返回错误码139 - AI开发平台ModelArts

容的情况，例如transformers包，导致import的时候出现了错误。用户代码问题，出现了内存越界、非法访问内存空间的情况。未知系统问题导致，建议先尝试重建作业，重建后仍然失败，建议提工单定位。处理方法如果存在之前能跑通，什么都没修改，过了一阵跑不通的情况，先去排查

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
使用大模型在ModelArts Standard创建模型部署在线服务 - AI开发平台ModelArts

背景说明目前大模型的参数量已经达到千亿甚至万亿，随之大模型的体积也越来越大。千亿参数大模型的体积超过200G，在版本管理、生产部署上对平台系统产生了新的要求。例如：导入模型时，需要支持动态调整租户存储配额；模型加载、启动慢，部署时需要灵活的超时配置；当负载异常重启，模型需要重新加载，服务恢复时间长的问题亟待解决。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
GPU A系列裸金属服务器如何进行RoCE性能带宽测试？ - AI开发平台ModelArts

A系列裸金属服务器已经安装了IB驱动。（网卡设备名称可以使用ibstatus或者ibstat获取。华为云Ant8裸金属服务器使用Ubuntu20.04操作系统默认已经安装IB驱动。）操作步骤方法1：使用mlx硬件计数器，估算ROCE网卡收发流量统计300s内流量，统计脚本如下： x=$(cat

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server

总条数： 621

上一页
1
2
3
4
5
...
32
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

VS Code手动连接Notebook - AI开发平台ModelArts

不同机型的对应的软件配套版本 - AI开发平台ModelArts

ModelArts训练作业无法解析参数，日志报错 - AI开发平台ModelArts

（可选）本地安装ma-cli - AI开发平台ModelArts

在ModelArts控制台界面上单击VS Code接入并在新界面单击打开，VS Code打开后未进行远程连接 - AI开发平台ModelArts

配置授权 - AI开发平台ModelArts

在ModelArts中使用边缘节点部署边缘服务时能否使用http接口协议？ - AI开发平台ModelArts

使用Prometheus查看Lite Cluster监控指标 - AI开发平台ModelArts

GPU A系列裸金属服务器无法获取显卡如何解决 - AI开发平台ModelArts

创建工作空间 - AI开发平台ModelArts

GPU A系列裸金属服务器如何更换NVIDIA和CUDA？ - AI开发平台ModelArts

导入模型后部署服务，提示磁盘不足 - AI开发平台ModelArts

自定义镜像导入配置运行时依赖无效 - AI开发平台ModelArts

GPU A系列裸金属服务器使用CUDA cudaGetDeviceCount()提示CUDA initializat失败 - AI开发平台ModelArts

基于MaaS DeepSeek API和Dify快速构建网站智能客服 - AI开发平台ModelArts

AIGC工具tailor使用指导 - AI开发平台ModelArts

基于MaaS DeepSeek API和Dify快速构建网站智能客服 - AI开发平台ModelArts

训练作业失败，返回错误码139 - AI开发平台ModelArts

使用大模型在ModelArts Standard创建模型部署在线服务 - AI开发平台ModelArts

GPU A系列裸金属服务器如何进行RoCE性能带宽测试？ - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线