搜索_华为云

使用ModelArts Standard一键完成商超商品识别模型部署 - AI开发平台ModelArts

“资源池”：选择“公共资源池”。 “模型来源”和“选择模型及版本”：会自动选择订阅模型。 “实例规格”：在下拉框中选择推理使用的计算资源。如果有免费资源，建议选择免费资源。其他参数可使用默认值。参数配置完成后，单击“下一步”，确认规格参数后，单击“提交”启动在线服务的部署。任务提交成功后，单击“查看服

 帮助中心 > AI开发平台ModelArts > 快速入门
获取训练作业支持的公共规格 - AI开发平台ModelArts

FlavorResponse objects 训练作业资源规格列表。表4 FlavorResponse 参数参数类型描述 flavor_id String 资源规格的ID。 flavor_name String 资源规格的名称。 max_num Integer 资源规格的最大节点数。 flavor_type

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
ModelArts - AI开发平台ModelArts
ModelArts - AI开发平台ModelArts

训练作业 ModelArts中的作业为什么一直处于等待中？ ModelArts训练好后的模型如何获取？如何查看训练作业的资源占用情况？更多 Lite Server 哪里可以了解Atlas800训练服务器硬件相关内容 GPU A系列裸金属服务器如何更换NVIDIA和CUDA？更多

 帮助中心 > AI开发平台ModelArts > 成长地图
配置Lite Server存储 - AI开发平台ModelArts

Turbo文件系统。同一区域不同可用区之间文件系统与云服务器互通，因此保证SFS Turbo与Server服务器在同一区域即可。当创建文件系统后，您需要使用弹性裸金属服务器来挂载该文件系统，具体步骤请参考挂载NFS协议类型文件系统到云服务器（Linux）。为避免已挂载文件系统的云服务器重启后，挂载信息丢失，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置
VS Code手动连接Notebook - AI开发平台ModelArts

本章节介绍基于VS Code环境访问Notebook的方式。前提条件已下载并安装VS Code。详细操作请参考安装VS Code软件。用户本地PC或服务器的操作系统中建议先安装Python环境，详见VSCode官方指导。创建一个Notebook实例，并开启远程SSH开发。该实例状态必须处于

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过VS Code远程使用Notebook实例
Lite Server - AI开发平台ModelArts
Lite Server - AI开发平台ModelArts

Lite Server GPU裸金属服务器使用EulerOS内核误升级如何解决 GPU A系列裸金属服务器无法获取显卡如何解决 GPU裸金属服务器无法Ping通如何解决 GPU A系列裸金属服务器RoCE带宽不足如何解决？ GPU裸金属服务器更换NVIDIA驱动后执行nvidia-smi提示Failed

帮助中心 > AI开发平台ModelArts > 故障排除
报错“An SSH installation couldn't be found”或者“Could not establish connection to instance xxx: 'ssh' ...”如何解决？ - AI开发平台ModelArts

establish connection to instance xxx: 'ssh' ...”如何解决？问题现象或 VS Code连接Notebook一直提示选择证书，且提示信息除标题外，都是乱码。选择证书后，如上图所示仍然没有反应且无法进行连接。原因分析当前环境未装OpenSSH或者O

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
Lite Server - AI开发平台ModelArts
Lite Server - AI开发平台ModelArts

GPU A系列裸金属服务器如何进行RoCE性能带宽测试？ GPU A系列裸金属服务器节点内如何进行NVLINK带宽性能测试方法？如何将Ubuntu20.04内核版本从低版本升级至5.4.0-144-generic？如何禁止Ubuntu 20.04内核自动升级？哪里可以了解Atlas800训练服务器硬件相关内容

 帮助中心 > AI开发平台ModelArts > 常见问题
使用MaaS部署模型服务 - AI开发平台ModelArts

资源池类型资源池分为公共资源池与专属资源池。公共资源池供所有租户共享使用。专属资源池需单独创建，不与其他租户共享。实例规格选择实例规格，规格中描述了服务器类型、型号等信息。流量限制（QPS）设置待部署模型的流量限制QPS。单位：次/秒说明：在部署过程中出现错误码“ModelArts

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
将Notebook的Conda环境迁移到SFS磁盘 - AI开发平台ModelArts

重新启动镜像激活SFS盘中的虚拟环境保存并共享虚拟环境前提条件创建一个Notebook，“资源类型”选择“专属资源池”，“存储配置”选择“SFS弹性文件服务器”，打开terminal。创建新的虚拟环境并保存到SFS目录创建新的conda虚拟环境。 # shell conda create --prefix

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard开发环境
使用DCGM监控Lite Server资源 - AI开发平台ModelArts

GPU大规模集群的一体化工具，提供多种能力，包括主动健康监控、诊断、系统验证、策略、电源和时钟管理、配置管理和审计等。约束限制仅适用于GPU资源监控。前提条件裸金属服务器需要安装driver、cuda、fabric-manager软件包。步骤一：安装Docker 使用Docker官方脚本安装最新版Docker：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理 > 监控Lite Server资源
MA-Advisor性能调优建议工具使用指导 - AI开发平台ModelArts

ompare_tools，通过对训练耗时和内存占用的比对分析，定位到具体劣化的算子，帮助用户提升性能调优的效率。工具将训练耗时拆分为计算、通信、调度三大维度，并针对计算和通信分别进行算子级别的比对；将训练占用的总内存，拆分成算子级别的内存占用进行比对。对于集群训练场景，昇腾提供

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移性能调优
查看Standard专属资源池详情 - AI开发平台ModelArts

在节点列表页面中，单击设置图标，支持对节点列表中显示的信息进行自定义。查看资源池规格在资源池详情页，切换到“规格”页签。您可以查看该资源池使用的资源规格以及该规格对应的数量，并可以调整容器引擎空间大小。图4 查看资源池规格（如果创建资源池时未设置容器引擎大小，则显示默认值）查看资源池监控

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
Lite Cluster资源开通 - AI开发平台ModelArts

盘的写入模式。新增规格 - 支持添加多个规格。限制如下：当选择多个相同规格时，可打开高级选项指定节点池名称，至多只有一个可不指定节点池名称。选择多个规格的CPU架构必须相同。例如都是X86，或者都是ARM。如果选择了多个GPU或NPU规格，由于不同规格的参数网络平面不互通

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster）
模型管理 - AI开发平台ModelArts
模型管理 - AI开发平台ModelArts

通过API接口查询模型详情，model_name返回值出现乱码导入模型提示模型或镜像大小超过限制导入模型提示单个模型文件超过5G限制订阅的模型一直处于等待同步状态创建模型失败，提示模型镜像构建任务超时，没有构建日志父主题：推理部署

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署
训练作业找不到GPU - AI开发平台ModelArts

可见的GPU： os.environ['CUDA_VISIBLE_DEVICES'] = '0,1,2,3,4,5,6,7' 其中，0为服务器的GPU编号，可以为0，1，2，3等，表明对程序可见的GPU编号。如果未进行添加配置则该编号对应的GPU不可用。父主题： GPU相关问题

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题
pipeline应用准备 - AI开发平台ModelArts

Diffusion v1.5的onnx pipeline代码为例进行说明。进入容器环境，创建自己的工作目录。由于在Snt9B裸金属服务器环境配置指南的配置环境步骤中，在启动容器时将物理机的home目录挂载到容器的“/home_host”目录下，该目录可以直接使用上传到物理机

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
将数据预热到SFS Turbo - AI开发平台ModelArts

从OBS导入到SFS Turbo高性能文件存储中，数据预热功能的具体操作请参考创建SFS Turbo 和 OBS 之间的联动任务。在ECS服务器挂载SFS Turbo已经将SFS Turbo挂载到了/mnt/sfs_turbo目录，这里参考obsutil文档，直接使用obsut

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 准备工作
推理业务迁移评估表 - AI开发平台ModelArts

tLarge使用FP32。 - 模型变更频率模型变更场景如下：数据增量，模型算子未变更。数据增量，模型算子变化，例如：网络结构变化。 AI框架版本升级，使用了新版本算子。例如：每半年对模型进行一次变更，变更的内容包含模型结构，并升级AI框架。 - 是否使用华为MDC产品

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
创建DevServer - AI开发平台ModelArts

ServerHpsInfo object 服务器归属超节点信息。表8 CloudServer 参数参数类型描述 id String 服务器资源id。 type String DevServer服务器类型。枚举值如下： BMS：裸金属服务器 ECS：弹性云服务器 HPS：超节点服务器 hps_id String

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理

总条数： 972

上一页
1
...
6
7
8
...
49
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用ModelArts Standard一键完成商超商品识别模型部署 - AI开发平台ModelArts

获取训练作业支持的公共规格 - AI开发平台ModelArts

ModelArts - AI开发平台ModelArts

配置Lite Server存储 - AI开发平台ModelArts

VS Code手动连接Notebook - AI开发平台ModelArts

Lite Server - AI开发平台ModelArts

报错“An SSH installation couldn't be found”或者“Could not establish connection to instance xxx: 'ssh' ...”如何解决？ - AI开发平台ModelArts

Lite Server - AI开发平台ModelArts

使用MaaS部署模型服务 - AI开发平台ModelArts

将Notebook的Conda环境迁移到SFS磁盘 - AI开发平台ModelArts

使用DCGM监控Lite Server资源 - AI开发平台ModelArts

MA-Advisor性能调优建议工具使用指导 - AI开发平台ModelArts

查看Standard专属资源池详情 - AI开发平台ModelArts

Lite Cluster资源开通 - AI开发平台ModelArts

模型管理 - AI开发平台ModelArts

训练作业找不到GPU - AI开发平台ModelArts

pipeline应用准备 - AI开发平台ModelArts

将数据预热到SFS Turbo - AI开发平台ModelArts

推理业务迁移评估表 - AI开发平台ModelArts

创建DevServer - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线