搜索_华为云

ModelArts入门实践 - AI开发平台ModelArts

OBS存储，在ModelArts Standard的训练环境中开展单机单卡、单机多卡、多机多卡分布式训练。面向熟悉代码编写和调测的AI工程师，同时了解SFS和OBS云服务从 0 制作自定义镜像并用于训练（Pytorch+CPU/GPU）本案例介绍如何从0开始制作镜像，并使用该镜像在ModelArts

帮助中心 > AI开发平台ModelArts > 快速入门
Lite Cluster&Server介绍 - AI开发平台ModelArts

ModelArts Lite基于软硬件深度结合、垂直优化，构建开放兼容、极致性价比、长稳可靠、超大规模的云原生AI算力集群，提供一站式开通、网络互联、高性能存储、集群管理等能力，满足AI高性能计算等场景需求。目前其已在大模型训练推理、自动驾驶、AIGC、内容审核等领域广泛得到应用。

帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍
JupyterLab中文件保存失败，如何解决？ - AI开发平台ModelArts

在Notebook中的运行文件超过指定大小就会提示此报错。 jupyter页面打开时间太长。网络环境原因，是否有连接网络代理。解决方法关掉插件然后重新保存。减少文件大小。重新打开jupyter页面。请检查网络。父主题：环境配置故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 环境配置故障
在ModelArts的Notebook中，访问外网速度不稳定怎么办？ - AI开发平台ModelArts

ModelArts提供了一个免费的共享网络代理服务。借助这个代理，开发者可以更加便捷地下载所需的各类资源，助力开发工作的顺利进行。由于该网络代理免费且共享，其性能会受到实时访问量大小的显著影响。当众多用户同时使用代理进行资源下载时，网络带宽会被大量占用，从而导致代理速度下降，

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
专属资源池VPC打通 - AI开发平台ModelArts

“AI专属资源池 > 弹性集群Cluster”，在“网络”页签，单击网络列表中某个网络操作列的“打通VPC”。图1 打通VPC 在打通VPC弹框中，打开“打通VPC”开关，在下拉框中选择可用的VPC和子网。需要打通的对端网络不能和当前网段重叠。图2 打通VPC参数选择如果

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置
创建Standard专属资源池 - AI开发平台ModelArts

指定可用区：自定义选择控制节点的可用区。网络 MA网络指定资源池运行的网络，可以与该网络中的其他云服务资源实例互通。仅物理资源池需要设置网络。在下拉框中选择，如果没有可用网络，单击右侧的“创建”，创建一个可用的网络。创建网络相关可以参考步骤一：创建网络章节。 IPv6网络开启IPv6功能。如

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理
在ModelArts训练得到的模型欠拟合怎么办？ - AI开发平台ModelArts

模型复杂化。对同一个算法复杂化。例如回归模型添加更多的高次项，增加决策树的深度，增加神经网络的隐藏层数和隐藏单元数等。弃用原来的算法，使用一个更加复杂的算法或模型。例如用神经网络来替代线性回归，用随机森林来代替决策树。增加更多的特征，使输入数据具有更强的表达能力。特征

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
最新动态 - AI开发平台ModelArts
最新动态 - AI开发平台ModelArts

Notebook连接大数据服务特性介绍如何将ModelArts Notebook开发环境与华为云大数据服务DLI中的Spark引擎相连接，让数据工程师能便捷地使用Notebook进行大数据开发，以及如何在DataArts Studio服务配置Notebook文件定时调度任务。白名单

 帮助中心 > AI开发平台ModelArts > 最新动态
创建训练作业时出现“实例挂卷失败”的事件 - AI开发平台ModelArts

volumes=[nfs-x]”。原因分析用户账号下的SFS Turbo所在的VPC网络需要与专属资源池所在的网络打通，运行于该专属资源池的训练作业才能正常挂载SFS。因此，当训练作业挂载SFS失败时，可能是网络不通导致的。处理步骤进入训练作业详情页，在左侧获取SFS Turbo的名称。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 专属资源池创建训练作业
专属资源池关联SFS Turbo显示异常 - AI开发平台ModelArts

专属资源池关联SFS Turbo时显示异常，关联失败。图1 关联异常图2 报错提示问题现象2 网络操作解除关联SFS Turbo后状态仍显示已关联且无报错信息，而解除关联按钮置灰不可操作。同时该网络的解除关联SFS Turbo按钮置灰不可操作。图3 关联SFS Turbo状态原因分析

 帮助中心 > AI开发平台ModelArts > 故障排除 > 资源池
ModelArts入门指引 - AI开发平台ModelArts

Standard同时提供了自动学习功能，帮助用户零代码构建AI模型，详细介绍请参见使用ModelArts Standard自动学习实现垃圾分类。面向AI工程师，熟悉代码编写和调测，您可以使用ModelArts Standard提供的在线代码开发环境，编写训练代码进行AI模型的开发。如果您想了解如何在ModelArts

帮助中心 > AI开发平台ModelArts > 快速入门
精度问题处理 - AI开发平台ModelArts

[ascend_context] precision_mode=enforce_fp32 # 使用fp32。其他方式需要实际分析算子层面的差异，需要联系华为工程师进行具体分析。父主题：模型精度调优

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 模型精度调优
使用SFS盘出现报错rpc_check_timeout:939 callbacks suppressed - AI开发平台ModelArts

弹性文件服务（Scalable File Service，SFS）提供按需扩展的高性能文件存储（NAS），可以在裸金属服务器中通过网络协议挂载使用，SFS支持NFS和CIFS的网络协议。在使用裸金属服务器时，将数据放在SFS盘中，并发建立多个NFS链接、并发的读写数据、做大模型训练。但有时

 帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
步骤总览 - AI开发平台ModelArts
步骤总览 - AI开发平台ModelArts

步骤总览单机单卡资源购买：购买对象存储服务OBS 购买容器镜像服务SWR 创建网络购买ModelArts专属资源池基本配置：权限配置 obsutils安装和配置（可选）工作空间配置训练：线下容器镜像构建及调试上传镜像上传数据和算法至OBS（首次使用时需要）使用Notebook进行代码调试

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练
离线训练安装包准备说明 - AI开发平台ModelArts

离线训练安装包准备说明申请的模型软件包一般依赖连通网络的环境。若用户的机器或资源池无法连通网络，并无法git clone下载代码、安装python依赖包的情况下，用户则需要找到已联网的机器（本章节以Linux系统机器为例）提前下载资源，以实现离线安装。用户可遵循以下步骤操作。步骤一：资源下载

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.910） > 训练脚本说明参考
服务韧性 - AI开发平台ModelArts
服务韧性 - AI开发平台ModelArts

检测等能力。安全防护套件覆盖和使用堡垒机，增强入侵检测和防御能力 ModelArts服务部署主机层、应用层、网络层和数据层的安全防护套件。及时检测主机层、应用层、网络层和数据层的安全入侵行为。 ModelArts服务涉及对互联网开放的Web应用，采用了统一推荐的Web安全组件防

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
离线训练安装包准备说明 - AI开发平台ModelArts

离线训练安装包准备说明在华为公有云平台，申请的资源一般要求连通网络。因此用户在准备环境时可以运行 scripts/install.sh 直接下载安装资源，或通过 Dockerfile 下载安装资源并构建一个新的镜像。若用户的机器或资源池无法连通网络，并无法git clone下载代码、安装pyt

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明参考
NPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

本文旨在指导如何在Snt9b裸金属服务器上，进行磁盘合并挂载、安装docker等环境配置。在配置前请注意如下事项：首次装机时需要配置存储、固件、驱动、网络访问等基础内容，这部分配置尽量稳定减少变化。裸机上的开发形式建议开发者启动独立的Docker容器作为个人开发环境。Snt9b的裸机包含8

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置 > 配置Lite Server软件环境
Notebook中使用Conda安装Keras 2.3.1报错 - AI开发平台ModelArts

Notebook中使用Conda安装Keras 2.3.1报错问题现象使用Conda安装Keras 2.3.1版本报错。原因分析可能是Conda网络不通，请使用pip install命令安装。解决方法执行 !pip install keras==2.3.1命令安装Keras。父主题：

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 环境配置故障
什么是Workflow - AI开发平台ModelArts

了算法开发到交付运维的全流程。和以往的开发交付不同，以往的开发与交付过程是分离的，算法工程师开发完的模型，一般都需要交付给下游系统工程师。MLOps和以往的开发交付不同，在这个过程中，算法工程师参与度还是非常高的。企业内部一般都是有一个交付配合的机制。从项目管理角度上需要增加一个

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发

总条数： 412

上一页
1
2
3
4
5
...
21
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ModelArts入门实践 - AI开发平台ModelArts

Lite Cluster&Server介绍 - AI开发平台ModelArts

JupyterLab中文件保存失败，如何解决？ - AI开发平台ModelArts

在ModelArts的Notebook中，访问外网速度不稳定怎么办？ - AI开发平台ModelArts

专属资源池VPC打通 - AI开发平台ModelArts

创建Standard专属资源池 - AI开发平台ModelArts

在ModelArts训练得到的模型欠拟合怎么办？ - AI开发平台ModelArts

最新动态 - AI开发平台ModelArts

创建训练作业时出现“实例挂卷失败”的事件 - AI开发平台ModelArts

专属资源池关联SFS Turbo显示异常 - AI开发平台ModelArts

ModelArts入门指引 - AI开发平台ModelArts

精度问题处理 - AI开发平台ModelArts

使用SFS盘出现报错rpc_check_timeout:939 callbacks suppressed - AI开发平台ModelArts

步骤总览 - AI开发平台ModelArts

离线训练安装包准备说明 - AI开发平台ModelArts

服务韧性 - AI开发平台ModelArts

离线训练安装包准备说明 - AI开发平台ModelArts

NPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

Notebook中使用Conda安装Keras 2.3.1报错 - AI开发平台ModelArts

什么是Workflow - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线