搜索_华为云

创建训练作业时出现“实例挂卷失败”的事件 - AI开发平台ModelArts

网段为192.168.20.0/24。专属资源池实际使用的网段可以在资源池的详情页面查看“网络”获取。条件二：SFS Turbo网段不能与172网段重叠，否则会和容器网络发生冲突，因为容器网络使用的是172网段。如果不满足条件，则修改SFS Turbo的VPC网段，推荐网段为10

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 专属资源池创建训练作业
JupyterLab中文件保存失败，如何解决？ - AI开发平台ModelArts

在Notebook中的运行文件超过指定大小就会提示此报错。 jupyter页面打开时间太长。网络环境原因，是否有连接网络代理。解决方法关掉插件然后重新保存。减少文件大小。重新打开jupyter页面。请检查网络。父主题：环境配置故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 环境配置故障
GPU裸金属服务器使用EulerOS内核误升级如何解决 - AI开发平台ModelArts

首先查看当前操作系统内核。 [root@Server-ddff ~]# uname -r 4.18.0-147.5.1.6.h934.eulerosv2r9.x86_64 一般执行如下升级命令，就会导致自动下载和安装高级内核版本。 yum update -y 执行后查看当前可用内核，发现已经新增了内核h998：

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
在ModelArts的Notebook中，访问外网速度不稳定怎么办？ - AI开发平台ModelArts

ModelArts提供了一个免费的共享网络代理服务。借助这个代理，开发者可以更加便捷地下载所需的各类资源，助力开发工作的顺利进行。由于该网络代理免费且共享，其性能会受到实时访问量大小的显著影响。当众多用户同时使用代理进行资源下载时，网络带宽会被大量占用，从而导致代理速度下降，

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
专属资源池VPC打通 - AI开发平台ModelArts

“AI专属资源池 > 弹性集群Cluster”，在“网络”页签，单击网络列表中某个网络操作列的“打通VPC”。图1 打通VPC 在打通VPC弹框中，打开“打通VPC”开关，在下拉框中选择可用的VPC和子网。需要打通的对端网络不能和当前网段重叠。图2 打通VPC参数选择如果

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置
查找Workflow工作流 - AI开发平台ModelArts

查找Workflow工作流查找Workflow 在Workflow列表页，您可以通过搜索框，根据工作流的属性类型快速搜索过滤到相应的工作流，可节省您的时间。登录ModelArts管理控制台，在左侧导航栏选择“开发空间>Workflow”，进入Workflow总览页面。在工作

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 管理Workflow
AI开发基本概念 - AI开发平台ModelArts

到客户群体的分类、客户背景分析、客户购买趋势预测、市场的细分等。与分类不同，聚类分析数据对象，而不考虑已知的类标号（一般训练数据中不提供类标号）。聚类可以产生这种标号。对象根据最大化类内的相似性、最小化类间的相似性的原则进行聚类或分组。对象的聚类是这样形成的，使得在一个聚类中的

 帮助中心 > AI开发平台ModelArts > 产品介绍 > AI开发基础知识
在ModelArts训练得到的模型欠拟合怎么办？ - AI开发平台ModelArts

模型复杂化。对同一个算法复杂化。例如回归模型添加更多的高次项，增加决策树的深度，增加神经网络的隐藏层数和隐藏单元数等。弃用原来的算法，使用一个更加复杂的算法或模型。例如用神经网络来替代线性回归，用随机森林来代替决策树。增加更多的特征，使输入数据具有更强的表达能力。特征

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
查询OS的配置参数 - AI开发平台ModelArts

查询OS的配置参数功能介绍获取ModelArts OS服务的配置参数，如网络网段，用户资源配额等。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v1

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
查询OS的配额 - AI开发平台ModelArts

查询OS的配额功能介绍获取ModelArts OS服务中部分资源的配额，如资源池配额、网络配额等。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v1

帮助中心 > AI开发平台ModelArts > API参考 > 配额管理
专属资源池关联SFS Turbo显示异常 - AI开发平台ModelArts

专属资源池关联SFS Turbo时显示异常，关联失败。图1 关联异常图2 报错提示问题现象2 网络操作解除关联SFS Turbo后状态仍显示已关联且无报错信息，而解除关联按钮置灰不可操作。同时该网络的解除关联SFS Turbo按钮置灰不可操作。图3 关联SFS Turbo状态原因分析

 帮助中心 > AI开发平台ModelArts > 故障排除 > 资源池
使用SFS盘出现报错rpc_check_timeout:939 callbacks suppressed - AI开发平台ModelArts

弹性文件服务（Scalable File Service，SFS）提供按需扩展的高性能文件存储（NAS），可以在裸金属服务器中通过网络协议挂载使用，SFS支持NFS和CIFS的网络协议。在使用裸金属服务器时，将数据放在SFS盘中，并发建立多个NFS链接、并发的读写数据、做大模型训练。但有时

 帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
步骤总览 - AI开发平台ModelArts
步骤总览 - AI开发平台ModelArts

步骤总览单机单卡资源购买：购买对象存储服务OBS 购买容器镜像服务SWR 创建网络购买ModelArts专属资源池基本配置：权限配置 obsutils安装和配置（可选）工作空间配置训练：线下容器镜像构建及调试上传镜像上传数据和算法至OBS（首次使用时需要）使用Notebook进行代码调试

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练
不同机型的对应的软件配套版本 - AI开发平台ModelArts

Standard 集群版本：v1.23|v1.25|v1.28（推荐）集群规模：50|200|1000|2000 集群网络模式：容器隧道网络|VPC 分布式训练时仅支持容器隧道网络集群转发模式：iptables|ipvs gpu-beta gpu-driver rdma-sriov-dev-plugin

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster使用前必读
服务韧性 - AI开发平台ModelArts
服务韧性 - AI开发平台ModelArts

检测等能力。安全防护套件覆盖和使用堡垒机，增强入侵检测和防御能力 ModelArts服务部署主机层、应用层、网络层和数据层的安全防护套件。及时检测主机层、应用层、网络层和数据层的安全入侵行为。 ModelArts服务涉及对互联网开放的Web应用，采用了统一推荐的Web安全组件防

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
离线训练安装包准备说明 - AI开发平台ModelArts

离线训练安装包准备说明申请的模型软件包一般依赖连通网络的环境。若用户的机器或资源池无法连通网络，并无法git clone下载代码、安装python依赖包的情况下，用户则需要找到已联网的机器（本章节以Linux系统机器为例）提前下载资源，以实现离线安装。用户可遵循以下步骤操作。步骤一：资源下载

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.910） > 训练脚本说明参考
离线训练安装包准备说明 - AI开发平台ModelArts

离线训练安装包准备说明在华为公有云平台，申请的资源一般要求连通网络。因此用户在准备环境时可以运行 scripts/install.sh 直接下载安装资源，或通过 Dockerfile 下载安装资源并构建一个新的镜像。若用户的机器或资源池无法连通网络，并无法git clone下载代码、安装pyt

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明参考
API概览 - AI开发平台ModelArts
API概览 - AI开发平台ModelArts

事件管理 API 说明查询事件列表查询事件列表。表17 网络管理 API 说明创建网络资源创建网络资源。查询网络资源列表查询网络资源列表。查询网络资源查询指定网络资源的详情信息。删除网络资源删除指定网络资源。更新网络资源更新指定网络资源。表18 资源指标管理

 帮助中心 > AI开发平台ModelArts > API参考
msprobe精度比对 - AI开发平台ModelArts

值与CPU或GPU芯片中的API计算数值，进行问题定位。同一模型，进行迭代（模型、框架版本升级或设备硬件升级）时存在的精度下降问题，对比相同模型在迭代前后版本的API计算数值，进行问题定位。首先通过在PyTorch训练脚本中插入dump接口，跟踪计算图中算子的前向传播与反向传

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > msprobe工具使用指导
Notebook中使用Conda安装Keras 2.3.1报错 - AI开发平台ModelArts

Notebook中使用Conda安装Keras 2.3.1报错问题现象使用Conda安装Keras 2.3.1版本报错。原因分析可能是Conda网络不通，请使用pip install命令安装。解决方法执行 !pip install keras==2.3.1命令安装Keras。父主题：

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 环境配置故障

总条数： 1444

上一页
1
2
3
4
5
...
73
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建训练作业时出现“实例挂卷失败”的事件 - AI开发平台ModelArts

JupyterLab中文件保存失败，如何解决？ - AI开发平台ModelArts

GPU裸金属服务器使用EulerOS内核误升级如何解决 - AI开发平台ModelArts

在ModelArts的Notebook中，访问外网速度不稳定怎么办？ - AI开发平台ModelArts

专属资源池VPC打通 - AI开发平台ModelArts

查找Workflow工作流 - AI开发平台ModelArts

AI开发基本概念 - AI开发平台ModelArts

在ModelArts训练得到的模型欠拟合怎么办？ - AI开发平台ModelArts

查询OS的配置参数 - AI开发平台ModelArts

查询OS的配额 - AI开发平台ModelArts

专属资源池关联SFS Turbo显示异常 - AI开发平台ModelArts

使用SFS盘出现报错rpc_check_timeout:939 callbacks suppressed - AI开发平台ModelArts

步骤总览 - AI开发平台ModelArts

不同机型的对应的软件配套版本 - AI开发平台ModelArts

服务韧性 - AI开发平台ModelArts

离线训练安装包准备说明 - AI开发平台ModelArts

离线训练安装包准备说明 - AI开发平台ModelArts

API概览 - AI开发平台ModelArts

msprobe精度比对 - AI开发平台ModelArts

Notebook中使用Conda安装Keras 2.3.1报错 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线