搜索_华为云

推理场景介绍 - AI开发平台ModelArts

909版本，请参考软件配套版本获取配套版本的软件包，请严格遵照版本配套关系使用本文档。资源规格推荐使用“西南-贵阳一”Region上的Lite k8s Cluster和昇腾Snt9B资源。本文档中的CCE集群版本选择v1.27~1.28。版本使用的容器引擎为Containerd。推理部署使用的服务框架是vLLM。vLLM支持v0

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）
获取训练作业事件列表 - AI开发平台ModelArts

limit String 最大显示条数。 offset String 开始的条数。 order String 排序方式。 start_time String 事件的开始时间。 end_time String 事件的结束时间。 events Array of Event objects

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
Notebook提示磁盘空间已满 - AI开发平台ModelArts

致磁盘空间不足。磁盘配额不足。处理方法查看虚拟机所使用的存储空间，再查看回收站文件占用内存，根据实际删除回收站里不需要的大文件。在Notebook实例详情页，查看实例的存储容量。执行如下命令，排查虚拟机所使用的存储空间，一般接近存储容量，请排查回收站占用内存。 cd /home/ma-user/work

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 环境配置故障
创建可视化作业 - AI开发平台ModelArts

可视化作业名称。限制为1-20位只含数字，字母，下划线，中划线的名称。 job_desc 否 String 对可视化作业的描述，默认为空，字符串的长度限制为[0, 256]。 train_url 是 String OBS路径地址。 job_type 否 String 可视化的类型，可选的有tensorboard和m

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 可视化作业
使用Gallery CLI配置工具下载文件 - AI开发平台ModelArts

Gallery仓库依次下载除某种格式之外的其他格式的文件到服务器的缓存目录下。 gallery-cli download {repo_id} --exclude "*.json" 如下所示，表示下载除“.json”格式之外的其他格式的文件到服务器的缓存目录“/test”下，当回显“100%”时表示下载完成。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > Gallery CLI配置工具指南
创建并管理工作空间 - AI开发平台ModelArts

在ModelArts管理控制台的左侧导航栏中，选择“工作空间”进入工作空间列表。在工作空间列表，单击操作列的“配额管理”进入工作空间详情页。在配额信息页面可以查看工作空间设置的配额值、已用的配额、最后修改时间等配额信息。单击配额信息右侧的“修改配额”可以修改配额值。配置值的配置说明请参见表2。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard准备工作
训练前卡死 - AI开发平台ModelArts

的交换机不会支持v1，就无法启动。 NCCL_IB_TC=128：数据包走交换机的队列4通道，这是RoCE协议标准。 NCCL_IB_TIMEOUT=22：把超时时间设置长一点，正常情况下网络不稳定会有5秒钟左右的间断，超过5秒就返回timeout了，改成22预计有二十秒左右，算法为4

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业卡死
配置ModelArts委托权限 - AI开发平台ModelArts

授权”。在弹出的“添加授权”窗口中，选择：授权对象类型：所有用户委托选择：新增委托权限配置：普通用户选择完成后勾选“我已经详细阅读并同意《ModelArts服务声明》”，然后单击“创建”。图1 配置委托访问授权完成配置后，在ModelArts控制台的权限管理列表，可查看到此账号的委托配置信息。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置 > 权限配置
MXNet创建kvstore时程序被阻塞，无报错 - AI开发平台ModelArts

print('start') kv_store = mxnet.kv.create('dist_async') print('end') 原因分析 worker阻塞的原因可能是连不上server。处理方法将如下代码放在“启动文件”里“import mxnet”之前可以看到节点间相互通信状态，同时ps能够重新发送。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
ModelArts支持哪些AI框架？ - AI开发平台ModelArts

ModelArts支持哪些AI框架？ ModelArts的开发环境Notebook、训练作业、模型推理（即AI应用管理和部署上线）支持的AI框架及其版本，不同模块的呈现方式存在细微差异，各模块支持的AI框架请参见如下描述。统一镜像列表 ModelArts提供了ARM+Ascend规格的统一镜像，包括MindS

帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题
资源超分对Notebook实例有什么影响？ - AI开发平台ModelArts

6就是超分比率。即启动该Notebook实例最少需要1.2U的CPU，运行Notebook时最大使用到2U的资源；内存同理，最少需要4.8G的内存，运行时最大使用到8U的内存。超分情况下会存在实例终止的风险。如1个8U的节点上同时启动了6个2U的实例，如果其中一个实例CPU使用增大到超过节点的上限（8U）时，k8S会将使用资源最多的实例终止掉。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 更多功能咨询
删除资源池 - AI开发平台ModelArts

Integer 资源规格的弹性使用量，物理池该值和count相同。 azs Array of azs objects 资源所在的AZ的数量。 nodePool String 节点池名称。比如：nodePool-1。表15 azs 参数参数类型描述 az String AZ的名称。 count

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
查询资源池 - AI开发平台ModelArts

object 资源池的metadata信息。 spec PoolSpecModel object 资源池的期望信息。 status PoolStatus object 资源池的状态信息。表4 PoolMetadata 参数参数类型描述 name String 系统自动生成的pool名称，相当于pool

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
镜像方案说明 - AI开发平台ModelArts

镜像方案说明准备大模型训练适用的容器镜像，包括获取镜像地址，了解镜像中包含的各类固件版本，配置Standard物理机环境操作。基础镜像地址本教程中用到的训练的基础镜像地址和配套版本关系如下表所示，请提前了解。表1 基础容器镜像地址镜像用途镜像地址配套版本训练基础镜像

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.909） > 准备工作 > 准备镜像
镜像方案说明 - AI开发平台ModelArts

镜像方案说明准备大模型训练适用的容器镜像，包括获取镜像地址，了解镜像中包含的各类固件版本，配置Standard物理机环境操作。基础镜像地址本教程中用到的训练的基础镜像地址和配套版本关系如下表所示，请提前了解。表1 基础容器镜像地址镜像用途镜像地址配套版本训练基础镜像

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.908） > 准备工作 > 准备镜像
ModelArts如何通过标签实现资源分组管理 - AI开发平台ModelArts

创建完成的在线服务详情页面的“标签”页签中添加标签。在ModelArts的专属资源池中添加标签。可以在创建弹性集群的时候添加标签，也可以在已经创建完成的资源池详情页面的“标签”页签中添加标签。图1 添加标签用户也可以在ModelArts任务中添加标签时，创建新的标签，直接

 帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题
镜像方案说明 - AI开发平台ModelArts

镜像方案说明准备大模型训练适用的容器镜像，包括获取镜像地址，了解镜像中包含的各类固件版本，配置Standard物理机环境操作。基础镜像地址本教程中用到的训练的基础镜像地址和配套版本关系如下表所示，请提前了解。表1 基础容器镜像地址镜像用途镜像地址配套版本基础镜像 swr

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.909） > 准备工作 > 准备镜像
镜像方案说明 - AI开发平台ModelArts

镜像方案说明准备大模型训练适用的容器镜像，包括获取镜像地址，了解镜像中包含的各类固件版本，配置Standard物理机环境操作。基础镜像地址本教程中用到的训练的基础镜像地址和配套版本关系如下表所示，请提前了解。表1 基础容器镜像地址镜像用途镜像地址配套版本基础镜像 swr

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.908） > 准备工作 > 准备镜像
模型包结构介绍 - AI开发平台ModelArts

创建AI应用时，如果是从OBS中导入元模型，则需要符合一定的模型包规范。模型包规范适用于单模型场景，如果是多模型场景（例如含有多个模型文件）推荐使用自定义镜像方式。 ModelArts推理平台不支持的AI引擎，推荐使用自定义镜像方式。请参考创建AI应用的自定义镜像规范和从0-1制作自定义镜像并创建AI应用，制作自定义镜像。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建AI应用规范参考
镜像方案说明 - AI开发平台ModelArts

镜像方案说明准备大模型训练适用的容器镜像，包括获取镜像地址，了解镜像中包含的各类固件版本，配置Standard物理机环境操作。基础镜像地址本教程中用到的训练的基础镜像地址和配套版本关系如下表所示，请提前了解。表1 基础容器镜像地址镜像用途镜像地址配套版本训练基础镜像

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 准备工作 > 准备镜像

总条数： 1687

上一页
1
...
80
81
82
...
85
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

推理场景介绍 - AI开发平台ModelArts

获取训练作业事件列表 - AI开发平台ModelArts

Notebook提示磁盘空间已满 - AI开发平台ModelArts

创建可视化作业 - AI开发平台ModelArts

使用Gallery CLI配置工具下载文件 - AI开发平台ModelArts

创建并管理工作空间 - AI开发平台ModelArts

训练前卡死 - AI开发平台ModelArts

配置ModelArts委托权限 - AI开发平台ModelArts

MXNet创建kvstore时程序被阻塞，无报错 - AI开发平台ModelArts

ModelArts支持哪些AI框架？ - AI开发平台ModelArts

资源超分对Notebook实例有什么影响？ - AI开发平台ModelArts

删除资源池 - AI开发平台ModelArts

查询资源池 - AI开发平台ModelArts

镜像方案说明 - AI开发平台ModelArts

镜像方案说明 - AI开发平台ModelArts

ModelArts如何通过标签实现资源分组管理 - AI开发平台ModelArts

镜像方案说明 - AI开发平台ModelArts

镜像方案说明 - AI开发平台ModelArts

模型包结构介绍 - AI开发平台ModelArts

镜像方案说明 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线