搜索_华为云

训练作业的日志出现detect failed（昇腾预检失败） - AI开发平台ModelArts

ce 原因分析出现该问题的可能原因如下：用户的自定义镜像中无ascend_check工具，导致启动预检失败。用户的自定义镜像中的ascend相关工具不可用，导致预检失败。处理方法通过给训练作业加环境变量“MA_DETECT_TRAIN_INJECT_CODE”并将对应的

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > Ascend相关问题
自动学习/Workflow计费项 - AI开发平台ModelArts

在ModelArts自动学习和Workflow中进行模型训练和推理时，会使用计算资源和存储资源，会产生计算资源和存储资源的累计值计费。具体内容如表1所示。计算资源费用：如果运行自动学习作业/Workflow工作流时，使用专属资源池进行模型训练和推理，计算资源不计费。如果运行自动学习

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费项
使用AI Gallery的订阅算法实现花卉识别 - AI开发平台ModelArts

rts上运行训练作业推荐使用免费资源，将模型部署为在线服务推荐使用免费资源。但是数据集存储在OBS桶中会收取少量费用，具体计费请参见OBS价格详情页，案例使用完成后请及时清除资源和数据。准备工作注册华为账号并开通华为云、实名认证注册华为账号并开通华为云进行实名认证配置委托访问授权

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
常见的磁盘空间不足的问题和解决办法 - AI开发平台ModelArts

on device”。可能是inode不足，或者是触发操作系统的文件索引缓存问题，导致操作系统无法创建文件，造成用户磁盘占满。触发条件和下面的因素有关：文件名越长，文件数量的上限越小。 blocksize越小，文件数量的上限越小。 blocksize系统默认为4096B，总共有

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
报错“Bad owner or permissions on C:\Users\Administrator/.ssh/config”如何解决？ - AI开发平台ModelArts

ssh/config”。原因分析文件夹“.ssh”的权限不仅是Windows当前用户拥有，或者当前用户权限不足，故修改权限即可。解决方案找到.ssh文件夹。一般位于“C:\Users”，例如“C:\Users\xxx”。 “C:\Users”目录下的文件名必须和Windows登录用户名完全一致。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
功能总览 - AI开发平台ModelArts
功能总览 - AI开发平台ModelArts

针对使用常用框架完成模型开发和训练的场景，可以将您的模型导入至ModelArts中，创建为AI应用，进行统一管理。 1、如果您是在ModelArts中训练得到的模型，可直接从训练中导入模型。 2、如果您在本地或其他平台训练得到模型，可先将模型上传至OBS，再从OBS中导入模型。从OBS导入元模型（手动配置）

帮助中心 > AI开发平台ModelArts > 功能总览
创建和保存Pascal VOC文件 - AI开发平台ModelArts

创建和保存Pascal VOC文件需要先创建包含Pascal VOC信息的对象，然后保存。Pascal VOC信息请见表2。路径支持本地和OBS，如果是OBS，需要Session信息。 pascal_voc.save_xml(xml_file_path, save_mode='w'

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > Manifest管理
常见错误原因和解决方法 - AI开发平台ModelArts

常见错误原因和解决方法显存溢出错误网卡名称错误联网下载SimSun.ttf时可能会遇到网络问题在运行finetune_ds.sh 时遇到报错父主题： Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912）

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912）
使用VS Code连接实例时，发现VS Code端的实例目录和云上目录不匹配 - AI开发平台ModelArts

实例连接错误，可能是配置文件写的不规范导致连接到别的实例。解决方案检查用户.ssh配置文件（路径一般在“C:\Users\{User}\.ssh\config”下），检查每组配置文件是否规范：Host必须放在每组配置的第一行，作为每组配置的唯一ID。如下，第一组配置文件不规范将Hos

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
约束与限制 - AI开发平台ModelArts

用于训练的自定义镜像的默认用户必须为“uid”为“1000”的用户。 Standard推理的创建模型创建模型时导入OBS文件，最大支持20GB。更多信息，请参见创建AI应用。创建模型时，系统文件超过容器引擎空间大小时，会提示镜像内空间不足。当前，公共资源池容器引擎空间的大小最大支持5

帮助中心 > AI开发平台ModelArts > 产品介绍
产品优势 - AI开发平台ModelArts
产品优势 - AI开发平台ModelArts

开“箱”即用，涵盖AI开发全流程，包含数据处理、模型开发、训练、管理、部署功能，可灵活使用其中一个或多个功能。支持本地IDE+ModelArts 插件远程开发能力，线上线下协同开发，开发训练一体化架构，支持大模型分布式部署及推理。统一管理AI开发全流程，提升开发效率，记录模型构建实验全流程。多场景部署，灵活满足业务需求

 帮助中心 > AI开发平台ModelArts > 产品介绍
在Lite Cluster资源池上使用Snt9B完成分布式训练任务 - AI开发平台ModelArts

如图所示为8卡，pod配置成功。图4 查看卡信息查看卡间通信配置文件，执行以下命令。 cat /user/config/jobstart_hccl.json 多卡训练时，需要依赖“rank_table_file”做卡间通信的配置文件，该文件自动生成，pod启动之后文件地址。为“/user/config/jobstart_hccl

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
计费说明 - AI开发平台ModelArts
计费说明 - AI开发平台ModelArts

ModelArts是面向AI开发者的一站式开发平台，提供海量数据预处理及半自动化标注、大规模分布式训练、自动化模型生成及端-边-云模型按需部署能力，帮助用户快速创建和部署模型，管理全周期AI工作流。 ModelArts服务的计费方式简单、灵活，您既可以选择按实际使用时长计费，也可以

 帮助中心 > AI开发平台ModelArts > 产品介绍
在MaaS应用实践中心查看应用解决方案 - AI开发平台ModelArts

提供一整套解决方案。 KooSearch企业搜索服务：基于在MaaS开源大模型部署的模型API，搭建企业专属方案、LLM驱动的语义搜索、多模态搜索增强。盘古数字人大脑：基于在MaaS开源大模型部署的模型API，升级智能对话解决方案，含智能客服、数字人。 Dify：支持自部署的应

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
Standard Workflow - AI开发平台ModelArts

Workflow是开发者基于实际业务场景开发用于部署模型或应用的流水线工具，核心是将完整的机器学习任务拆分为多步骤工作流，每个步骤都是一个可管理的组件，可以单独开发、优化、配置和自动化。Workflow有助于标准化机器学习模型生成流程，使团队能够大规模执行AI任务，并提高模型生成的效率。 ModelArts

帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
ModelArts自动学习与ModelArts PRO的区别是什么？ - AI开发平台ModelArts

文本分类、声音分类等场景的模型。而ModelArts PRO是一款为企业级AI应用打造的专业开发套件。用户可根据预置工作流生成指定场景模型，无需深究底层模型开发细节。ModelArts PRO底层依托ModelArts平台提供数据标注、模型训练、模型部署等能力。也可以理解为增强

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习
服务部署、启动、升级和修改时，拉取镜像失败如何处理？ - AI开发平台ModelArts

服务部署、启动、升级和修改时，拉取镜像失败如何处理？问题现象服务部署、启动、升级和修改时，拉取镜像失败。原因分析节点磁盘不足，镜像大小过大。解决方法首先考虑优化镜像，减小节点磁盘的占用。优化镜像无法解决问题，请联系系统管理员处理。父主题：服务部署

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
ECS中上传新镜像 - AI开发平台ModelArts

ECS中上传新镜像 Step1 在ECS中Docker登录在SWR中单击右上角的“登录指令”，然后在跳出的登录指定窗口，单击复制临时登录指令。在创建的ECS中粘贴临时登录指令，即可完成登录。图1 复制登录指令 Step2 修改并上传镜像在ECS服务器中输入登录指令后，使用下

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 准备工作 > 准备镜像
网卡名称错误 - AI开发平台ModelArts

网卡名称错误当训练开始时提示网卡名称错误。或者通信超时。可以使用ifconfig命令检查网卡名称配置是否正确。比如，ifconfig看到当前机器IP对应的网卡名称为enp67s0f5，则可以设置环境变量指定该值。 export GLOO_SOCKET_IFNAME=enp67s0f5

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 常见错误原因和解决方法
联网下载SimSun.ttf时可能会遇到网络问题 - AI开发平台ModelArts

py会在cache中读取SimSun.ttf 文件，如果没有，就会联网下载，可能会遇到： SSL:CERTIFICATE_VERIFY_FAILED ssl.1129错误 407 Proxy Authentication Required 解决方案： 1. 直接手动下载 SimSun.ttf 传到模型权重目录下

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 常见错误原因和解决方法

总条数： 2329

上一页
1
...
76
77
78
...
117
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练作业的日志出现detect failed（昇腾预检失败） - AI开发平台ModelArts

自动学习/Workflow计费项 - AI开发平台ModelArts

使用AI Gallery的订阅算法实现花卉识别 - AI开发平台ModelArts

常见的磁盘空间不足的问题和解决办法 - AI开发平台ModelArts

报错“Bad owner or permissions on C:\Users\Administrator/.ssh/config”如何解决？ - AI开发平台ModelArts

功能总览 - AI开发平台ModelArts

创建和保存Pascal VOC文件 - AI开发平台ModelArts

常见错误原因和解决方法 - AI开发平台ModelArts

使用VS Code连接实例时，发现VS Code端的实例目录和云上目录不匹配 - AI开发平台ModelArts

约束与限制 - AI开发平台ModelArts

产品优势 - AI开发平台ModelArts

在Lite Cluster资源池上使用Snt9B完成分布式训练任务 - AI开发平台ModelArts

计费说明 - AI开发平台ModelArts

在MaaS应用实践中心查看应用解决方案 - AI开发平台ModelArts

Standard Workflow - AI开发平台ModelArts

ModelArts自动学习与ModelArts PRO的区别是什么？ - AI开发平台ModelArts

服务部署、启动、升级和修改时，拉取镜像失败如何处理？ - AI开发平台ModelArts

ECS中上传新镜像 - AI开发平台ModelArts

网卡名称错误 - AI开发平台ModelArts

联网下载SimSun.ttf时可能会遇到网络问题 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线