搜索_华为云

创建训练任务 - AI开发平台ModelArts

训练作业创建完成后，后台将自动完成容器镜像下载、代码目录下载、执行启动命令等动作。训练作业一般需要运行一段时间，根据您的训练业务逻辑和选择的资源不同，训练时长将持续几十分钟到几小时不等。训练作业执行成功后，日志信息如下所示。父主题：单机多卡

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机多卡
Standard自动学习 - AI开发平台ModelArts

ModelArts自动学习，为入门级用户提供AI零代码解决方案支持图片分类、物体检测、预测分析、声音分类场景自动执行模型开发、训练、调优和推理机器学习的端到端过程根据最终部署环境和开发者需求的推理速度，自动调优并生成满足要求的模型 ModelArts自动学习，为资深级用户提供模板化开发能力提

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
团队标注审核 - AI开发平台ModelArts

sample_id 否 String 样本ID，可调用查询样本列表接口获取。 score 否 String 评审分数，当前可取A/B/C/D四个值，从高到低排列。 worker_id 否 String 标注成员ID，可调用标注成员列表接口获取。响应参数无请求示例团队标注审核。设置是否通过为“true”，评审分数为“A”。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
Lite Server资源开通 - AI开发平台ModelArts

授权允许ModelArts代表用户去访问其他云服务。进入到ModelArts控制台的“权限管理”页面，单击“添加授权”，根据提示进行操作。更新委托如果之前给ModelArts创过委托授权，此处可以更新授权。进入到ModelArts控制台的“资源管理>AI专属资源池>弹性节

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server）
模型包结构介绍 - AI开发平台ModelArts

如果您在导入元模型过程中遇到问题，可联系华为云技术支持协助解决故障。模型包结构示例 TensorFlow模型包结构发布该模型时只需要指定到“ocr”目录。 OBS桶/目录名 |── ocr | ├── model 必选：固定子目录名称，用于放置模型相关文件 | │

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
发布免费模型 - AI开发平台ModelArts

Gallery首页，选择“资产集市 > 模型”，进入模型页面。单击“发布”，弹出“选择云服务区域”，选择区域后单击“确定”跳转到“发布资产到AI Gallery”页面。发布ModelArts模型如果是发布新资产。 “发布方式”选择“创建新资产”。填写“资产标题”。即在AI Gallery显示的资产名称。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 发布分享
管理Lite Cluster节点 - AI开发平台ModelArts

图4 添加/编辑/删除资源标签导出节点数据支持导出Lite资源池的节点信息到Excel表格中，方便查阅。勾选节点名称，在节点列表上方单击“导出 > 导出全部数据到XLSX”或者“导出 > 导出部分数据到XLSX”，在浏览器的下载记录中查看导出的Excel表格。驱动升级支持升

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
训练作业日志中提示“No such file or directory” - AI开发平台ModelArts

{training-project}”是存放训练代码的文件夹名称。训练时会自动下载OBS中{training-project}目录下的数据到训练容器的本地路径$MA_JOB_DIR/{training-project}/。如果报错路径为训练数据路径，需要在以下两个地方完成适配，

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
服务部署、启动、升级和修改时，资源不足如何处理？ - AI开发平台ModelArts

池扩容后再进行服务部署。公共资源池扩容，请联系系统管理员。专属资源池扩容，可参考扩缩容资源池。如果磁盘空间不够，可以尝试重试，使实例调度到其他节点。如果单实例仍磁盘空间不足，请联系系统管理员，更换合适的规格。如果是大模型导入的模型部署服务，请确保专属资源池磁盘空间大于1T（1000GB）。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
用户使用torch报错Unexpected error from cudaGetDeviceCount - AI开发平台ModelArts

如果环境中装了多版本的cuda，可以排查LD_LIBRARY_PATH中的cuda优先级，需要手动调整下。举例：如果cuda只兼容cuda-9.1，查询到LD_LIBRARY_PATH=/usr/local/cuda-11.8/lib64:/usr/local/cuda-9.1/lib64 需要手动调整优先级，执行命令export

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 自定义镜像故障
准备镜像环境 - AI开发平台ModelArts

容器不能挂载/home/ma-user目录，此目录为ma-user用户家目录。 driver及npu-smi需同时挂载至容器。不要将多个容器绑到同一个NPU上，会导致后续的容器无法正常使用NPU功能。 ${image_name} 为docker镜像的ID，在宿主机上可通过docker

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 准备工作
准备镜像环境 - AI开发平台ModelArts

容器不能挂载/home/ma-user目录，此目录为ma-user用户家目录。 driver及npu-smi需同时挂载至容器。不要将多个容器绑到同一个NPU上，会导致后续的容器无法正常使用NPU功能。 ${image_name} 为docker镜像的ID，在宿主机上可通过docker

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.909） > 准备工作
什么是ModelArts - AI开发平台ModelArts

境，多种操作流程和模式，方便开发者编码扩展，快速构建模型及应用。产品架构 ModelArts是一个一站式的开发平台，能够支撑开发者从数据到AI应用的全流程开发过程。包含数据处理、模型训练、AI应用管理、AI应用部署等操作，并且提供AI Gallery功能，能够在市场内与其他开发者分享模型。

帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题
【下线公告】华为云ModelArts服务旧版训练管理下线公告 - AI开发平台ModelArts

新的作业。旧版训练管理是否停止新购？是的，旧版训练管理将于2023年6月30日 00:00(北京时间)正式退市。旧版训练管理如何升级到新版训练？请参考新版训练指导文档（模型训练）来体验新版训练。旧版训练迁移至新版训练需要注意哪些问题？新版训练和旧版训练的差异主要体现在

 帮助中心 > AI开发平台ModelArts > 服务公告 > 下线公告
提交验收任务的样本评审意见 - AI开发平台ModelArts

sample_id 否 String 样本ID，可调用查询样本列表接口获取。 score 否 String 评审分数，当前可取A/B/C/D四个值，从高到低排列。 worker_id 否 String 标注成员ID，可调用标注成员列表接口获取。响应参数无请求示例提交验收任务的样本评审意

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
使用Gallery CLI配置工具上传文件 - AI开发平台ModelArts

──────────────────────────────────╯ 具体支持如下使用场景：上传单个文件上传多个文件上传单个文件到指定仓库目录上传整个文件夹准备工作获取“repo_id”和待上传的文件名。获取“repo_id” 在AI Gallery页面的资产详

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > Gallery CLI配置工具指南
准备镜像环境 - AI开发平台ModelArts

容器不能挂载/home/ma-user目录，此目录为ma-user用户家目录。 driver及npu-smi需同时挂载至容器。不要将多个容器绑到同一个NPU上，会导致后续的容器无法正常使用NPU功能。 ${image_name} 为docker镜像的ID，在宿主机上可通过docker

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907） > 准备工作
准备镜像环境 - AI开发平台ModelArts

容器不能挂载/home/ma-user目录，此目录为ma-user用户家目录。 driver及npu-smi需同时挂载至容器。不要将多个容器绑到同一个NPU上，会导致后续的容器无法正常使用NPU功能。 ${image_name} 为docker镜像的ID，在宿主机上可通过docker

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 准备工作
Qwen-VL基于DevServer适配Pytorch NPU的Finetune训练指导(6.3.910) - AI开发平台ModelArts

me/ma-user下，拉起容器时会与基础镜像冲突，导致基础镜像不可用。 driver及npu-smi需同时挂载至容器。不要将多个容器绑到同一个NPU上，会导致后续的容器无法正常使用NPU功能。进入容器。需要将${container_name}替换为实际的容器名称。启动容器默认使用ma-user用户。

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
Qwen-VL基于DevServer适配Pytorch NPU的Finetune训练指导（6.3.909） - AI开发平台ModelArts

me/ma-user下，拉起容器时会与基础镜像冲突，导致基础镜像不可用。 driver及npu-smi需同时挂载至容器。不要将多个容器绑到同一个NPU上，会导致后续的容器无法正常使用NPU功能。进入容器。需要将${container_name}替换为实际的容器名称。启动容器默认使用ma-user用户。

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理

总条数： 975

上一页
1
...
38
39
40
...
49
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建训练任务 - AI开发平台ModelArts

Standard自动学习 - AI开发平台ModelArts

团队标注审核 - AI开发平台ModelArts

Lite Server资源开通 - AI开发平台ModelArts

模型包结构介绍 - AI开发平台ModelArts

发布免费模型 - AI开发平台ModelArts

管理Lite Cluster节点 - AI开发平台ModelArts

训练作业日志中提示“No such file or directory” - AI开发平台ModelArts

服务部署、启动、升级和修改时，资源不足如何处理？ - AI开发平台ModelArts

用户使用torch报错Unexpected error from cudaGetDeviceCount - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

什么是ModelArts - AI开发平台ModelArts

【下线公告】华为云ModelArts服务旧版训练管理下线公告 - AI开发平台ModelArts

提交验收任务的样本评审意见 - AI开发平台ModelArts

使用Gallery CLI配置工具上传文件 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

Qwen-VL基于DevServer适配Pytorch NPU的Finetune训练指导(6.3.910) - AI开发平台ModelArts

Qwen-VL基于DevServer适配Pytorch NPU的Finetune训练指导（6.3.909） - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线