-
规格中数字分别代表什么含义? - AI开发平台ModelArts
在创建作业时,若需选择资源规格,您可通过规格名称了解对应规格的相关信息,如加速卡显存、CPU核心数、内存、硬盘大小。 例如,“GPU: 1*GP-Vnt1(32GB) | CPU: 8 核 64GB 3200GB”中,32G为GPU显存、8核为CPU核心数、64GB为内存、3200GB为硬盘大小。
-
镜像保存如何保证能正常保存,不会因为超过35G而保存失败? - AI开发平台ModelArts
镜像保存如何保证能正常保存,不会因为超过35G而保存失败? 可以从如下几方面考虑: 请选择较小的基础镜像创建Notebook实例,这样在实例中可操作的空间才会大,可自由安装的包才能更多,一般建议原始的启动Notebook的基础镜像在SWR侧查看大小不要超过6G。 镜像保存主要保存在/home
-
分页查询智能任务列表 - AI开发平台ModelArts
任务的列表。 “智能标注”是指基于当前标注阶段的标签及图片学习训练,选中系统中已有的模型进行智能标注,快速完成剩余图片的标注操作。“智能标注”又包含“主动学习”和“预标注”两类。 “主动学习”表示系统将自动使用半监督学习、难例筛选等多种手段进行智能标注,降低人工标注量,帮助用户找到难例。
-
附录:大模型推理常见问题 - AI开发平台ModelArts
附录:大模型推理常见问题 问题1:在推理预测过程中遇到NPU out of memory 解决方法:调整推理服务启动时的显存利用率,将--gpu-memory-utilization的值调小。 问题2:在推理预测过程中遇到ValueError:User-specified max_model_len
-
自动学习 - AI开发平台ModelArts
自动学习的关键技术主要是基于信息熵上限近似模型的树搜索最优特征变换和基于信息熵上限近似模型的贝叶斯优化自动调参。通过这些关键技术,可以从企业关系型(结构化)数据中,自动学习数据特征和规律,智能寻优特征&ML模型及参数,准确性甚至达到专家开发者的调优水平。自动深度学习的关键技术
-
从0到1利用ML Studio进行机器学习建模 - AI开发平台ModelArts
从0到1利用ML Studio进行机器学习建模 本章节基于餐厅销量预测场景,从零开始介绍如何制作销售销量训练及销售销量预测两个算链。 前提条件 已经创建一个基于ML Studio的Notebook镜像,并进入MLS Editor可视化编辑界面,具体参考进入ML Studio操作界面章节。
-
Notebook实例出现“Server Connection Error”错误 - AI开发平台ModelArts
Notebook实例出现“Server Connection Error”错误 在Terminal中执行命令时,出现错误如图1 报错信息截图所示,此问题可能由于CPU/GPU或显存等占满,可在JupyterLab界面下方查看内存使用情况,如图2所示。 此时Kernel会自动重启,存储在“/home/ma-user/w
-
ModelArts与DLS服务的区别? - AI开发平台ModelArts
ModelArts与DLS服务的区别? 深度学习服务(DLS)是基于华为云强大高性能计算提供的一站式深度学习平台服务,内置大量优化的网络模型,以便捷、高效的方式帮助用户轻松使用深度学习技术,通过灵活调度按需服务化方式提供模型训练与评估。 但是,DLS服务仅提供深度学习技术,而ModelArts集成了深度学习和机器
-
SDXL ComfyUI插件基于DevServer适配PyTorch NPU推理指导 - AI开发平台ModelArts
精确定制和可靠复现。每一个节点都有特定的功能,可以通过调整节点连接达到不同的出图效果。在图像生成方面,它不仅比传统的WebUI更迅速,而且显存占用更为经济。 本文档主要介绍如何在ModelArts Lite的DevServer环境中部署ComfyUI,使用NPU卡进行推理。 方案概览
-
自动学习简介 - AI开发平台ModelArts
自动学习简介 自动学习功能介绍 ModelArts自动学习是帮助人们实现AI应用的低门槛、高灵活、零代码的定制化模型开发工具。自动学习功能根据标注数据自动设计模型、自动调参、自动训练、自动压缩和部署模型。开发者无需专业的开发基础和编码能力,只需上传数据,通过自动学习界面引导和简单操作即可完成模型训练和部署。
-
特权池信息数据显示均为0%如何解决? - AI开发平台ModelArts
特权池信息数据显示均为0%如何解决? 问题现象 特权池基本信息页面数据均显示为0%(如CPU使用率、内存使用率、加速卡使用率、加速卡显存使用率)。 原因分析 原因是集群没有安装ICAgent。新建特权池时默认会安装ICAgent,可能由于用户自行卸载ICAgent,导致资源池数据显示异常。
-
NPU Snt9B裸金属服务器安装深度学习框架PyTorch - AI开发平台ModelArts
NPU Snt9B裸金属服务器安装深度学习框架PyTorch 场景描述 昇腾为使用PyTorch框架的开发者提供昇腾AI处理器的超强算力,需要安装PyTorch Adapter插件用于适配PyTorch,本文介绍如何安装Pytorch框架和Pytorch Adapter插件。 本文使用ModelArts上的NPU
-
模型微调 - AI开发平台ModelArts
训练效果的指标介绍 指标名称 指标说明 NPU/GPU利用率 在训练过程中,机器的NPU/GPU占用情况(横坐标时间,纵坐标占用率)。 显存利用率 在训练过程中,机器的显存占用情况(横坐标时间,纵坐标占用率)。 吞吐 在训练过程中,每卡处理tokens数量(tokens/s/p)。每种框架计算
-
创建Notebook实例 - AI开发平台ModelArts
1*Pnt1(16GB)|CPU: 8核 64GB”:GPU单卡规格,16GB显存,适合深度学习场景下的算法训练和调测 Ascend规格 有Snt9(32GB显存)单卡、两卡、八卡等规格。配搭ARM处理器,适合深度学习场景下的模型训练和调测。 “存储配置” 包括“云硬盘EVS”、“弹性文
-
自动学习 - AI开发平台ModelArts
自动学习 使用ModelArts Standard自动学习实现口罩检测 使用ModelArts Standard自动学习实现垃圾分类
-
ModelArts支持的监控指标 - AI开发平台ModelArts
使用情况。 单位:百分比。 ≥ 0% ModelArts模型负载 1分钟 gpu_mem_usage GPU显存使用率 该指标用于统计ModelArts用户服务的GPU显存使用情况。 单位:百分比。 ≥ 0% ModelArts模型负载 1分钟 npu_util NPU使用率 该
-
启动智能任务 - AI开发平台ModelArts
集,不支持启动主动学习和自动分组任务,支持预标注任务。 “智能标注”是指基于当前标注阶段的标签及图片学习训练,选中系统中已有的模型进行智能标注,快速完成剩余图片的标注操作。“智能标注”又包含“主动学习”和“预标注”两类。 “主动学习”表示系统将自动使用半监督学习、难例筛选等多种手
-
如何在AOM上查看ModelArts所有监控指标? - AI开发平台ModelArts
GPU显存 显存容量 ma_container_gpu_mem_total_megabytes 该指标用于统计训练任务的显存容量。 兆字节(Megabytes) >0 显存使用率 ma_container_gpu_mem_util 该指标用于统计测量对象已使用的显存占显存容量的百分比。
-
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts
--tensor-parallel-size:并行卡数。 --gpu-memory-utilization:0~1之间的float,实际使用的显存是系统读取的最大显存*gpu-memory-utilization。 --max-model-len:最大数据输入+输出长度,不能超过模型配置文件config
-
使用MLS预置算链进行机器学习建模 - AI开发平台ModelArts
训练算链运行成功 当算链运行完毕后,选中任意节点,右键选择“展示运行结果”,查看该节点的运行结果,如图6所示。 如果无运行结果,如图7所示;如果有运行结果,如图8所示,例如模型应用节点和回归评估节点。 图6 右键选择展示运行结果 图7 无运行结果 图8 有运行结果 Step2 使用模型进行预测