搜索_华为云

创建DevServer - AI开发平台ModelArts

arch String 服务器镜像架构类型。 ARM X86 image_id String 服务器镜像ID。 name String 服务器镜像名称。 server_type String 服务器类型。枚举值如下： BMS：裸金属服务器 ECS：弹性云服务器请求示例 POST

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
附录：训练常见问题 - AI开发平台ModelArts

问题1：在训练过程中遇到NPU out of memory 解决方法：容器内执行以下命令，指定NPU内存分配策略的环境变量，开启动态内存分配，即在需要时动态分配内存，可以提高内存利用率，减少OOM错误的发生。 export PYTORCH_NPU_ALLOC_CONF = exp

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.909）
创建AI应用不同方式的场景介绍 - AI开发平台ModelArts

0。 python3.6、python2.7、tf2.1-python3.7，表示该模型可同时在CPU或GPU运行。其他Runtime的值，如果后缀带cpu或gpu，表示该模型仅支持在CPU或GPU中运行。默认使用的Runtime为python2.7。默认启动命令：sh /home/mind/run

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建AI应用
创建Notebook实例 - AI开发平台ModelArts

实例的机器规格。如下规格仅供参照，实际支持规格以具体区域为准。 modelarts.vm.cpu.2u：Intel CPU通用规格，用于快速数据探索和实验。 modelarts.vm.cpu.8u：Intel CPU算力增强型，适用于密集计算场景下运算。 image_id 是 String 待

 帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
查询服务详情 - AI开发平台ModelArts

memory Integer 内存，单位为MB，仅支持整数。 cpu Float CPU核数，支持配置小数，输入值不能小于0.01（最多支持2位小数，小数点后第3位做四舍五入处理）。 ascend_a310 Integer Ascend芯片个数，可选，默认不使用，不支持与gpu同时配置。表6

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
查询镜像详情 - AI开发平台ModelArts

IMAGE_SAVE：Notebook实例保存镜像。 resource_categories Array of strings 镜像支持的规格。枚举值如下： CPU GPU ASCEND service_type String 镜像支持服务类型。枚举值如下： COMMON：通用镜像。 INFERENCE:

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
在云监控平台查看在线服务性能指标 - AI开发平台ModelArts

取值范围测量对象监控周期 cpu_usage CPU使用率该指标用于统计ModelArts用户服务的CPU使用率。单位：百分比。 ≥ 0% ModelArts模型负载 1分钟 mem_usage 内存使用率该指标用于统计ModelArts用户服务的内存使用率。单位：百分比。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
使用ModelArts PyCharm插件调试训练ResNet50图像分类模型 - AI开发平台ModelArts

--device_target="CPU" 图7 配置PyCharm解释器根据README说明文档，配置Parameter参数device_target="CPU"表示CPU环境运行，device_target="Ascend"表示在Ascend环境运行。本地代码开发调测。一般本地CPU算力较低并

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard开发环境
训练作业进程被kill - AI开发平台ModelArts

现为日志中断。原因分析 CPU软锁在解压大量文件可能会出现此情况并造成节点重启。可以适当在解压大量文件时，加入sleep。比如每解压1w个文件，就停止1s。存储限制根据规格情况合理使用数据盘，数据盘大小请参考训练环境中不同规格资源大小。 CPU过载减少线程数。排查办法

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
在ECS上构建自定义镜像并在Notebook中使用 - AI开发平台ModelArts

准备一台具有Docker功能的机器，如果没有，建议申请一台弹性云服务器并购买弹性公网IP，并在准备好的机器上安装必要的软件。 ModelArts提供了ubuntu系统的脚本，方便安装docker。本地Linux机器的操作等同ECS服务器上的操作，请参考本案例。登录ECS控制台，购买弹性云服务器，镜像选择“公共镜像”，推荐使用ubuntu18

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于创建Notebook
查询Notebook实例详情 - AI开发平台ModelArts

空间，以实际取值为准。 feature String 实例类别。枚举值： DEFAULT：CodeLab免费规格实例，每个用户最多只能创建一个。 NOTEBOOK：计费规格实例。 billing_items Array of strings 计费资源类型。枚举值： STORAGE：存储资源计费。

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
查询专属资源池作业列表 - AI开发平台ModelArts

作业运行的节点IP列表，逗号分隔。表5 resourceRequirement 参数参数类型描述 cpu String CPU使用量。 memory String 内存使用量。 nvidia.com/gpu String GPU资源使用量。 huawei.com/ascend-snt3

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
查询所有Notebook实例列表 - AI开发平台ModelArts

feature 否 String 实例类别，默认为NOTEBOOK。枚举值如下： DEFAULT：CodeLab免费规格实例，每个用户最多只能创建一个。 NOTEBOOK：计费规格实例。 limit 否 Integer 每一页的数量，默认值10。 name 否 String 实例名称，支

 帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
查询Notebook实例列表 - AI开发平台ModelArts

feature 否 String 实例类别，默认为NOTEBOOK。枚举值如下： DEFAULT：CodeLab免费规格实例，每个用户最多只能创建一个。 NOTEBOOK：计费规格实例。 limit 否 Integer 每一页的数量，默认值10。 name 否 String 实例名称，支

 帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
创建并管理工作空间 - AI开发平台ModelArts

默认无限制，支持设置1~60000。分钟训练作业CPU规格训练时长（单核单节点为统计基础单元）默认无限制，支持设置1~60000。分钟可视化作业使用时长默认无限制，支持设置1~60000。分钟开发环境CPU规格使用时长（单核为统计基础单元）默认无限制，支持设置1~60000。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard准备工作
查询AI应用列表 - AI开发平台ModelArts

ModelSpecification object 模型部署最小部署规格。表6 ModelSpecification 参数参数类型描述 min_cpu String 最小CPU规格。 min_gpu String 最小GPU规格。 min_memory String 最小内存。 min_ascend String

帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
创建ModelArts数据校验任务 - AI开发平台ModelArts

转换图片格式至jpg格式图片后缀与实际格式不符，但格式在ModelArts支持的格式内后缀转换成与实际格式一致图片后缀与实际格式不符，且格式不在ModelArts支持的格式内转换图片格式至jpg格式图片分辨率过大宽、高按指定大小同比例进行裁剪表2 标注类文件数据校验

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 处理ModelArts数据集中的数据
GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

环境准备在华为云ModelArts Server预购相关超强算力的GPU裸金属服务器，并选择AIGC场景通用的镜像，完成使用Megatron-Deepspeed训练GPT2模型。本最佳实践使用以下镜像和规格：镜像选择：Ubuntu 20.04 x86 64bit SDI3 for

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源使用
使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

镜像的部署参数。计算规格选择 - 按需选择计算规格。单击“选择”，在弹窗中选择资源规格并设置运行时长控制，单击“确定”。在“所在区”选择计算规格所在的区域。默认显示全部区域的计算规格。选择计算规格不可用的资源会置灰。右侧“配置信息”区域会显示计算规格的详细数据，AI Gal

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
在Lite Cluster资源池上使用Snt9B完成分布式训练任务 - AI开发平台ModelArts

-9 python ps -ef 图8 关闭训练进程 limit/request配置cpu和内存大小，已知单节点Snt9B机器为：8张Snt9B卡+192u1536g，请合理规划，避免cpu和内存限制过小引起任务无法正常运行。父主题： Lite Cluster资源使用

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用

总条数： 780

上一页
1
...
7
8
9
...
39
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建DevServer - AI开发平台ModelArts

附录：训练常见问题 - AI开发平台ModelArts

创建AI应用不同方式的场景介绍 - AI开发平台ModelArts

创建Notebook实例 - AI开发平台ModelArts

查询服务详情 - AI开发平台ModelArts

查询镜像详情 - AI开发平台ModelArts

在云监控平台查看在线服务性能指标 - AI开发平台ModelArts

使用ModelArts PyCharm插件调试训练ResNet50图像分类模型 - AI开发平台ModelArts

训练作业进程被kill - AI开发平台ModelArts

在ECS上构建自定义镜像并在Notebook中使用 - AI开发平台ModelArts

查询Notebook实例详情 - AI开发平台ModelArts

查询专属资源池作业列表 - AI开发平台ModelArts

查询所有Notebook实例列表 - AI开发平台ModelArts

查询Notebook实例列表 - AI开发平台ModelArts

创建并管理工作空间 - AI开发平台ModelArts

查询AI应用列表 - AI开发平台ModelArts

创建ModelArts数据校验任务 - AI开发平台ModelArts

GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

在Lite Cluster资源池上使用Snt9B完成分布式训练任务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线