搜索_华为云

准备镜像环境 - AI开发平台ModelArts

不要将多个容器绑到同一个NPU上，会导致后续的容器无法正常使用NPU功能。 ${image_name} 为docker镜像的ID，在宿主机上可通过docker images查询得到。 --shm-size：表示共享内存，用于多进程间通信。由于需要转换较大内存的模型文件，因此大小要求200g及以上。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907） > 准备工作
使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

S桶名称）。预下载至本地目录选择“不下载”。 “资源类型”：选择GPU单卡的规格。如果有免费GPU规格，可以选择免费规格进行训练。其他参数保持默认即可。本样例代码为单机单卡场景，选择GPU多卡规格会导致训练失败。如果在设置训练输入和输出选择OBS路径时，找不到已创建的OBS

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练
使用Notebook不同的资源规格，为什么训练速度差不多？ - AI开发平台ModelArts

使用Notebook不同的资源规格，为什么训练速度差不多？如果用户的代码中训练任务是单进程的，使用Notebook 8核64GB，72核512GB训练的速度是基本一致的，例如用户用的是2核4GB的资源，使用4核8GB，或者8核64GB效果是一样的。如果用户的代码中训练任务是多进程的，使用Notebook

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 更多功能咨询
开发环境中不同Notebook规格资源“/cache”目录的大小 - AI开发平台ModelArts

开发环境中不同Notebook规格资源“/cache”目录的大小创建Notebook时，可以根据业务数据量的大小选择资源。 ModelArts会挂载硬盘至“/cache”目录，用户可以使用此目录来储存临时文件。“/cache”与代码目录共用资源，不同资源规格有不同的容量。映射规则：

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 更多功能咨询
1个节点的专属资源池，能否部署多个服务？ - AI开发平台ModelArts

在部署服务时，选择专属资源池，在选择“计算节点规格”时选择“自定义规格”，设置小一些或者选择小规格的服务节点规格，当资源池节点可以容纳多个服务节点规格时，就可以部署多个服务。如果使用此方式进行部署推理，选择的规格务必满足模型的要求，当设置的规格过小，无法满足模型的最小推理要求时，则会出现部署失败或预测失败的情况。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard资源池
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

辑完成后重新构建新镜像。注意：训练作业的资源池以及ECS都需要联通外网，否则会安装和下载失败。 ECS获取和上传基础镜像创建ECS。下文中介绍如何在ECS中构建一个训练镜像，请参考ECS文档购买一个Linux弹性云服务器。完成网络配置、高级配置等步骤，可根据默认选择，或进行

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） > 准备工作
升级Lite Cluster资源池驱动 - AI开发平台ModelArts

按节点数量：每批次驱动升级的节点数量为设置的节点数量。对于不同的升级方式，滚动升级选择节点的策略会不同：如果升级方式为安全升级，则根据滚动节点数量选择无业务的节点，隔离节点并滚动升级。如果升级方式为强制升级，则根据滚动节点数量随机选择节点，隔离节点并滚动升级。无业务节点定义：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
服务韧性 - AI开发平台ModelArts
服务韧性 - AI开发平台ModelArts

其他租户。 ModelArts服务具备资源池和隔离能力，避免单租户资源被攻击导致爆炸半径过大风险。 ModelArts服务定义并维护了性能规格用于自身的抗攻击性。例如：设置API访问限制，防止恶意接口调用等场景。 ModelArts服务在攻击场景下，具备告警能力及自我保护能力。

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

不要将多个容器绑到同一个NPU上，会导致后续的容器无法正常使用NPU功能。 ${image_name} 为docker镜像的ID，在宿主机上可通过docker images查询得到。 --shm-size：表示共享内存，用于多进程间通信。由于需要转换较大内存的模型文件，因此大小要求200g及以上。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906） > 准备工作
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

不要将多个容器绑到同一个NPU上，会导致后续的容器无法正常使用NPU功能。 ${image_name} 为docker镜像的ID，在宿主机上可通过docker images查询得到。 --shm-size：表示共享内存，用于多进程间通信。由于需要转换较大内存的模型文件，因此大小要求200g及以上。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.908） > 准备工作
从0制作自定义镜像用于创建训练作业（Tensorflow+GPU） - AI开发平台ModelArts

x86_64架构的主机，操作系统使用ubuntu-18.04。您可以准备相同规格的弹性云服务器ECS或者应用本地已有的主机进行自定义镜像的制作。购买ECS服务器的具体操作请参考购买并登录Linux弹性云服务器。“CPU架构”选择“x86计算”，“镜像”选择“公共镜像”，推荐使用Ubuntu18

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
Standard开发环境 - AI开发平台ModelArts

对于使用本地IDE的开发者，由于本地资源限制，运行和调试环境大多使用团队公共搭建的资源服务器，并且是多人共用，这带来一定的环境搭建和维护成本。而ModelArts的Notebook的优势是即开即用，它预先装好了不同的AI引擎，并且提供了非常多的可选规格，用户可以独占一个容器环境，不受其他人的干扰。只需简单配

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

不要将多个容器绑到同一个NPU上，会导致后续的容器无法正常使用NPU功能。 ${image_name} 为docker镜像的ID，在宿主机上可通过docker images查询得到。 --shm-size：表示共享内存，用于多进程间通信。由于需要转换较大内存的模型文件，因此大小要求200g及以上。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907） > 准备工作
按需计费 - AI开发平台ModelArts
按需计费 - AI开发平台ModelArts

本文价格仅供参考，实际计算请以ModelArts价格详情中的价格为准。变更配置后对计费的影响如果您在购买按需计费资源池后变更了规格配置，会产生一个新订单并开始按新配置的价格计费，旧订单自动失效。如果您在一个小时内变更了规格配置，将会产生多条计费信息。每条计费信息的开始时间和结束时间对应不同配置在该小时内的生效时间。

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费模式
服务部署、启动、升级和修改时，容器健康检查失败如何处理？ - AI开发平台ModelArts

服务部署、启动、升级和修改时，容器健康检查失败如何处理？原因分析容器提供的健康检查接口调用失败。容器健康检查接口调用失败，原因可能有两种：镜像健康检查配置问题 AI应用健康检查配置问题解决方法根据容器日志进行排查，查看健康检查接口失败的具体原因。镜像健康检查配置问题，

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
创建并管理工作空间 - AI开发平台ModelArts

分钟推理服务GPU规格使用时长（单节点为统计基础单元）默认无限制，支持设置1~60000。分钟训练作业CPU规格训练核数默认无限制，支持设置1~10000。核训练作业GPU规格训练卡数默认无限制，支持设置1~1000。卡训练作业RAM规格训练内存大小默认无限制，支持设置1~100000。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard准备工作
更新管理 - AI开发平台ModelArts
更新管理 - AI开发平台ModelArts

本号，实现服务升级。推理服务有三种升级模式：全量升级、滚动升级（扩实例）和滚动升级（缩实例）。了解三种升级模式的流程，请参见图1。全量升级需要额外的双倍的资源，先全量创建新版本实例，然后再下线旧版本实例。滚动升级（扩实例）需额外消耗部分实例资源用于滚动升级，扩实例越大，升级速度越快。

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
在推理生产环境中部署推理服务 - AI开发平台ModelArts

sh章节创建的推理脚本run_vllm.sh中增加需要开启的高阶配置。词表切分在分布式场景下，默认不使用词表切分能提升推理性能，同时也会增加单卡的显存占用。不建议开启词表并行，如确需使用词表切分，配置以下环境变量。 export USE_VOCAB_PARALLEL=1 关闭词表切分的命令：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
在云监控平台查看在线服务性能指标 - AI开发平台ModelArts

该指标用于统计ModelArts用户服务的CPU使用率。单位：百分比。 ≥ 0% ModelArts模型负载 1分钟 mem_usage 内存使用率该指标用于统计ModelArts用户服务的内存使用率。单位：百分比。 ≥ 0% ModelArts模型负载 1分钟 gpu_util GPU使用率该指标用

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
文档导读 - AI开发平台ModelArts
文档导读 - AI开发平台ModelArts

内容 SDK简介简要介绍ModelArts SDK的概念。快速开始介绍如何使用ModelArts SDK进行二次开发。（可选）本地服务器安装ModelArts SDK 介绍如何在本地安装ModelArts SDK。（可选）Session鉴权 Session模块的主要作用是

 帮助中心 > AI开发平台ModelArts > SDK参考

总条数： 755

上一页
1
...
12
13
14
...
38
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备镜像环境 - AI开发平台ModelArts

使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

使用Notebook不同的资源规格，为什么训练速度差不多？ - AI开发平台ModelArts

开发环境中不同Notebook规格资源“/cache”目录的大小 - AI开发平台ModelArts

1个节点的专属资源池，能否部署多个服务？ - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

升级Lite Cluster资源池驱动 - AI开发平台ModelArts

服务韧性 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

从0制作自定义镜像用于创建训练作业（Tensorflow+GPU） - AI开发平台ModelArts

Standard开发环境 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

按需计费 - AI开发平台ModelArts

服务部署、启动、升级和修改时，容器健康检查失败如何处理？ - AI开发平台ModelArts

创建并管理工作空间 - AI开发平台ModelArts

更新管理 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

在云监控平台查看在线服务性能指标 - AI开发平台ModelArts

文档导读 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线