搜索_华为云

执行SFT全参微调训练任务 - AI开发平台ModelArts

执行SFT全参微调训练任务步骤一上传训练权重文件和数据集如果在准备代码和数据阶段已经上传权重文件和数据集到容器中，可以忽略此步骤。如果未上传训练权重文件和数据集到容器中，具体参考上传代码和权重文件到工作环境和上传数据到指定目录章节完成。训练脚本中会自动执行训练前的权重转换操作和数据处理操作。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.911）
执行SFT全参微调训练任务 - AI开发平台ModelArts

执行SFT全参微调训练任务步骤一上传训练权重文件和数据集如果在准备代码和数据阶段已经上传权重文件和数据集到容器中，可以忽略此步骤。如果未上传训练权重文件和数据集到容器中，具体参考上传代码和权重文件到工作环境和上传数据到指定目录章节完成。训练脚本中会自动执行训练前的权重转换操作和数据处理操作。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.909）
ModelArts与DLS服务的区别？ - AI开发平台ModelArts

式深度学习平台服务，内置大量优化的网络模型，以便捷、高效的方式帮助用户轻松使用深度学习技术，通过灵活调度按需服务化方式提供模型训练与评估。但是，DLS服务仅提供深度学习技术，而ModelArts集成了深度学习和机器学习技术，同时ModelArts是一站式的AI开发平台，从数据标

 帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题
自动学习的每个项目对数据有哪些要求？ - AI开发平台ModelArts

文件名规范，不能有中文，不能有+、空格、制表符。保证图片质量：不能有损坏的图片；目前支持的格式包括jpg、jpeg、bmp、png。不要把明显不同的多个任务数据放在同一个数据集内。为了保证模型的预测准确度，训练样本跟真实使用场景尽量相似。为保证模型的泛化能力，数据集尽量覆盖可能出现的各种场景。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习 > 准备数据
准备物体检测数据 - AI开发平台ModelArts

elArts在同一区域。数据集要求保证图片质量：不能有损坏的图片；目前支持的格式包括jpg、jpeg、bmp、png。不要把明显不同的多个任务数据放在同一个数据集内。为了保证模型的预测准确度，训练样本跟真实使用场景尽量相似。为保证模型的泛化能力，数据集尽量覆盖可能出现的各种场景。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现物体检测
计费说明 - AI开发平台ModelArts
计费说明 - AI开发平台ModelArts

计费说明 ModelArts是面向AI开发者的一站式开发平台，提供海量数据预处理及半自动化标注、大规模分布式训练、自动化模型生成及端-边-云模型按需部署能力，帮助用户快速创建和部署AI应用，管理全周期AI工作流。 ModelArts服务的计费方式简单、灵活，您既可以选择按实际使用

 帮助中心 > AI开发平台ModelArts > 产品介绍
故障恢复 - AI开发平台ModelArts
故障恢复 - AI开发平台ModelArts

针对于分布式场景，容错检查会检查本次训练作业的全部计算节点。推理部署故障恢复用户部署的在线推理服务运行过程中，如发生硬件故障导致推理实例故障，ModelArts会自动检测到并迁移受影响实例到其它可用节点，实例启动后恢复推理请求处理能力。故障的硬件节点会自动隔离不再调度和运行推理服务实例。

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
什么是ModelArts - AI开发平台ModelArts

什么是ModelArts ModelArts是面向AI开发者的一站式开发平台，提供海量数据预处理及半自动化标注、大规模分布式训练、自动化模型生成及模型按需部署能力，帮助用户快速创建和部署AI应用，管理全周期AI工作流。 “一站式”是指AI开发的各个环节，包括数据处理、算法开发、模

 帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题
Tensorflow多节点作业下载数据到/cache显示No space left - AI开发平台ModelArts

/cache显示：“No space left”。原因分析 TensorFlow多节点任务会启动parameter server（简称ps）和worker两种角色，ps和worker会被调度到相同的机器上。由于训练数据对于ps没有用，因此在代码中ps相关的逻辑不需要下载训练数据

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
产品优势 - AI开发平台ModelArts
产品优势 - AI开发平台ModelArts

产品优势 ModelArts服务具有以下产品优势。稳定安全的算力底座，极快至简的模型训练支持万节点计算集群管理大规模分布式训练能力，加速大模型研发提供高性价比国产算力多年软硬件经验沉淀，AI场景极致优化加速套件，训练、推理、数据访问多维度加速一站式端到端生产工具链，一致性开发体验

 帮助中心 > AI开发平台ModelArts > 产品介绍
预置框架启动文件的启动流程说明 - AI开发平台ModelArts

standalone：标识为单任务实例作业。 nnodes：任务实例个数。 nproc_per_node：每个任务实例启动的主进程数，设置为任务分配的NPU数相同。 node_rank：任务rank，用于多任务分布式训练。 master_addr：主任务（rank 0）的地址，设置为任务worker-0的通信域名。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 准备模型训练代码
MaaS大模型即服务平台功能介绍 - AI开发平台ModelArts

MaaS大模型即服务平台功能介绍对于普通企业来说，大模型开发不仅需要强大的算力，还需要学习训练、部署的相关参数配置和规格选择等专业知识。ModelArts Studio大模型即服务平台（后续简称为MaaS服务）作为一个面向客户的大模型服务化平台，提供简单易用的模型开发工具链，支

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍
ModelArts Standard推理服务支持VPC直连的高速访问通道配置 - AI开发平台ModelArts

的需求。使用VPC直连的高速访问通道，用户的业务请求不需要经过推理平台，而是直接经VPC对等连接发送到实例处理，访问速度更快。由于请求不经过推理平台，所以会丢失以下功能：认证鉴权流量按配置分发负载均衡告警、监控和统计图1 VPC直连的高速访问通道示意图约束限制调

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
准备图像分类数据 - AI开发平台ModelArts

数据集要求保证图片质量：不能有损坏的图片，目前支持的格式包括jpg、jpeg、bmp、png。不要把明显不同的多个任务数据放在同一个数据集内。每一类数据尽量多，尽量均衡。期望获得良好效果，图像分类项目中，至少有两种以上的分类，每种分类的样本不少于20张。为了保证模型的预测准确度，训练样本跟真实使用场景尽量相似。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现图像分类
Lite Cluster资源使用 - AI开发平台ModelArts

在Lite Cluster资源池上使用Snt9B完成分布式训练任务在Lite Cluster资源池上使用ranktable路由规划完成Pytorch NPU分布式训练在Lite Cluster资源池上使用Snt9B完成推理任务

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster）
准备模型训练镜像 - AI开发平台ModelArts

准备模型训练镜像 ModelArts平台提供了Tensorflow，PyTorch，MindSpore等常用深度学习任务的基础镜像，镜像里已经安装好运行任务所需软件。当基础镜像里的软件无法满足您的程序运行需求时，您还可以基于这些基础镜像制作一个新的镜像并进行训练。训练作业的预置框架介绍

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
通过VPC高速访问通道的方式访问在线服务 - AI开发平台ModelArts

的需求。使用VPC直连的高速访问通道，用户的业务请求不需要经过推理平台，而是直接经VPC对等连接发送到实例处理，访问速度更快。由于请求不经过推理平台，所以会丢失以下功能：认证鉴权流量按配置分发负载均衡告警、监控和统计图1 VPC直连的高速访问通道示意图约束限制调

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的访问通道
ModelArts平台是否支持多模型导入 - AI开发平台ModelArts

ModelArts平台是否支持多模型导入 ModelArts平台从对象存储服务（OBS）中导入模型包适用于单模型场景。如果有多模型复合场景，推荐使用自定义镜像方式，通过从容器镜像（SWR）中选择元模型的方式创建AI应用部署服务。制作自定义镜像请参考从0-1制作自定义镜像并创建AI应用。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 模型管理 > 导入模型
查询服务详情 - AI开发平台ModelArts

mode String 节点亲和的方式，required表示强亲和，服务实例只能调度到指定节点，指定节点不存在则失败。preferred表示弱亲和，服务实例倾向于调度到指定节点，指定节点不满足调度条件，则会调度到其他节点。 pool_infos Array of AffinityPoolInfo

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
Standard资源池节点故障定位 - AI开发平台ModelArts

Standard资源池节点故障定位节点故障定位对于Standard资源池，ModelArts平台在识别到节点故障后，通过给K8S节点增加污点的方式（taint）将节点隔离避免新作业调度到该节点而受到影响，并且使本次作业不受污点影响。当前可识别的故障类型如下，可通过隔离码及对应检测方法定位故障。

帮助中心 > AI开发平台ModelArts > 故障排除 > 资源池

总条数： 2647

上一页
1
...
6
7
8
...
133
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

执行SFT全参微调训练任务 - AI开发平台ModelArts

执行SFT全参微调训练任务 - AI开发平台ModelArts

ModelArts与DLS服务的区别？ - AI开发平台ModelArts

自动学习的每个项目对数据有哪些要求？ - AI开发平台ModelArts

准备物体检测数据 - AI开发平台ModelArts

计费说明 - AI开发平台ModelArts

故障恢复 - AI开发平台ModelArts

什么是ModelArts - AI开发平台ModelArts

Tensorflow多节点作业下载数据到/cache显示No space left - AI开发平台ModelArts

产品优势 - AI开发平台ModelArts

预置框架启动文件的启动流程说明 - AI开发平台ModelArts

MaaS大模型即服务平台功能介绍 - AI开发平台ModelArts

ModelArts Standard推理服务支持VPC直连的高速访问通道配置 - AI开发平台ModelArts

准备图像分类数据 - AI开发平台ModelArts

Lite Cluster资源使用 - AI开发平台ModelArts

准备模型训练镜像 - AI开发平台ModelArts

通过VPC高速访问通道的方式访问在线服务 - AI开发平台ModelArts

ModelArts平台是否支持多模型导入 - AI开发平台ModelArts

查询服务详情 - AI开发平台ModelArts

Standard资源池节点故障定位 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线