搜索_华为云

创建OBS桶用于ModelArts存储数据 - AI开发平台ModelArts

创建OBS桶用于ModelArts存储数据由于ModelArts本身没有数据存储的功能，ModelArts使用对象存储服务（Object Storage Service，简称OBS）进行数据存储以及模型的备份和快照，实现安全、高可靠和低成本的存储需求。 AI开发过程中的输入数据、

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard准备工作
服务韧性 - AI开发平台ModelArts
服务韧性 - AI开发平台ModelArts

部署了高防服务，以防大流量攻击。 ModelArts对存放关键数据的数据库部署了数据库安全服务。云服务防抖动和遭受攻击后的应急响应/恢复策略 ModelArts服务具备租户资源隔离能力，避免单租户资源被攻击导致爆炸半径大，影响其他租户。 ModelArts服务具备资源池和隔离能

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
在ModelArts Studio基于Qwen2-7B模型实现新闻自动分类 - AI开发平台ModelArts

选择规格，规格中描述了服务器类型、型号等信息，仅显示模型支持的资源。 xxx 计算节点个数当计算节点个数大于1，将启动多节点分布式训练。详细信息，请参见分布式训练功能介绍。 1 更多选项永久保存日志选择是否打开“永久保存日志”开关。关闭事件通知选择是否打开“事件通知”开关。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
配额与限制 - AI开发平台ModelArts

Lite涉及的资源配额服务资源类型 ECS资源类型 ECS实例数 CPU核心数 RAM容量（MB）弹性公网IP EIP资源伸缩带宽策略云硬盘EVS SFS资源磁盘数磁盘容量（GB）快照数弹性文件服务SFS资源容量配额

 帮助中心 > AI开发平台ModelArts > 产品介绍
推理业务迁移评估表 - AI开发平台ModelArts

推理业务时延要求，客户端到云服务端到端可接受时延。例如：当前是“客户端 -> 云服务”模式，客户端请求应答可接受的最长时延为2秒。 - 模型参数规模，是否涉及分布式推理 10B/100B，单机多卡推理。 - 能否提供实际模型、网络验证的代码和数据等信息提供实际模型、网络验证的代码和数据。提供与业务类型类似的开源模型，例如GPT3

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
训练迁移快速入门案例 - AI开发平台ModelArts

torch_npu初始化后，原则上需要用户将原来代码中CUDA相关的内容迁移到NPU相关的接口上，包含算子API、显存操作、数据集操作、分布式训练的参数面通信nccl等，手动操作修改点较多且较为分散，因此昇腾提供了自动迁移工具transfer_to_npu帮助用户快速迁移。自动

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导
配置节点参数控制分支执行 - AI开发平台ModelArts

storages=storage ) 案例中job_step_a和job_step_b均配置了跳过策略，并且都使用参数进行控制。当参数值配置不同时，model_step的执行可以分为以下几种情况（model_step没有配置跳过策略，因此会遵循默认规则）： job_step_a_is_skip参数值 job_step_b_is_skip参数值

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 构建Workflow多分支运行场景
新建Workflow Execution - AI开发平台ModelArts

objects 节点steps使用到的参数。 policies 否 WorkflowDagPolicies object 执行记录使用到的执行策略。表3 StepExecution 参数是否必选参数类型描述 step_name 否 String 节点的名称，在一个DAG中唯一

 帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
迁移评估 - AI开发平台ModelArts
迁移评估 - AI开发平台ModelArts

推理业务时延要求，客户端到云服务端到端可接受时延。例如：当前是“客户端 -> 云服务”模式，客户端请求应答可接受的最长时延为2秒。 - 模型参数规模，是否涉及分布式推理 10B/100B，单机多卡推理。 - 能否提供实际模型、网络验证的代码和数据等信息提供实际模型、网络验证的代码和数据。提供与业务类型类似的开源模型，例如GPT3

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
更新Workflow Execution - AI开发平台ModelArts

objects 节点steps使用到的参数。 policies 否 WorkflowDagPolicies object 执行记录使用到的执行策略。表3 StepExecution 参数是否必选参数类型描述 step_name 否 String 节点的名称，在一个DAG中唯一

 帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
ECS服务器挂载SFS Turbo存储 - AI开发平台ModelArts

ECS服务器挂载SFS Turbo存储本小节介绍如何在ECS服务器挂载SFS Turbo存储，挂载完成后可在后续步骤中，将训练所需的数据通过ECS上传至SFS Turbo。前提条件已创建SFS Turbo，如果未创建，请参考创建文件系统。数据及算法已经上传至OBS，如果未

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置
自定义镜像使用场景 - AI开发平台ModelArts

图1 获取镜像列表对象存储服务对象存储服务（Object Storage Service，OBS）是一个基于对象的海量存储服务，为客户提供海量、安全、高可靠、低成本的数据存储能力。在使用ModelArts时存在与OBS的数据交互，您需要使用的数据可以存储至OBS。弹性云服务器

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard
附录：指令微调训练常见问题 - AI开发平台ModelArts

附录：指令微调训练常见问题问题1：在训练过程中遇到NPU out of memory 解决方法：将yaml文件中的per_device_train_batch_size调小，重新训练如未解决则执行下一步。替换深度学习训练加速的工具或增加zero等级，可参考各个模型深度学习训

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907）
准备工作 - AI开发平台ModelArts
准备工作 - AI开发平台ModelArts

定位前的排查当前主要包含如下几个方面：训练超参数。常见的超参如下图所示：图1 训练超参数模型的超参通常可能调整的主要有学习率、batch size、并行切分策略、学习率warm-up、模型参数、FA配置等。用户在进行NPU精度和GPU精度比对前，需要保证两边的配置一致。表1 超参说明超参说明

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
LoRA微调训练 - AI开发平台ModelArts

由于模型中LoRA微调训练存在已知的精度问题，因此不支持TP(tensor model parallel size)张量模型并行策略，推荐使用PP(pipeline model parallel size)流水线模型并行策略，具体详细参数配置如表2所示。步骤3 启动训练脚本修改超参值后，再启动训练脚本。Llama2-70b建议为4机32卡训练。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906）
管理Workflow Execution - AI开发平台ModelArts

操作名称，枚举如下: stop 停止 rerun 重跑 policies 否 ExecutionActionPolicy object 动作策略。 parameters 否 Array of WorkflowParameter objects 参数。 data_requirements

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
创建Notebook实例 - AI开发平台ModelArts

Notebook，可以保留数据。 “扩展存储配置” 说明： “扩展存储配置”功能是白名单功能，如果有试用需求，请提工单申请权限。如果有多个数据存储路径，可以单击“增加扩展存储配置”，增加用户指定的存储挂载目录。支持增加的存储类型有“存储桶OBS”、“并行文件系统PFS”、“弹性文件服务SFS”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
Notebook中的EVS存储可以使用套餐包吗？ - AI开发平台ModelArts

Notebook中的EVS存储可以使用套餐包吗？无法使用套餐包。父主题：计费相关

 帮助中心 > AI开发平台ModelArts > 常见问题 > 计费相关
AI Gallery功能介绍 - AI开发平台ModelArts

Gallery为零基础开发者，提供无代码开发工具，快速推理、部署模型；为具备基础代码能力的开发者，AI Gallery将复杂的模型、数据及算法策略深度融合，构建了一个高效协同的模型体验环境，让开发者仅需几行代码即可调用任何模型，大幅度降低了模型开发门槛。充足澎湃算力，最佳实践算力推荐方案，提升实践效率和成本

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍
训练精度测试 - AI开发平台ModelArts

ccuracy_cfgs.yaml相对或绝对路径 <model_name>：训练模型名，如qwen2.5-7b <run_type>：训练策略类型及数据序列长度：【lora：4096-lora、full：4096-full】训练完成后，test-benchmark目录下会生成训

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练benchmark工具

总条数： 694

上一页
1
...
9
10
11
...
35
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建OBS桶用于ModelArts存储数据 - AI开发平台ModelArts

服务韧性 - AI开发平台ModelArts

在ModelArts Studio基于Qwen2-7B模型实现新闻自动分类 - AI开发平台ModelArts

配额与限制 - AI开发平台ModelArts

推理业务迁移评估表 - AI开发平台ModelArts

训练迁移快速入门案例 - AI开发平台ModelArts

配置节点参数控制分支执行 - AI开发平台ModelArts

新建Workflow Execution - AI开发平台ModelArts

迁移评估 - AI开发平台ModelArts

更新Workflow Execution - AI开发平台ModelArts

ECS服务器挂载SFS Turbo存储 - AI开发平台ModelArts

自定义镜像使用场景 - AI开发平台ModelArts

附录：指令微调训练常见问题 - AI开发平台ModelArts

准备工作 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

管理Workflow Execution - AI开发平台ModelArts

创建Notebook实例 - AI开发平台ModelArts

Notebook中的EVS存储可以使用套餐包吗？ - AI开发平台ModelArts

AI Gallery功能介绍 - AI开发平台ModelArts

训练精度测试 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线