搜索_华为云

准备工作 - AI开发平台ModelArts
准备工作 - AI开发平台ModelArts

attention算子（性能较优）或者使用小算子。训练脚本由算法迁移人员排查迁移后的NPU脚本是否存在问题，可以通过Beyond Compare工具比对GPU训练脚本和NPU训练脚本之间是否存在差异。例如是否GPU环境下开启了FA但是NPU上未开启FA。三方库版本比对大模型训练通常

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
哪里可以了解Atlas800训练服务器硬件相关内容 - AI开发平台ModelArts

Atlas 800训练服务器HCCN Tool Atlas 800 训练服务器 1.0.11 HCCN Tool接口参考主要介绍集群网络工具hccn_tool对外接口说明，包括配置RoCE网卡的IP、网关，配置网络检测对象IP和查询LLDP信息等。 Atlas 800训练服务器备件查询助手

 帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
数据准备使用流程 - AI开发平台ModelArts

提供图像、文本、音频、视频等多种格式数据的预览，帮助用户识别数据质量。提供对数据进行多维筛选的能力，用户可以根据样本属性、标注信息等进行样本筛选。提供12+标注工具，方便用户进行精细化、场景化和专业化的数据标注。提供基于样本和标注结果进行特征分析，帮助用户整体了解数据的质量。提升用户数据准备的效率。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理
AI Gallery功能介绍 - AI开发平台ModelArts

尝鲜大模型，真正达到“即时接入，即时体验”的效果。当开发者对希望对模型进行开发和训练，AI Gallery为零基础开发者，提供无代码开发工具，快速推理、部署模型；为具备基础代码能力的开发者，AI Gallery将复杂的模型、数据及算法策略深度融合，构建了一个高效协同的模型体验环

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍
Function Calling介绍 - AI开发平台ModelArts

Calling的使用场景：表1 Function Calling使用场景说明使用场景说明增强能力大模型通过Function Calling可以调用外部工具或服务，例如实时数据检索、文件处理、数据库查询等，从而扩展其能力。实时数据访问由于大模型通常基于静态数据集训练，不具备实时信息。Function

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 通过Function Calling扩展大语言模型交互能力
Open-Clip基于DevServer适配PyTorch NPU训练指导 - AI开发平台ModelArts

requirements-test.txt pip install tensorboard Step5 获取训练数据集使用img2dataset工具下载数据集。首先需要在容器安装img2dataset，安装命令如下。 pip install img2dataset 参考官方指导下载开源mscoco数据集。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
训练网络迁移总结 - AI开发平台ModelArts

独特的优势，而NPU上的执行目前还是依赖于算子的下发，对于NPU构造的理解是昇腾训练迁移中必备的知识，只有对于昇腾有基础理解，配合一些诊断工具，面对复杂问题时，才能进行进一步诊断与定位，进而发挥NPU的能力。性能调优可以先将重点放在NPU不亲和的问题处理上，确保一些已知的性能问

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导
JupyterLab常用功能介绍 - AI开发平台ModelArts

库。 Tabs 同时打开多个ipynb文件时，通过Tabs激活或选择文件。 Settings JupyterLab工具系统设置。 Help JupyterLab工具自带的帮助参考。图15 ipynb文件菜单栏中的快捷键表4 ipynb文件菜单栏中的快捷键快捷键说明保存文件。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
使用PyCharm手动连接Notebook - AI开发平台ModelArts

例如TensorFlow、PyTorch等，但是实际开发中，通常还需要安装其他依赖包，此时可以通过Terminal连接到环境里操作。单击工具栏“Tools >Start SSH session”，选择SSH Configuration中配置的开发环境。可以执行pip install安装所需要的包。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过PyCharm远程使用Notebook实例
附录：指令微调训练常见问题 - AI开发平台ModelArts

解决方法：将yaml文件中的per_device_train_batch_size调小，重新训练如未解决则执行下一步。替换深度学习训练加速的工具或增加zero等级，可参考各个模型深度学习训练加速框架的选择，如原使用Accelerator可替换为Deepspeed-ZeRO-1，De

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907）
分离部署推理服务 - AI开发平台ModelArts

模式，全量节点和增量节点分别占用2张卡，一共使用4张卡。配置tools工具根目录环境变量使用AscendCloud-LLM发布版本进行推理，基于AscendCloud-LLM包的解压路径配置tool工具根目录环境变量： export LLM_TOOLS_PATH=${root

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 部署推理服务
查询插件模板 - AI开发平台ModelArts

npuDriver：NPU驱动 gpuDriver：GPU驱动 ccePlugin：CCE插件 helm：Helm模板 icAgent：ICAgent工具 description String 插件模板描述。 versions Map<String,PluginTemplateVersion>

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

4*Ascend表示单机4卡，以此类推。表1 NPU卡数、加速框架、梯度配置取值表模型模型参数量训练类型序列长度cutoff_len 梯度累积值优化工具(Deepspeed) 规格与节点数 llama2 7B lora/dpo 4096/8192 gradient_accumulation_steps:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 训练脚本说明
什么是Workflow - AI开发平台ModelArts

线在持续产生的数据中持续迭代训练，确保这条流水线生产出来的模型始终维持在一个较好的状态。图1 MLOps MLOps的整条链路需要有一个工具去承载，MLOps打通了算法开发到交付运维的全流程。和以往的开发交付不同，以往的开发与交付过程是分离的，算法工程师开发完的模型，一般都需要

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发
ModelArts Standard资源监控概述 - AI开发平台ModelArts

Arts所有监控指标。方式三：通过Grafana查看所有监控指标当AOM的监控模板不能满足用户诉求时，用户可以使用Grafana可视化工具来查看与分析监控指标。Grafana支持灵活而又复杂多样的监控视图和模板，为用户提供基于网页仪表面板的可视化监控效果，使用户更加直观地查看到实时资源使用情况。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控
训练速度突然下降以及执行nvidia-smi卡顿如何解决？ - AI开发平台ModelArts

核IO已经阻塞，无法执行相关GPU命令，只能尝试释放D+进程。处理方法 “nvidia-smi”是一个NVIDIA GPU监视器命令行工具，用于查看GPU的使用情况和性能指标，可以帮助用户进行GPU优化和故障排除。但是建议在业务软件或训练算法中，避免频繁使用“nvidia-

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
VS Code连接开发环境失败故障处理 - AI开发平台ModelArts

VS Code自动升级后，导致远程连接时间过长使用SSH连接，报错“Connection reset”如何解决？使用MobaXterm工具SSH连接Notebook后，经常断开或卡顿，如何解决？ VS Code连接开发环境时报错Missing GLIBC，Missing required

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

在创建OBS桶创建的桶下创建文件夹用以存放数据，例如在桶standard-llama2-13b中创建文件夹training_data。利用OBS Browser+工具将步骤1下载的数据集上传至步骤2创建的文件夹目录下。得到OBS下数据集结构： obs://<bucket_name>/training_data

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） > 准备工作
常见问题 - AI开发平台ModelArts
常见问题 - AI开发平台ModelArts

1版本之前可能出现的调优不生效的场景，建议您直接使用MindSpore Lite Convertor2.1及以后的版本。配置文件指定选项进行AOE调优。使用转换工具配置config参数，具体如下所示，其中“subgraph tuning”表示子图调优，“operator tuning”表示算子调优。其中，“ge

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

由于ModelArts创建训练作业时，需要将作业日志输出至OBS桶中，因此创建OBS桶为必选项。用户可通过OBS Browser+、obsutil等工具访问和管理OBS桶，将代码、模型文件、数据集等数据上传或下载进行备份。创建VPC 虚拟私有云（Virtual Private Cloud

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作

总条数： 435

上一页
1
...
17
18
19
...
22
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备工作 - AI开发平台ModelArts

哪里可以了解Atlas800训练服务器硬件相关内容 - AI开发平台ModelArts

数据准备使用流程 - AI开发平台ModelArts

AI Gallery功能介绍 - AI开发平台ModelArts

Function Calling介绍 - AI开发平台ModelArts

Open-Clip基于DevServer适配PyTorch NPU训练指导 - AI开发平台ModelArts

训练网络迁移总结 - AI开发平台ModelArts

JupyterLab常用功能介绍 - AI开发平台ModelArts

使用PyCharm手动连接Notebook - AI开发平台ModelArts

附录：指令微调训练常见问题 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

查询插件模板 - AI开发平台ModelArts

模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

什么是Workflow - AI开发平台ModelArts

ModelArts Standard资源监控概述 - AI开发平台ModelArts

训练速度突然下降以及执行nvidia-smi卡顿如何解决？ - AI开发平台ModelArts

VS Code连接开发环境失败故障处理 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

常见问题 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线