搜索_华为云

场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本教程案例是基于ModelArts Standard运行的，需要购买并开通ModelArts专属资源池和OBS桶。准备数据准备训练数据，可以用本案使用的数据集，也可以使用自己准备的数据集。准备权重准备所需的权重文件。准备代码准备AscendFactory训练代码。准备镜像准备训练模型适用的容器镜像。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912）
管理Lite Cluster资源池 - AI开发平台ModelArts

在资源池详情页面，单击“配置管理”，在配置管理页面，可以修改设置监控的命名空间、修改集群配置，配置镜像预热信息。单击监控的图标，可以开启或关闭监控信息，并设置监控的命名空间。监控使用请参考使用Prometheus查看Lite Cluster监控指标。单击集群配置的图标，可以设置绑核、Dropcache、大页

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
删除Notebook实例 - AI开发平台ModelArts

ebook。 SSH：可以通过SSH协议远程连接Notebook。 ssh_keys Array of strings SSH密钥对名称列表，允许设置多个密钥对实现同时对SSH实例的访问。 service String 访问Notebook的途径，枚举值如下： NOTEBOOK：

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
确认智能标注作业的数据难例 - AI开发平台ModelArts

“确认”，完成难例确认。将数据集中的数据标注为难例针对标注作业中，已标注或未标注数据，也可以将图片数据标注为难例。标注为难例的数据，对后续模型训练中，通过内置规则提升模型精度。登录ModelArts管理控制台，在左侧菜单栏中选择“数据准备>数据标注”，单击“我创建的”页签可查看所有作业列表。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过智能标注方式标注数据
在ModelArts Standard使用run.sh脚本实现OBS和训练容器间的数据传输 - AI开发平台ModelArts

Standard使用run.sh脚本实现OBS和训练容器间的数据传输自定义容器在ModelArts上训练和本地训练的区别如下图：图1 本地与ModelArts上训练对比 ModelArts上进行训练比本地训练多了一步OBS和容器环境的数据迁移工作。增加了和OBS交互工作的整个训练流程如下：

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
启动Notebook实例 - AI开发平台ModelArts

ebook。 SSH：可以通过SSH协议远程连接Notebook。 ssh_keys Array of strings SSH密钥对名称列表，允许设置多个密钥对实现同时对SSH实例的访问。 service String 访问Notebook的途径，枚举值如下： NOTEBOOK：

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
查询Notebook实例详情 - AI开发平台ModelArts

ebook。 SSH：可以通过SSH协议远程连接Notebook。 ssh_keys Array of strings SSH密钥对名称列表，允许设置多个密钥对实现同时对SSH实例的访问。 service String 访问Notebook的途径，枚举值如下： NOTEBOOK：

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

容器内执行参考步骤三启动容器镜像 |──data # 原始数据目录，如使用自定义数据，参考准备数据（可选） |── tokenizers #原始权重/tokenizer目录

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.909） > 准备工作
通过人工标注方式标注数据 - AI开发平台ModelArts

通过人工标注方式标注数据创建ModelArts人工标注作业人工标注图片数据人工标注文本数据人工标注音频数据人工标注视频数据管理标注数据父主题：标注ModelArts数据集中的数据

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据
停止Notebook实例 - AI开发平台ModelArts

ebook。 SSH：可以通过SSH协议远程连接Notebook。 ssh_keys Array of strings SSH密钥对名称列表，允许设置多个密钥对实现同时对SSH实例的访问。 service String 访问Notebook的途径，枚举值如下： NOTEBOOK：

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
创建数据集版本 - AI开发平台ModelArts

创建数据集版本为数据集创建新的版本。 dataset.create_version(name=None, version_format=None, label_task_type=None, label_task_id=None, **kwargs) 示例代码示例一：为数据集创建新的版本

 帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > 数据集版本管理
在ModelArts的Notebook中如何使用pandas库处理OBS桶中的数据？ - AI开发平台ModelArts

在ModelArts的Notebook中如何使用pandas库处理OBS桶中的数据？参考下载OBS文件到Notebook中的指导，将OBS中的数据下载至Notebook本地处理。参考pandas用户指南处理pandas数据。父主题： Standard Notebook

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
删除数据集 - AI开发平台ModelArts

删除数据集根据数据集ID删除指定的数据集 delete_dataset(session, dataset_id) 示例代码删除数据集 from modelarts.session import Session from modelarts.dataset import Dataset

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > 数据集管理
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

容器内执行参考步骤三启动容器镜像 |──data # 原始数据目录，如使用自定义数据，参考准备数据（可选） |── tokenizers #原始权重/tokenizer目录

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 准备工作
训练作业运行失败，出现NCCL报错 - AI开发平台ModelArts

到通信网卡或者是无法正常访问IP地址。需要排查训练代码中是否有设置NCCL_SOCKET_IFNAME环境变量，该环境变量由系统自动注入，训练代码中无需设置。训练代码去除NCCL_SOCKET_IFNAME环境变量设置逻辑后，单击右侧“重建”，重新创建训练作业，提交训练作业后等待作业完成。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败
JupyterLab中文件保存失败，如何解决？ - AI开发平台ModelArts

JupyterLab中文件保存失败，如何解决？问题现象 JupyterLab中保存文件时报错如下：原因分析浏览器安装了第三方插件proxy进行了拦截，导致无法进行保存。在Notebook中的运行文件超过指定大小就会提示此报错。 jupyter页面打开时间太长。网络环境原因，是否有连接网络代理。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 环境配置故障
各个模型训练前文件替换 - AI开发平台ModelArts

各个模型训练前文件替换在训练开始前，因模型权重文件可能与训练框架不匹配或有优化，因此需要针对模型的tokenizer文件进行修改或替换，不同模型的tokenizer文件修改内容如下。 falcon-11B模型在训练开始前，针对falcon-11B模型中的tokenizer文件，需要替

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 训练脚本说明
各个模型训练前文件替换 - AI开发平台ModelArts

各个模型训练前文件替换在训练开始前，因模型权重文件可能与训练框架不匹配或有优化，因此需要针对模型的tokenizer文件进行修改或替换，不同模型的tokenizer文件修改内容如下。 falcon-11B模型在训练开始前，针对falcon-11B模型中的tokenizer文件，需要替

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 训练脚本说明
各个模型训练前文件替换 - AI开发平台ModelArts

各个模型训练前文件替换在训练开始前，因模型权重文件可能与训练框架不匹配或有优化，因此需要针对模型的tokenizer文件进行修改或替换，不同模型的tokenizer文件修改内容如下。 falcon-11B模型在训练开始前，针对falcon-11B模型中的tokenizer文件，需要替

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.909） > 训练脚本说明
录制Profiling - AI开发平台ModelArts

PyTorch Profiler是针对PyTorch框架开发的性能数据采集和解析工具，通过在PyTorch训练脚本中插入Ascend PyTorch Profiler接口，执行训练的同时采集性能数据，完成训练后直接输出可视化的性能数据文件，提升了性能分析效率。 Ascend PyTorch

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.5.901） > 训练脚本说明

总条数： 2244

上一页
1
...
60
61
62
...
113
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

场景介绍 - AI开发平台ModelArts

管理Lite Cluster资源池 - AI开发平台ModelArts

删除Notebook实例 - AI开发平台ModelArts

确认智能标注作业的数据难例 - AI开发平台ModelArts

在ModelArts Standard使用run.sh脚本实现OBS和训练容器间的数据传输 - AI开发平台ModelArts

启动Notebook实例 - AI开发平台ModelArts

查询Notebook实例详情 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

通过人工标注方式标注数据 - AI开发平台ModelArts

停止Notebook实例 - AI开发平台ModelArts

创建数据集版本 - AI开发平台ModelArts

在ModelArts的Notebook中如何使用pandas库处理OBS桶中的数据？ - AI开发平台ModelArts

删除数据集 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

训练作业运行失败，出现NCCL报错 - AI开发平台ModelArts

JupyterLab中文件保存失败，如何解决？ - AI开发平台ModelArts

各个模型训练前文件替换 - AI开发平台ModelArts

各个模型训练前文件替换 - AI开发平台ModelArts

各个模型训练前文件替换 - AI开发平台ModelArts

录制Profiling - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线