搜索_华为云

录制Profiling - AI开发平台ModelArts

PyTorch Profiler是针对PyTorch框架开发的性能数据采集和解析工具，通过在PyTorch训练脚本中插入Ascend PyTorch Profiler接口，执行训练的同时采集性能数据，完成训练后直接输出可视化的性能数据文件，提升了性能分析效率。 Ascend PyTorch

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练脚本说明
录制Profiling - AI开发平台ModelArts

PyTorch Profiler是针对PyTorch框架开发的性能数据采集和解析工具，通过在PyTorch训练脚本中插入Ascend PyTorch Profiler接口，执行训练的同时采集性能数据，完成训练后直接输出可视化的性能数据文件，提升了性能分析效率。 Ascend PyTorch

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 训练脚本说明
使用moxing适配OBS路径，pandas读取文件报错 - AI开发平台ModelArts

使用moxing适配OBS路径，pandas读取文件报错问题现象使用moxing适配OBS路径，然后用较高版本的pandas读取OBS文件报出如下错误： 1.‘can't decode byte xxx in position xxx’ 2.‘OSError:File isn't

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
在ModelArts的Notebook中安装远端插件时不稳定要怎么办？ - AI开发平台ModelArts

在本地VS Code环境中，将下载好的.vsix文件拖动到远端Notebook中。右键单击该文件，选择Install Extension VSIX。方法二：设置远端默认安装的插件按照在ModelArts的Notebook中如何设置VS Code远端默认安装的插件？配置，即会在连接远端时自动安装，减少等待时间。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
FLUX.1基于DevSever适配PyTorch NPU Finetune&Lora训练指导（6.3.911） - AI开发平台ModelArts

下载华为侧插件代码包AscendCloud-AIGC-6.3.911-xxx.zip文件，获取路径参见表1。本案例使用的是解压到子目录/aigc_train/torch_npu/flux目录下的所有文件和文件夹，将flux目录下所有文件和文件夹全部上传到宿主机对应工作目录${work_dir}/flux下

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
开发用于自定义镜像训练的代码 - AI开发平台ModelArts

RANK_TABLE_FILE文件。当使用预置框架创建训练作业时，在训练过程中预置框架会自动解析Ascend HCCL RANK_TABLE_FILE文件，当使用自定义镜像创建训练作业时，就要适配训练代码使得训练过程中在代码里读取解析Ascend HCCL RANK_TABLE_FILE文件。 Ascend

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 准备模型训练代码
录制Profiling - AI开发平台ModelArts

PyTorch Profiler是针对PyTorch框架开发的性能数据采集和解析工具，通过在PyTorch训练脚本中插入Ascend PyTorch Profiler接口，执行训练的同时采集性能数据，完成训练后直接输出可视化的性能数据文件，提升了性能分析效率。 Ascend PyTorch

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.909） > 训练脚本说明
查询数据集详情 - AI开发平台ModelArts

查询数据集详情查询数据集的详细信息，包括数据集的样本信息、版本信息等。 dataset.get_dataset_info() 示例代码查询数据集详情 from modelarts.session import Session from modelarts.dataset import

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > 数据集管理
在ModelArts中如何将标注结果下载至本地？ - AI开发平台ModelArts

ModelArts数据集中的标注信息和数据在发布后，将以manifest格式存储在“数据集输出位置”对应的OBS路径下。路径获取方式：在ModelArts管理控制台，进入“数据管理>数据集”。选择需查看数据集，单击名称左侧小三角，展开数据集详情。可获得“数据集输出位置”指定的OBS路径。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据准备
查询数据集监控数据 - AI开发平台ModelArts

查询数据集监控数据功能介绍查询数据集在指定时间范围内的监控数据。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/dat

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
处理ModelArts数据集中的数据 - AI开发平台ModelArts

处理ModelArts数据集中的数据数据处理场景介绍创建ModelArts数据校验任务创建ModelArts数据清洗任务创建ModelArts数据选择任务创建ModelArts数据增强任务管理和查看数据处理任务父主题：数据准备与处理

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理
附录：微调训练常见问题 - AI开发平台ModelArts

barrier错误错误截图：报错原因：多线程退出各个节点间超时时间默认为300s，时间设置过短。解决措施：修改容器内torch/distributed/elastic/agent/server/api.py文件参数： vim /home/ma-user/anaconda3/envs/PyTorch-2

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.908）
OBS管理概述 - AI开发平台ModelArts

OBS管理概述 ModelArts SDK 1.1.3支持对OBS进行管理，主要涵盖上传下载文件和文件夹。具体包括如下操作：上传文件至OBS 上传文件夹至OBS 从OBS下载文件从OBS下载文件夹父主题： OBS管理

 帮助中心 > AI开发平台ModelArts > SDK参考 > OBS管理
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

目前支持runc和containerd作为镜像构建环境，默认是runc。 buildkitctl（客户端）：负责解析Dockerfile文件，并向服务端buildkitd发出构建请求。下载并解压buildkit程序。 # 下载 buildkit 工具，注意使用的是0.15.1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 准备工作
模型训练高可靠性 - AI开发平台ModelArts

模型训练高可靠性训练作业容错检查训练日志失败分析训练作业卡死检测训练作业重调度设置断点续训练设置无条件自动重启父主题：使用ModelArts Standard训练模型

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
委托授权ModelArts云服务使用SFS Turbo - AI开发平台ModelArts

身份认证（IAM）服务。在统一身份认证服务页面的左侧导航选择“权限管理 > 权限”，单击右上角的“创建自定义策略”，设置策略，单击“确定”。 “策略名称”：设置自定义策略名称，例如：委托modelarts操作SFS Turbo。 “策略配置方式”：选择可视化视图或者JSON视图均可。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
发布Workflow到ModelArts - AI开发平台ModelArts

default="True", description="是否进行数据清洗, 数据格式异常会导致训练失败，建议开启，保证训练稳定性。数据量过大时，数据清洗可能耗时较久，可自行线下清洗（支持BMP.JPEG,PNG格式, RGB三通道）。建议用JPEG格式数据")), wf.Al

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 发布Workflow
标注ModelArts数据集中的数据 - AI开发平台ModelArts

标注ModelArts数据集中的数据数据标注场景介绍通过人工标注方式标注数据通过智能标注方式标注数据通过团队标注方式标注数据管理标注作业父主题：数据准备与处理

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理
导入模型提示单个模型文件超过5G限制 - AI开发平台ModelArts

导入模型提示单个模型文件超过5G限制问题现象在导入模型时，提示单个模型文件大小超过5G限制。原因分析在不使用动态加载的情况下，系统对单个模型文件的限制大小为5G，超过时无法进行导入。处理方法精简模型文件后，重新导入。使用动态加载功能进行导入。图1 使用动态加载父主题：

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

准备AscendSpeed训练代码、分词器Tokenizer和推理代码。准备数据准备训练数据，可以用Alpaca数据集，也可以使用自己准备的数据集。准备镜像准备训练模型适用的容器镜像。预训练预训练介绍如何进行预训练，包括训练数据处理、超参配置、训练任务、断点续训及性能查看。微调训练 SFT全参微调

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Baichuan2-13B模型基于DevServer适配PyTorch NPU训练指导（6.3.904）

总条数： 2244

上一页
1
...
61
62
63
...
113
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

录制Profiling - AI开发平台ModelArts

录制Profiling - AI开发平台ModelArts

使用moxing适配OBS路径，pandas读取文件报错 - AI开发平台ModelArts

在ModelArts的Notebook中安装远端插件时不稳定要怎么办？ - AI开发平台ModelArts

FLUX.1基于DevSever适配PyTorch NPU Finetune&Lora训练指导（6.3.911） - AI开发平台ModelArts

开发用于自定义镜像训练的代码 - AI开发平台ModelArts

录制Profiling - AI开发平台ModelArts

查询数据集详情 - AI开发平台ModelArts

在ModelArts中如何将标注结果下载至本地？ - AI开发平台ModelArts

查询数据集监控数据 - AI开发平台ModelArts

处理ModelArts数据集中的数据 - AI开发平台ModelArts

附录：微调训练常见问题 - AI开发平台ModelArts

OBS管理概述 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

模型训练高可靠性 - AI开发平台ModelArts

委托授权ModelArts云服务使用SFS Turbo - AI开发平台ModelArts

发布Workflow到ModelArts - AI开发平台ModelArts

标注ModelArts数据集中的数据 - AI开发平台ModelArts

导入模型提示单个模型文件超过5G限制 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线