搜索_华为云

录制Profiling - AI开发平台ModelArts

Torch训练脚本中插入Ascend PyTorch Profiler接口，执行训练的同时采集性能数据，完成训练后直接输出可视化的性能数据文件，提升了性能分析效率。 Ascend PyTorch Profiler接口可全面采集PyTorch训练场景下的性能数据，主要包括PyTor

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练脚本说明
如何将本地标注的数据导入ModelArts？ - AI开发平台ModelArts

如何将本地标注的数据导入ModelArts？ ModelArts支持通过导入数据集的操作，导入更多数据。本地标注的数据，当前支持从OBS目录导入或从Manifest文件导入两种方式。导入之后您还可以在ModelArts数据管理模块中对数据进行重新标注或修改标注情况。从OBS目录导入或从Manifest详细操作指导和规范说明请参见导入数据。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据准备
MoXing Framework功能介绍 - AI开发平台ModelArts

txt”。用户无法直接使用open方法打开OBS文件，上面描述的打开本地文件的代码将会报错。 OBS提供了很多方式和工具给用户使用，如SDK、API、console、OBS Browser等，ModelArts mox.file提供了一套更为方便地访问OBS的API，允许用户通过一系列模仿操作本地文件系统的API来

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 在Notebook中使用Moxing命令
通过SSH工具远程使用Notebook - AI开发平台ModelArts

使用puttygen将密钥对.pem文件转成.ppk文件下载puttygen，并双击运行puttygen。单击“Load”，上传.pem密钥（即在创建Notebook实例时创建并保存的密钥对文件）。单击“Save private key”，保存生成的.ppk文件。.ppk文件的名字可以自定义，例如key

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
创建模型失败，如何定位和处理问题？ - AI开发平台ModelArts

模型文件目录下不能出现dockerfile文件，需要去掉模型文件目录下存在dockerfile文件。图2 构建日志：dockerfile文件目录有问题 pip软件包版本不匹配，需要修改为日志中打印的存在的版本。图3 pip版本不匹配构建日志中出现报错：“exec /usr/bin/sh:

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
创建模型 - AI开发平台ModelArts
创建模型 - AI开发平台ModelArts

创建模型创建模型不同方式的场景介绍从训练作业中导入模型文件创建模型从OBS中导入模型文件创建模型从容器镜像中导入模型文件创建模型从AI Gallery订阅模型父主题：使用ModelArts Standard部署模型并推理预测

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测
发布本地AI应用到AI Gallery - AI开发平台ModelArts

当AI应用的状态变为“待启动”时，表示创建完成。启动AI应用上传AI应用的运行文件“app.py”。在AI应用详情页，选择“应用文件”页签，单击“添加文件”，进入上传文件页面。运行文件的开发要求请参见准备AI应用运行文件app.py。上传单个超过5GB的文件时，请使用Gallery CLI工具。CLI工具的获取和使用请参见Gallery

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery中的AI应用
在JupyterLab中使用TensorBoard可视化作业 - AI开发平台ModelArts

OBS并行文件系统中。 Summary数据上传到Notebook路径/home/ma-user/work/下的方式，请参见上传本地文件至JupyterLab。 Summary数据如果是通过OBS并行文件系统挂载到Notebook中，请将模型训练时产生的Summary文件先上传到O

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

容器引擎选择Containerd。图1 购买Lite专属池 k8s Cluster资源配置若已完成集群资源购买和开通，则需要对网络、存储、容器镜像等内容进行配置。请参考k8s Cluster环境配置详细流程。 kubectl访问集群配置本步骤需要在节点机器，对kubectl进行集群访问配置。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 准备工作
修改Standard专属资源池支持的作业类型 - AI开发平台ModelArts

资源浪费。约束限制专属资源池状态处于“运行中”。操作步骤登录ModelArts管理控制台，在左侧导航栏中选择“AI专属资源池 > 弹性集群Cluster”，进入“Standard资源池”页面。在资源池列表中，选择某个资源池右侧操作列的“ > 设置作业类型”。在“设置作

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
使用预置镜像制作自定义镜像用于训练模型 - AI开发平台ModelArts

容器镜像选择上一步上传到SWR的镜像。代码目录必填，选择训练代码文件所在的OBS目录。需要提前将代码上传至OBS桶中，目录内文件总大小要小于或等于5GB，文件数要小于或等于1000个，文件深度要小于或等于32。训练代码文件会在训练作业启动的时候被系统自动下载到训练容器的“${MA_

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
模型调试 - AI开发平台ModelArts
模型调试 - AI开发平台ModelArts

ssion鉴权。将自定义的推理文件和模型配置文件保存在训练生成的模型文件目录下。如训练生成的模型保存在“/home/ma-user/work/tensorflow_mlp_mnist_local_mode/train/model/”中，则推理文件“customize_service

帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

容器引擎选择Containerd。图1 购买Lite专属池 k8s Cluster资源配置如果已完成集群资源购买和开通，则需要对网络、存储、容器镜像等内容进行配置。请参考k8s Cluster环境配置详细流程。 kubectl访问集群配置本步骤需要在节点机器，对kubectl进行集群访问配置。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 准备工作
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

容器引擎选择Containerd。图1 购买Lite专属池 k8s Cluster资源配置如果已完成集群资源购买和开通，则需要对网络、存储、容器镜像等内容进行配置。请参考k8s Cluster环境配置详细流程。 kubectl访问集群配置本步骤需要在节点机器，对kubectl进行集群访问配置。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） > 准备工作
Notebook中快速使用MoXing - AI开发平台ModelArts

在JupyterLab的“Launcher”页签下，以TensorFlow为例，您可以单击TensorFlow，创建一个用于编码的文件。图1 选择不同的AI引擎文件创建完成后，系统默认进入“JupyterLab”编码页面。图2 进入编码页面调用mox.file 输入如下代码，实现如下几个简单的功能。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 在Notebook中使用Moxing命令
训练作业使用MoXing复制数据较慢，重复打印日志 - AI开发平台ModelArts

重复打印日志，该日志表示正在读取远端存在的文件，当文件列表读取完成以后，开始下载数据。如果文件比较多，那么该过程会消耗较长时间。处理方法在创建训练作业时，数据可以保存到OBS上。不建议使用TensorFlow、MXNet、PyTorch的OBS接口直接从OBS上读取数据。如果文件较小，可以将OBS上的数据保存成“

帮助中心 > AI开发平台ModelArts > 故障排除 > MoXing
Open-Sora 1.0基于Lite Server适配PyTorch NPU训练指导（6.3.905） - AI开发平台ModelArts

处理后的数据文件 Step5 启动训练服务训练至少需要单机8卡。建议手动下载所需的权重文件，放在weights文件夹下。在/home/ma-user/ascendcloud-aigc-algorithm-open_sora/目录下进行操作。创建weights文件夹。 mkdir

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生视频模型训练推理
训练中的权重转换说明 - AI开发平台ModelArts

etrain_hf中的文件与原始Hugging Face模型中的文件进行对比，查看是否缺少如tokenizers.json、tokenizer_config.json、special_tokens_map.json等tokenizer文件或者其他json文件。若缺少则需要直接复制

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明
训练中的权重转换说明 - AI开发平台ModelArts

etrain_hf中的文件与原始Hugging Face模型中的文件进行对比，查看是否缺少如tokenizers.json、tokenizer_config.json、special_tokens_map.json等tokenizer文件或者其他json文件。若缺少则需要直接复制

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.910） > 训练脚本说明
（可选）本地安装ma-cli - AI开发平台ModelArts

参考本地安装ModelArts SDK完成SDK的安装。 Step2：下载ma-cli 下载ma-cli软件包。完成软件包签名校验。下载软件包签名校验文件。安装openssl并执行如下命令进行签名校验。 openssl cms -verify -binary -in D:\ma_cli-latest-py3-none-any

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考

总条数： 1615

上一页
1
...
53
54
55
...
81
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

录制Profiling - AI开发平台ModelArts

如何将本地标注的数据导入ModelArts？ - AI开发平台ModelArts

MoXing Framework功能介绍 - AI开发平台ModelArts

通过SSH工具远程使用Notebook - AI开发平台ModelArts

创建模型失败，如何定位和处理问题？ - AI开发平台ModelArts

创建模型 - AI开发平台ModelArts

发布本地AI应用到AI Gallery - AI开发平台ModelArts

在JupyterLab中使用TensorBoard可视化作业 - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

修改Standard专属资源池支持的作业类型 - AI开发平台ModelArts

使用预置镜像制作自定义镜像用于训练模型 - AI开发平台ModelArts

模型调试 - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

Notebook中快速使用MoXing - AI开发平台ModelArts

训练作业使用MoXing复制数据较慢，重复打印日志 - AI开发平台ModelArts

Open-Sora 1.0基于Lite Server适配PyTorch NPU训练指导（6.3.905） - AI开发平台ModelArts

训练中的权重转换说明 - AI开发平台ModelArts

训练中的权重转换说明 - AI开发平台ModelArts

（可选）本地安装ma-cli - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线