搜索_华为云

LLaVA模型基于DevServer适配PyTorch NPU推理指导（6.3.906） - AI开发平台ModelArts

vServer资源和Ascend Snt9B。推理需要单机单卡。表1 环境要求名称版本 CANN cann_8.0.rc2 PyTorch pytorch_2.1.0 驱动 23.0.5 获取软件和镜像表2 获取软件和镜像分类名称获取路径插件代码包 AscendCloud-6

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
Open-Sora 1.0基于DevServer适配PyTorch NPU训练指导（6.3.905） - AI开发平台ModelArts

r资源和Ascend Snt9B。训练至少需要单机8卡，推理需要单机单卡。表1 环境要求名称版本 CANN cann_8.0.rc2 PyTorch pytorch_2.1.0 获取软件和镜像表2 获取软件和镜像分类名称获取路径插件代码包 AscendCloud-3rdAIGC-6

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
修改Standard专属资源池支持的作业类型 - AI开发平台ModelArts

登录ModelArts管理控制台，在左侧导航栏中选择“AI专属资源池 > 弹性集群Cluster”，进入“弹性集群Cluster”页面。在资源池列表中，选择某个资源池操作列“更多 > 设置作业类型”。在“设置作业类型”弹窗中，选择需要设置的作业类型。图1 设置作业类型选择完成后，单击“确定”，启用作业类型。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
报错“Bad owner or permissions on C:\Users\Administrator/.ssh/config”或“Connection permission denied (publickey)”如何解决？ - AI开发平台ModelArts

主体”后面的“选择主体”，弹出“选择用户，计算机，服务账户或组”窗口，单击“高级”，输入用户名，单击“立即查找”按钮，显示用户搜索结果列表。选择您的用户账户，然后单击“确定”（大约四个窗口）以关闭所有窗口。图1 添加所有者完成所有操作后，再次关闭并打开VS Code并尝试

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > VS Code连接开发环境失败常见问题
创建预测分析自动学习项目时，对训练数据有什么要求？ - AI开发平台ModelArts

出（预测项）。除标签列外数据集中至少还应包含两个有效特征列（列的取值至少有两个且数据缺失比例低于10%）。训练数据的csv文件不能包含表头，否则会导致训练失败。父主题：准备数据

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习 > 准备数据
显存溢出错误 - AI开发平台ModelArts

和PP流水线并行（pipeline-model-parallel-size），可以尝试增加 TP和PP的值，一般TP×PP≤NPU数量，并且要被整除，具体调整值可参照表2进行设置。可调整参数：MBS指最小batch处理的样本量（micro-batch-size）、GBS指一个iteration所处理的样本

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 常见错误原因和解决方法
显存溢出错误 - AI开发平台ModelArts

和PP流水线并行（pipeline-model-parallel-size），可以尝试增加 TP和PP的值，一般TP×PP≤NPU数量，并且要被整除，具体调整值可参照表2进行设置。可调整参数：MBS指最小batch处理的样本量（micro-batch-size）、GBS指一个iteration所处理的样本

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907） > 常见错误原因和解决方法
显存溢出错误 - AI开发平台ModelArts

和PP流水线并行（pipeline-model-parallel-size），可以尝试增加 TP和PP的值，一般TP×PP≤NPU数量，并且要被整除，具体调整值可参照表2进行设置。可调整参数：MBS指最小batch处理的样本量（micro-batch-size）、GBS指一个iteration所处理的样本

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.909） > 常见错误原因和解决方法
查看日志和性能 - AI开发平台ModelArts

iteration)*1000，其global batch size（GBS）、seq_len（SEQ_LEN）为训练时设置的参数，具体参数查看表1。 loss收敛情况：日志里存在lm loss参数，lm loss参数随着训练迭代周期持续性减小，并逐渐趋于稳定平缓。也可以使用可视化工

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.909）
Qwen-VL基于DevServer适配Pytorch NPU的推理指导(6.3.906) - AI开发平台ModelArts

推荐使用“西南-贵阳一”Region上的DevServer资源和Ascend Snt9B。表1 环境要求名称版本 PyTorch pytorch_2.1.0 驱动 23.0.5 获取镜像表2 获取镜像分类名称获取路径基础镜像西南-贵阳一：swr.cn-southwest-2

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
在Notebook中上传文件失败，如何解决？ - AI开发平台ModelArts

请前往权限管理，查看是否具有OBS访问授权。如果没有，请参考配置访问授权（全局配置）。请确认是否有OBS桶的访问权限进入OBS控制台页面，可以看到所有的OBS桶列表，进入需要访问的桶，确认是否有权限访问，如果无权限则会报错。进入OBS控制台页面，确认OBS桶是否存在。父主题：文件上传下载

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 文件上传下载
Step1 创建用户组并加入用户 - AI开发平台ModelArts

创建用户组。在左侧菜单栏中，选择“用户组”。单击右上角“创建用户组”，在“用户组名称”中填入“用户组02”，然后单击“确定”完成用户组创建。创建完成后，返回用户组列表。通过用户组管理，将已有子账号加入到用户组中。如果没有子用户账号，可以创建子账号并加入用户组。创建子用户账号并加入用户组。在IAM左侧菜单

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践 > 配置ModelArts基本使用权限
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

弹性集群”，选择创建的专属资源池。图1 查看专属资源池在专属池详情页可查看驱动及固件版本。如下图显示Ascend驱动为7.1.0.7.220-23.0.5，表示固件版本为7.1.0.7.220，驱动版本为23.0.5。图2 查看专属池驱动创建OBS桶 ModelArts使用对象存储服务（Object

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907） > 准备工作
查看日志和性能 - AI开发平台ModelArts

iteration)*1000，其global batch size（GBS）、seq_len（SEQ_LEN）为训练时设置的参数，具体参数查看表1。 loss收敛情况：日志里存在lm loss参数，lm loss参数随着训练迭代周期持续性减小，并逐渐趋于稳定平缓。也可以使用可视化工

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905）
训练启动脚本说明和参数配置 - AI开发平台ModelArts

obs_data_dir) 模型推荐的参数与NPU卡数设置不同模型推荐的训练参数和计算规格要求如表1所示。规格与节点数中的1*节点 & 4*Ascend表示单机4卡，以此类推。表1 不同模型推荐的参数与NPU卡数设置序号支持模型支持模型参数量文本序列长度并行参数设置

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.909） > 训练脚本说明
moondream2基于DevServer适配PyTorch NPU推理指导 - AI开发平台ModelArts

资源规格要求推理部署推荐使用DevServer资源和Ascend Snt9B单机单卡。表1 环境要求名称版本 CANN cann_8.0.rc1 PyTorch pytorch_2.1.0 获取镜像表2 获取镜像分类名称获取路径基础镜像西南-贵阳一：swr.cn-southwest-2

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
Open-Clip基于DevServer适配PyTorch NPU训练指导 - AI开发平台ModelArts

推荐使用“西南-贵阳一”Region上的DevServer资源和Ascend Snt9B单机单卡。表1 环境要求模型版本 CANN cann_8.0.rc1 PyTorch pytorch_2.1.0 获取镜像表2 获取镜像分类名称获取路径基础镜像西南-贵阳一：swr.cn-southwest-2

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
导出ModelArts数据集中的数据到OBS - AI开发平台ModelArts

VOC格式的XML标注文件以及Mask图像。导出数据到OBS 登录ModelArts管理控制台，在左侧菜单栏中选择“资产管理>数据集”，进入“数据集”管理页面。在数据集列表中，选择“图片”类型的数据集，单击数据集名称进入“数据集概览页”。在“数据集概览页”，单击右上角“导出 ”。在弹出的“导出”对话框中，填写

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导出ModelArts数据集中的数据
启动/停止/删除实例 - AI开发平台ModelArts

源。登录ModelArts管理控制台，在左侧菜单栏中选择“开发空间>Notebook”，进入Notebook页面。在Notebook列表中，单击操作列的“删除”，在弹出的确认对话框中，确认信息无误，然后输入“DELETE”，单击“确定”，完成删除操作。 Notebook删除后

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例
显存溢出错误 - AI开发平台ModelArts

和PP流水线并行（pipeline-model-parallel-size），可以尝试增加 TP和PP的值，一般TP×PP≤NPU数量，并且要被整除，具体调整值可参照表2进行设置。可调整参数：MBS指最小batch处理的样本量（micro-batch-size）、GBS指一个iteration所处理的样本

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.909） > 常见错误原因和解决方法

总条数： 1378

上一页
1
...
64
65
66
...
69
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

LLaVA模型基于DevServer适配PyTorch NPU推理指导（6.3.906） - AI开发平台ModelArts

Open-Sora 1.0基于DevServer适配PyTorch NPU训练指导（6.3.905） - AI开发平台ModelArts

修改Standard专属资源池支持的作业类型 - AI开发平台ModelArts

报错“Bad owner or permissions on C:\Users\Administrator/.ssh/config”或“Connection permission denied (publickey)”如何解决？ - AI开发平台ModelArts

创建预测分析自动学习项目时，对训练数据有什么要求？ - AI开发平台ModelArts

显存溢出错误 - AI开发平台ModelArts

显存溢出错误 - AI开发平台ModelArts

显存溢出错误 - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

Qwen-VL基于DevServer适配Pytorch NPU的推理指导(6.3.906) - AI开发平台ModelArts

在Notebook中上传文件失败，如何解决？ - AI开发平台ModelArts

Step1 创建用户组并加入用户 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

moondream2基于DevServer适配PyTorch NPU推理指导 - AI开发平台ModelArts

Open-Clip基于DevServer适配PyTorch NPU训练指导 - AI开发平台ModelArts

导出ModelArts数据集中的数据到OBS - AI开发平台ModelArts

启动/停止/删除实例 - AI开发平台ModelArts

显存溢出错误 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线