搜索_华为云

使用SDK调测多机分布式训练作业 - AI开发平台ModelArts

等类型。对于布尔类型，建议用户在训练脚本中使用action='store_true'的形式来解析。 framework_type：必选参数，训练作业使用的AI框架类型，可参考步骤5的返回结果。 train_instance_type：必选参数，训练实例类型，这里指定’local’即为本地训练。

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业 > 训练作业调测
MiniCPM-V2.6基于DevServer适配PyTorch NPU训练指导（6.3.909） - AI开发平台ModelArts

档。确保容器可以访问公网。 Step1 准备环境请参考DevServer资源开通，购买DevServer资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
如果不再使用ModelArts，如何停止收费？ - AI开发平台ModelArts

根据实际情况进入管理页面，停止收费。图1 查看收费作业进入“ModelArts>Workflow”页面，检查是否有“运行中”的Workflow列表。如果有，单击Workflow列表中“操作 > 删除”即可停止计费。进入“ModelArts>自动学习”页面，检查是否有“运行中”的项目。如果有，单击项目列表中“操作

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费FAQ
部署的在线服务状态为告警 - AI开发平台ModelArts

请检查您的模型是否能正常运行。例如模型依赖的资源是否故障，需要排查推理日志。实例pod数量异常。如果您曾经找过运维人员删除过异常的实例pod，事件中可能会出现告警“服务异常，不正常的实例数为XXX”。在出现这种告警后，服务会自动拉起新的正常实例，从而恢复到正常运行状态。请您耐心等待。父主题：服务部署

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
Controlnet训练 - AI开发平台ModelArts

使用ma-user用户在容器上执行如下命令解压数据集。 cd /home/ma-user/datasets/fill50k unzip conditioning_images.zip unzip images.zip 接着修改fill50k.py文件，如果机器无法访问hugging

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理 > SD1.5&SDXL Diffusers框架基于DevServer适配PyTorch NPU训练指导（6.3.907）
附录：Standard大模型推理常见问题 - AI开发平台ModelArts

'original_max_position_embeddings': 8192, 'rope_type': 'llama3'} 解决方法：升级transformers版本到4.43.1：pip install transformers --upgrade 问题5：使用Smooth

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
附录：大模型推理常见问题 - AI开发平台ModelArts

'original_max_position_embeddings': 8192, 'rope_type': 'llama3'} 解决方法：升级transformers版本到4.43.1：pip install transformers --upgrade 问题5：使用Smooth

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）
附录：大模型推理常见问题 - AI开发平台ModelArts

'original_max_position_embeddings': 8192, 'rope_type': 'llama3'} 解决方法：升级transformers版本到4.43.1：pip install transformers --upgrade 问题5：使用Smooth

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908）
推理场景介绍 - AI开发平台ModelArts

rver资源开通，购买DevServer资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器获取宿主机的元

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908）
创建模型失败，如何定位和处理问题？ - AI开发平台ModelArts

创建模型任务下发成功，但最终模型创建失败。需要从以下几个方面进行排查：在模型详情页面，查看“事件”页签中的事件信息。根据事件信息分析模型失败原因，进行处理。如果模型状态为“构建失败”，可以在模型详情页面，查看“事件”页签中的“查看构建日志”。构建日志中有对应的构建镜像失败的详细原因，根据构建失败的原因进行排查处理。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
在Notebook中添加自定义IPython Kernel - AI开发平台ModelArts

在Notebook中添加自定义IPython Kernel 使用场景当前Notebook默认内置的引擎环境不能满足用户诉求，用户可以新建一个conda env按需搭建自己的环境。本小节以搭建一个“python3.6.5和tensorflow1.2.0”的IPython Kernel为例进行展示。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 环境配置相关
附录：Standard大模型推理常见问题 - AI开发平台ModelArts

'original_max_position_embeddings': 8192, 'rope_type': 'llama3'} 解决方法：升级transformers版本到4.43.1：pip install transformers --upgrade 问题5：使用Smooth

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
附录：Standard大模型推理常见问题 - AI开发平台ModelArts

'original_max_position_embeddings': 8192, 'rope_type': 'llama3'} 解决方法：升级transformers版本到4.43.1：pip install transformers --upgrade 问题5：使用Smooth

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
如何在Notebook中上传下载OBS文件？ - AI开发平台ModelArts

点区域，例如：都在华北-北京四站点。不支持跨站点访问OBS桶。具体请参见查看OBS桶与ModelArts是否在同一个区域。请确认操作Notebook的账号有权限读取OBS桶中的数据。如没有权限，请参见在Notebook中，如何访问其他账号的OBS桶？。父主题：文件上传下载

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 文件上传下载
准备声音分类数据 - AI开发平台ModelArts

Name/data-cat/cat.wav”。上传OBS的操作步骤：执行如下操作，将数据导入到您的数据集中，以便用于模型训练和构建。登录OBS管理控制台，在ModelArts同一区域内创建桶。如果已存在可用的桶，需确保OBS桶与ModelArts在同一区域。参考上传文件，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现声音分类
故障恢复 - AI开发平台ModelArts
故障恢复 - AI开发平台ModelArts

全部计算节点。推理部署故障恢复用户部署的在线推理服务运行过程中，如发生硬件故障导致推理实例故障，ModelArts会自动检测到并迁移受影响实例到其它可用节点，实例启动后恢复推理请求处理能力。故障的硬件节点会自动隔离不再调度和运行推理服务实例。父主题：安全

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

场景介绍方案概览本文档利用训练框架LlamaFactory+华为自研Ascend Snt9B硬件，为用户提供了常见主流开源大模型在ModelArts Lite DevServer上的不同训练阶段方案，包括指令监督微调、DPO偏好训练、RM奖励模型训练、PPO强化训练方案。 DPO(Direct

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910）
upload后，数据将上传到哪里？ - AI开发平台ModelArts

如果您创建的Notebook使用OBS存储实例时单击“upload”后，数据将直接上传到该Notebook实例对应的OBS路径下，即创建Notebook时指定的OBS路径。如果您创建的Notebook使用EVS存储实例时单击“upload”后，数据将直接上传至当前实例容器中，即在“Terminal”中的“~/work”目录下。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 文件上传下载
如果不再使用ModelArts，如何停止收费？ - AI开发平台ModelArts

根据实际情况进入管理页面，停止收费。图1 查看收费作业进入“ModelArts>Workflow”页面，检查是否有“运行中”的Workflow列表。如果有，单击Workflow列表中“操作 > 删除”即可停止计费。进入“ModelArts>自动学习”页面，检查是否有“运行中”的项目。如果有，单击项目列表中“操作

 帮助中心 > AI开发平台ModelArts > 常见问题 > 计费相关
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

场景介绍方案概览本文档利用训练框架LlamaFactory+华为自研Ascend Snt9B硬件，为用户提供了常见主流开源大模型在ModelArts Lite DevServer上的微调方案，包括sft全参和lora 微调。本方案目前仅适用于部分企业客户，完成本方案的部署，需要先联系您所在企业的华为方技术支持。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907）

总条数： 1993

上一页
1
...
48
49
50
...
100
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用SDK调测多机分布式训练作业 - AI开发平台ModelArts

MiniCPM-V2.6基于DevServer适配PyTorch NPU训练指导（6.3.909） - AI开发平台ModelArts

如果不再使用ModelArts，如何停止收费？ - AI开发平台ModelArts

部署的在线服务状态为告警 - AI开发平台ModelArts

Controlnet训练 - AI开发平台ModelArts

附录：Standard大模型推理常见问题 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

创建模型失败，如何定位和处理问题？ - AI开发平台ModelArts

在Notebook中添加自定义IPython Kernel - AI开发平台ModelArts

附录：Standard大模型推理常见问题 - AI开发平台ModelArts

附录：Standard大模型推理常见问题 - AI开发平台ModelArts

如何在Notebook中上传下载OBS文件？ - AI开发平台ModelArts

准备声音分类数据 - AI开发平台ModelArts

故障恢复 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

upload后，数据将上传到哪里？ - AI开发平台ModelArts

如果不再使用ModelArts，如何停止收费？ - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线