搜索_华为云

附录：训练常见问题 - AI开发平台ModelArts

_exit_barrier(self)方法中的barrier_timeout参数，修改后如图1所示。 #修改前 barrier_timeout=self._exit_barrier_timeout #修改后 barrier_timeout=3000 图1 修改后的barrier_timeout参数问题5：训练完成使用vllm0

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912）
实例故障 - AI开发平台ModelArts
实例故障 - AI开发平台ModelArts

实例故障创建Notebook失败，查看事件显示JupyterProcessKilled 创建Notebook实例后无法打开页面，如何处理？使用pip install时出现“没有空间”的错误出现“save error”错误，可以运行代码，但是无法保存出现ModelArts.6333错误，如何处理？

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

包结构说明。获取路径：Support-E，在此路径中查找下载ModelArts 6.3.912 版本。说明：如果上述软件获取路径打开后未显示相应的软件信息，说明您没有下载权限，请联系您所在企业的华为方技术支持下载获取。模型软件包结构说明 AscendCloud-6.3.9

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
安装Gallery CLI配置工具 - AI开发平台ModelArts

CLI配置工具包下载完成后，进入服务器安装工具。不管是ModelArts Lite云服务，还是本地Windows/Linux等服务器，安装操作都相同。登录服务器，激活python虚拟环境。 conda activate [env_name] # 例如使用conda管理python环境（需要确认环境已安装Anaconda）

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > Gallery CLI配置工具指南
MaaS使用场景和使用流程 - AI开发平台ModelArts

在ModelArts Studio大模型即服务平台的“模型广场”中选择大模型模板后，需要先创建自定义大模型，才能进行模型训练和推理，才能获得更适合特定领域或任务的大语言模型。在MaaS中创建模型 3 模型调优完成数据集的准备后，可以在ModelArts Studio大模型即服务平台开始模型调

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
在ModelArts上训练模型如何配置输入输出数据？ - AI开发平台ModelArts

training data') # 解析参数 args, unknown = parser.parse_known_args() 完成参数解析后，用户使用“data_url”、“train_url”代替算法中数据来源和数据输出所需的路径。在使用预置框架创建算法时，根据1中的代码参数设置定义的输入输出参数。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
Eagle投机小模型训练 - AI开发平台ModelArts

max_length：模型的max_length。 dtype：为模型dtype，默认为bfloat16。执行完成后，记得unset环境变量，否则会导致后续推理服务启动出错。 unset EAGLE_TARIN_MODE 执行完成后，如果used_npus>1，则需要将训练生成data数据重新分配为8个文件夹，分

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
Eagle投机小模型训练 - AI开发平台ModelArts

max_length：模型的max_length。 dtype：为模型dtype，默认为bfloat16。执行完成后，记得unset环境变量，否则会导致后续推理服务启动出错。 unset EAGLE_TARIN_MODE 执行完成后，如果used_npus>1，则需要将训练生成data数据重新分配为8个文件夹，分

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
Eagle投机小模型训练 - AI开发平台ModelArts

max_length：模型的max_length。 dtype：为模型dtype，默认为bfloat16。执行完成后，记得unset环境变量，否则会导致后续推理服务启动出错。 unset EAGLE_TARIN_MODE 执行完成后，如果used_npus>1，则需要将训练生成data数据重新分配为8个文件夹，分

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911）
自定义镜像训练作业配置节点间SSH免密互信 - AI开发平台ModelArts

一般保持默认值。该配置会在下发训练作业后，自动在训练容器的“/home/ma-user/.ssh”目录下生成SSH密钥文件和配置文件“authorized_keys config id_rsa id_rsa.pub”。提交创建训练作业后，训练过程中，训练作业的节点可通过域名+

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 准备模型训练代码
环境配置故障 - AI开发平台ModelArts

ModuleNotFoundError: No module named 'numba' JupyterLab中文件保存失败，如何解决？用户结束kernelgateway进程后报错Server Connection Error，如何恢复？父主题：开发环境

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境
Standard自动学习 - AI开发平台ModelArts

在ModelArts自动学习中，如何进行增量训练？创建自动学习项目时，如何快速创建OBS桶及文件夹？自动学习生成的模型，存储在哪里？支持哪些其他操作？自动学习训练后的模型是否可以下载？

帮助中心 > AI开发平台ModelArts > 常见问题
准备物体检测数据 - AI开发平台ModelArts

为保证模型的泛化能力，数据集尽量覆盖可能出现的各种场景。物体检测数据集中，如果标注框坐标超过图片，将无法识别该图片为已标注图片。数据上传至OBS 在本文档中，采用通过OBS管理控制台将数据上传至OBS桶。上传OBS的文件规范：文件名规范，不能有中文，不能有+、空格、制表符。如不需要提前上传训练数据，请创建一

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现物体检测
调优前后性能对比 - AI开发平台ModelArts

Steps/Sec 1p-GPU Ant8 16 3.17 1p-NPU snt9b 313T 16 2.17 1p-NPU snt9b 313T调优后 16 2.58 父主题：性能调优

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > Dit模型PyTorch迁移与精度性能调优 > 性能调优
服务预测失败，报错APIG.XXXX - AI开发平台ModelArts

environment”，请到在线服务详情界面，“调用指南”页签中获取正确的API接口地址。如果您在配置文件url中有定义路径，需要在API调用body体中调用路径后拼接自定义路径，例如：您定义url为“/predictions/poetry”，那么在API调用时路径为“{API接口地址}/predictions/poetry”。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
预置算法运行故障 - AI开发平台ModelArts

directory” 日志提示“UnboundLocalError: local variable 'epoch'” 使用订阅算法训练结束后没有显示模型评估结果创建训练任务并成功运行, 但是发布到至AI Gallery时, 版本那块显示状态异常使用python3.6-torch1

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业
Eagle投机小模型训练 - AI开发平台ModelArts

模型的最大长度，默认为2048 --dtype str 模型dtype，默认为bfloat16 执行完成后，记得unset环境变量，否则会导致后续推理服务启动出错。 unset EAGLE_TARIN_MODE 执行完成后，如果used_npus>1，则需要将训练生成data数据重新分配为8个文件夹，分

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 投机推理
advisor调优总体步骤 - AI开发平台ModelArts

创建performance advisor分析环境。采集完profiling后如果ModelArts训练作业已经停止，则推荐参照创建诊断任务创建cpu规格的notebook进行性能分析，节省NPU计算资源。完成分析后，可以查看生成的html文件来进行快速的调优，html文件详情请参考查看诊断报告。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于advisor的昇腾训练性能自助调优指导
代码运行故障 - AI开发平台ModelArts

如何处理使用opencv.imshow造成的内核崩溃？使用Windows下生成的文本文件时报错找不到路径？创建Notebook文件后，右上角的Kernel状态为“No Kernel”如何处理？父主题：开发环境

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境
使用ModelArts VSCode插件调试训练ResNet50图像分类模型 - AI开发平台ModelArts

保存镜像”，进入“保存镜像”页面，设置组织、镜像名称、镜像版本和描述信息后单击“确认”保存镜像。此时Notebook会冻结，需要等待几分钟。详细操作请参考保存Notebook镜像环境。图7 保存镜像查看所保存的镜像保存后的镜像可以在ModelArts控制台“镜像管理”页面查看到该镜像详情。单击镜像的名称，

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard开发环境

总条数： 1749

上一页
1
...
62
63
64
...
88
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

附录：训练常见问题 - AI开发平台ModelArts

实例故障 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

安装Gallery CLI配置工具 - AI开发平台ModelArts

MaaS使用场景和使用流程 - AI开发平台ModelArts

在ModelArts上训练模型如何配置输入输出数据？ - AI开发平台ModelArts

Eagle投机小模型训练 - AI开发平台ModelArts

Eagle投机小模型训练 - AI开发平台ModelArts

Eagle投机小模型训练 - AI开发平台ModelArts

自定义镜像训练作业配置节点间SSH免密互信 - AI开发平台ModelArts

环境配置故障 - AI开发平台ModelArts

Standard自动学习 - AI开发平台ModelArts

准备物体检测数据 - AI开发平台ModelArts

调优前后性能对比 - AI开发平台ModelArts

服务预测失败，报错APIG.XXXX - AI开发平台ModelArts

预置算法运行故障 - AI开发平台ModelArts

Eagle投机小模型训练 - AI开发平台ModelArts

advisor调优总体步骤 - AI开发平台ModelArts

代码运行故障 - AI开发平台ModelArts

使用ModelArts VSCode插件调试训练ResNet50图像分类模型 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线