搜索_华为云

执行训练任务【新】 - AI开发平台ModelArts

存储位置：输入用户的“子目录挂载”路径。如果默认没有填写，则忽略。图6 选择SFS Turbo 作业日志选择OBS中的路径，ModelArts的训练作业的日志信息则保存该路径下。最后，请参考查看日志和性能章节查看LoRA微调的日志和性能。了解更多ModelArts训练功能，可查看模型开发简介。父主题：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
GPU裸金属服务器无法Ping通如何解决 - AI开发平台ModelArts

在当前安全组的入方向规则中添加一条规则，基本协议选择ICMP协议，详细配置如下表所示，添加规则步骤请参考添加安全组规则。表1 入方向规则方向协议/应用端口源地址入方向 ICMP 全部 0.0.0.0/0 华为云安全组支持的协议参考可参考下表。表2 入方向规则协议端口说明协议端口说明

 帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
使用PyCharm ToolKit创建并调试训练作业 - AI开发平台ModelArts

持的引擎列表请参见ModelArts支持的预置镜像列表。如果您使用的AI引擎为支持列表之外的，建议使用自定义镜像的方式创建训练作业。 AI Engine 选择代码使用的AI引擎及其版本。支持的AI引擎与ModelArts管理控制台里ModelArts支持的预置镜像列表一致。 Boot

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 创建调试训练作业
依赖和委托 - AI开发平台ModelArts

cl（设置对象ACL）从OBS导入模型模型转换指定OBS路径表8 管理部署上线业务场景依赖的服务依赖策略项支持的功能在线服务 LTS lts:logs:list（查询日志列表）查询和展示LTS日志。 OBS obs:bucket:GetBucketPolicy （获取桶策略）

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 权限控制方式
OOM导致训练作业失败 - AI开发平台ModelArts

outputs of training job 日志中有报错，含有“killed”相关字段，例如： RuntimeError: DataLoader worker (pid 38077) is killed by signal: Killed. 日志中有报错“RuntimeError: CUDA

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
OBS复制过程中提示“BrokenPipeError: Broken pipe” - AI开发平台ModelArts

OBS复制过程中提示“BrokenPipeError: Broken pipe” 问题现象训练作业在使用MoXing复制数据时，日志中出现报错“BrokenPipeError: [Errno xx] Broken pipe”。原因分析出现该问题的可能原因如下：在大规模分布

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
查询数据集导出任务列表 - AI开发平台ModelArts

Array<String>> 标签属性，是Object格式，存放任意的键值对；key是属性名称，value是取值列表，如value为null表示不根据值搜索，否则搜索的值满足列表中任意一个即可。 type Integer 标签类型。可选值如下： 0：图像分类 1：物体检测 3: 图像分割

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询数据处理任务的版本列表 - AI开发平台ModelArts

无响应参数状态码： 200 表3 响应Body参数参数参数类型描述 count Integer 版本总数。 versions Array of DescTaskVersionResp objects 分页查询到的数据处理任务版本列表。表4 DescTaskVersionResp

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询数据集的标注任务列表 - AI开发平台ModelArts

查询数据集的标注任务列表查询当前数据集的所有标注任务列表。 dataset.get_label_tasks(is_workforce_task=False, **kwargs) 示例代码示例一：查询数据集下所有的标注任务，根据标注任务创建时间降序排序。 from modelarts

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > 标注任务管理
创建训练任务，显示创建失败 - AI开发平台ModelArts

5-7B、Qwen2.5-14B、Qwen2.5-32B、Qwen2.5-72B-1K或者Qwen2-VL-7B模型，创建训练任务失败。关键日志报错（出现以下任意报错）：报错1： [INFO|trainer.py:2278] 2025-01-09 20:49:47,170 >>

帮助中心 > AI开发平台ModelArts > 常见问题 > Studio
保存模型时出现Unable to connect to endpoint错误 - AI开发平台ModelArts

保存模型时出现Unable to connect to endpoint错误问题现象训练作业保存模型时日志报错，具体信息如下： InternalError (see above for traceback): : Unable to connect to endpoint 原因分析

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
查询标注团队的成员列表 - AI开发平台ModelArts

请求参数无响应参数状态码： 200 表3 响应Body参数参数参数类型描述 total_number Integer 标注团队成员总数。 workers Array of Worker objects 分页查询到的标注团队成员列表。表4 Worker 参数参数类型描述

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
使用PyCharm Toolkit插件连接Notebook - AI开发平台ModelArts

像本地运行代码一样，直接单击运行按钮运行代码即可，此时虽然是在本地IDE点的运行按钮，实际上运行的是云端Notebook里的代码，日志可以回显在本地的日志窗口。图10 查看运行日志也可以单击本地IDE右上角的Run/Debug Configuration按钮来设置运行参数。图11 设置运行参数（1）

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过PyCharm远程使用Notebook实例
查询训练作业列表 - AI开发平台ModelArts

objects 搜索算法配置。表16 reward_attrs 参数参数类型描述 name String 指标名称。 mode String 搜索方向。 max指定时表示指标值越大越好； min指定时表示指标值越小越好。 regex String 指标正则表达式。表17 search_params

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
部署在线服务出现报错No CUDA runtime is found - AI开发平台ModelArts

部署在线服务出现报错No CUDA runtime is found，using CUDA_HOME='/usr/local/cuda'。原因分析从日志报错信息No CUDA runtime is found分析，是cuda runtime没有找到。处理方法建议您按以下步骤排查处理：

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
查看在线服务详情 - AI开发平台ModelArts

的次数上限。运行日志输出默认关闭，在线服务的运行日志仅存放在ModelArts日志系统。启用运行日志输出后，在线服务的运行日志会输出存放到云日志服务LTS。LTS自动创建日志组和日志流，默认缓存7天内的运行日志。如需了解LTS专业日志管理功能，请参见云日志服务。说明： “运行日志输出”开启后，不支持关闭。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
推理专属预置镜像列表 - AI开发平台ModelArts

推理专属预置镜像列表 ModelArts的推理平台提供了一系列的基础镜像，用户可以基于这些基础镜像构建自定义镜像，用于部署推理服务。 X86架构（CPU/GPU）的推理基础镜像表1 TensorFlow AI引擎版本支持的运行环境镜像名称 URI 2.1.0 CPU GPU(cuda10

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > ModelArts支持的预置镜像列表
查询服务列表 - AI开发平台ModelArts

查询服务列表功能介绍查询模型服务列表。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v1/{project_id}/services 表1 路径参数

 帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
Standard模型训练 - AI开发平台ModelArts

理多个训练作业，方便用户选择最优的模型提供训练作业的事件信息（训练作业生命周期中的关键事件点）、训练日志（训练作业运行过程和异常信息）、资源监控（资源使用率数据）、Cloud Shell（登录训练容器的工具）等能力，方便用户更清楚得了解训练作业运行过程，并在遇到任务异常时更加准确的排查定位问题

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
使用预置AI算法部署在线服务报错gunicorn：error：unrecorgized arguments - AI开发平台ModelArts

使用预置AI算法部署在线服务报错gunicorn：error：unrecorgized arguments... 图1 在线服务报错原因分析根据报错日志分析，模型目录下存在多余文件“/home/mind/model/v0432/cdn_short.pt”。处理方法在模型目录中删除“/h

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署

总条数： 1332

上一页
1
...
7
8
9
...
67
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

执行训练任务【新】 - AI开发平台ModelArts

GPU裸金属服务器无法Ping通如何解决 - AI开发平台ModelArts

使用PyCharm ToolKit创建并调试训练作业 - AI开发平台ModelArts

依赖和委托 - AI开发平台ModelArts

OOM导致训练作业失败 - AI开发平台ModelArts

OBS复制过程中提示“BrokenPipeError: Broken pipe” - AI开发平台ModelArts

查询数据集导出任务列表 - AI开发平台ModelArts

查询数据处理任务的版本列表 - AI开发平台ModelArts

查询数据集的标注任务列表 - AI开发平台ModelArts

创建训练任务，显示创建失败 - AI开发平台ModelArts

保存模型时出现Unable to connect to endpoint错误 - AI开发平台ModelArts

查询标注团队的成员列表 - AI开发平台ModelArts

使用PyCharm Toolkit插件连接Notebook - AI开发平台ModelArts

查询训练作业列表 - AI开发平台ModelArts

部署在线服务出现报错No CUDA runtime is found - AI开发平台ModelArts

查看在线服务详情 - AI开发平台ModelArts

推理专属预置镜像列表 - AI开发平台ModelArts

查询服务列表 - AI开发平台ModelArts

Standard模型训练 - AI开发平台ModelArts

使用预置AI算法部署在线服务报错gunicorn：error：unrecorgized arguments - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线