搜索_华为云

如何将本地标注的数据导入ModelArts？ - AI开发平台ModelArts

ModelArts支持通过导入数据集的操作，导入更多数据。本地标注的数据，当前支持从OBS目录导入或从Manifest文件导入两种方式。导入之后您还可以在ModelArts数据管理模块中对数据进行重新标注或修改标注情况。从OBS目录导入或从Manifest详细操作指导和规范说明请参见导入数据。父主题：

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据准备
创建Standard专属资源池 - AI开发平台ModelArts

前提条件已经创建虚拟私有云。已经创建子网。步骤一：创建网络 ModelArts网络是承载ModelArts资源池节点的网络连接，基于华为云的VPC进行封装，对用户仅提供网络名称以及CIDR网段的选择项。为了防止在打通VPC的时候有网段的冲突，ModelArts网络提供了多个C

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理
系统容器异常退出 - AI开发平台ModelArts

系统容器异常退出问题现象在训练创建后出现“系统容器异常退出”的故障。 [ModelArts Service Log]2022-10-11 19:18:23,267 - file_io.py[1ine:748] - ERROR: stat:404 errorCode:NoSuchKey

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
Manifest管理概述 - AI开发平台ModelArts

各个使用场景，同时兼顾数据集管理的灵活性，本文档描述数据集管理的接口和描述规范——Manifest文件。 Manifest文件中定义了标注对象和标注内容的对应关系。Manifest文件中也可以只有原始文件信息，没有标注信息，如生成的未标注的数据集。 Manifest文件使用UTF

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > Manifest管理
下载代码目录失败 - AI开发平台ModelArts

下载代码目录失败问题现象训练作业运行时下载失败，出现如下报错，请参见图1： ERROR：modelarts-downloader.py: Get object key failed: 'Contents' 图1 获取内容失败原因分析在创建训练作业时指定的代码目录不存在导致训练失败。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
查看ModelArts模型事件 - AI开发平台ModelArts

系统升级中，请稍后重试。 System is upgrading, please try again later. - 异常获取源镜像失败。认证错误，token已失效。 Failed to access source image. Authenticate Error, token

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理ModelArts模型
创建ModelArts数据校验任务 - AI开发平台ModelArts

设置输入与输出。需根据实际数据情况选择“数据集”或“OBS目录”。设置为“数据集”时，需填写“数据集名称”和“数据集版本”；设置为“OBS目录”时，需填写正确的OBS路径。图3 输入输出设置-数据集图4 输入输出设置-OBS目录确认参数填写无误后，单击“创建”，完成数据处理任务的创建。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 处理ModelArts数据集中的数据
创建ModelArts数据选择任务 - AI开发平台ModelArts

设置输入与输出。需根据实际数据情况选择“数据集”或“OBS目录”。设置为“数据集”时，需填写“数据集名称”和“数据集版本”；设置为“OBS目录”时，需填写正确的OBS路径。图2 输入输出设置-数据集图3 输入输出设置-OBS目录确认参数填写无误后，单击“创建”，完成数据处理任务的创建。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 处理ModelArts数据集中的数据
查询训练日志 - AI开发平台ModelArts

方式二：根据创建训练作业生成的训练作业对象查询。 log = job_instance.get_job_log(task_id="worker-0") print(log) 参数说明表1 Estimator初始化参数说明参数是否必选参数类型描述 session 是 Object 会话对象，初始化方法请参考Session鉴权。

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
使用VS Code连接实例时，发现VS Code端的实例目录和云上目录不匹配 - AI开发平台ModelArts

使用VS Code连接实例时，发现VS Code端的实例目录和云上目录不匹配问题现象用户使用VS Code连接实例时，发现VS Code端的实例目录和云上目录不匹配。原因分析实例连接错误，可能是配置文件写的不规范导致连接到别的实例。解决方案检查用户.ssh配置文件（路

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
使用AOM查看Lite Cluster监控指标 - AI开发平台ModelArts

该指标用于统计测量对象的CPU使用率。百分比（Percent） 0～100% 连续2个周期原始值 > 95% 建议排查是否符合业务资源使用预期，如果业务无问题，无需处理。 CPU内核占用量 ma_container_cpu_used_core 该指标用于统计测量对象已经使用的CPU核个数

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理 > 监控Lite Cluster资源
训练作业日志中提示“No module named .*” - AI开发平台ModelArts

训练作业日志中提示“No module named .*” 用户请按照以下思路进行逐步排查：检查依赖包是否存在检查依赖包路径是否能被识别检查训练作业使用的资源规格是否正确建议与总结检查依赖包是否存在如果依赖包不存在，您可以使用以下两种方式完成依赖包的安装。方式一（推

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
PD分离部署手动配比调优（推荐） - AI开发平台ModelArts

PD分离部署手动配比调优（推荐）配比调优理论分析 PD分离部署性能对比对象为相同实例个数、实例使用相同卡数、相同SLO要求下的PD混推性能。 PD性能测评脚本与绘图工具请参考PD分离性能调优工具使用说明章节。样例场景如下：模型qwen2.5 32B输入1024、输出512、SLO为2s

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.5.901） > 推理关键特性使用 > 分离部署
自定义模型规范 - AI开发平台ModelArts

模型被称为自定义模型。但是托管的自定义模型要满足规范才支持使用AI Gallery工具链服务（微调大师、在线推理服务）。自定义模型的使用流程托管模型到AI Gallery。模型基础设置里的“任务类型”选择除“文本问答”和“文本生成”之外的类型。上传模型文件时需要确认待上传

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型 > 构建模型
训练输出路径被其他作业使用 - AI开发平台ModelArts

训练输出路径被其他作业使用问题现象在创建训练作业时出现如下报错：操作失败！Other running job contain train_url: /bucket-20181114/code_hxm/ 原因分析根据报错信息判断，在创建训练作业时，同一个“训练输出路径”在被其他作业使用。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
在推理生产环境中部署推理服务 - AI开发平台ModelArts

扩展它的大小。 --image-input-type：图像输入模式，pixel_values and image_features; 当前流程以pixel_values为例。具体使用方式见vllm官网。 --image-token-id：LLM模型图像输入占位input id，llava-1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
创建训练作业提示错误码ModelArts.2763 - AI开发平台ModelArts

创建训练作业提示错误码ModelArts.2763 问题现象创建训练作业时，提示ModelArts.2763 : 选择的支持实例无效，请检查请求中信息的合法性。原因分析用户选择的训练规格资源和算法不匹配。例如：算法支持的是GPU规格，创建训练作业时选择了ASCEND规格的资源类型。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
PyTorch1.0引擎提示“RuntimeError: std:exception” - AI开发平台ModelArts

PyTorch1.0引擎提示“RuntimeError: std:exception” 问题现象在使用PyTorch1.0镜像时，必现如下报错： “RuntimeError: std:exception” 原因分析 PyTorch1.0镜像中的libmkldnn软连接与原生torch的冲突，具体可参看文档。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
ModelArts训练作业无法解析参数，日志报错 - AI开发平台ModelArts

ModelArts训练作业无法解析参数，日志报错问题现象 ModelArts训练作业无法解析参数，遇到如下报错，导致无法正常运行： error: unrecognized arguments: --data_url=xxx://xxx/xxx error: unrecognized

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
训练过程中无法找到so文件 - AI开发平台ModelArts

训练过程中无法找到so文件问题现象 ModelArts训练作业运行时，日志中遇到如下报错，导致训练失败： libcudart.so.9.0 cannot open shared object file no such file or directory 原因分析编译生成s

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障

总条数： 1657

上一页
1
...
71
72
73
...
83
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

如何将本地标注的数据导入ModelArts？ - AI开发平台ModelArts

创建Standard专属资源池 - AI开发平台ModelArts

系统容器异常退出 - AI开发平台ModelArts

Manifest管理概述 - AI开发平台ModelArts

下载代码目录失败 - AI开发平台ModelArts

查看ModelArts模型事件 - AI开发平台ModelArts

创建ModelArts数据校验任务 - AI开发平台ModelArts

创建ModelArts数据选择任务 - AI开发平台ModelArts

查询训练日志 - AI开发平台ModelArts

使用VS Code连接实例时，发现VS Code端的实例目录和云上目录不匹配 - AI开发平台ModelArts

使用AOM查看Lite Cluster监控指标 - AI开发平台ModelArts

训练作业日志中提示“No module named .*” - AI开发平台ModelArts

PD分离部署手动配比调优（推荐） - AI开发平台ModelArts

自定义模型规范 - AI开发平台ModelArts

训练输出路径被其他作业使用 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

创建训练作业提示错误码ModelArts.2763 - AI开发平台ModelArts

PyTorch1.0引擎提示“RuntimeError: std:exception” - AI开发平台ModelArts

ModelArts训练作业无法解析参数，日志报错 - AI开发平台ModelArts

训练过程中无法找到so文件 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线