搜索_华为云

调优数据集异常日志说明 - AI开发平台ModelArts

locate the specific problem.”，您可以参照下表对日志进行定位。表1 数据集格式异常控制台选择格式（预期格式）实际格式关键日志 MOSS Alpaca KeyError: 'chat' ShareGPT KeyError: 'chat' Alpaca

帮助中心 > AI开发平台ModelArts > 常见问题 > Studio
监控Lite Cluster资源 - AI开发平台ModelArts

监控Lite Cluster资源使用AOM查看Lite Cluster监控指标使用Prometheus查看Lite Cluster监控指标父主题： Lite Cluster资源管理

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
在Windows上安装配置Grafana - AI开发平台ModelArts

在Windows上安装配置Grafana 适用场景本章节适用于在Windows操作系统的PC中安装配置Grafana。操作步骤下载Grafana安装包。进入下载链接，单击Download the installer，等待下载成功即可。安装Grafana。双击安装包，按照指示流程安装完成即可。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控 > 使用Grafana查看AOM中的监控指标 > 安装配置Grafana
训练作业使用MoXing复制数据较慢，重复打印日志 - AI开发平台ModelArts

由于环境或网络问题，读OBS时遇到读取数据失败情况，从而导致整个作业失败。重复打印日志，该日志表示正在读取远端存在的文件，当文件列表读取完成以后，开始下载数据。如果文件比较多，那么该过程会消耗较长时间。处理方法在创建训练作业时，数据可以保存到OBS上。不建议使用Tens

帮助中心 > AI开发平台ModelArts > 故障排除 > MoXing
监控Lite Server资源 - AI开发平台ModelArts

监控Lite Server资源使用CES监控Lite Server资源使用DCGM监控Lite Server资源父主题： Lite Server资源管理

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理
日志提示Compile graph failed - AI开发平台ModelArts

日志提示Compile graph failed 问题现象日志提示：Compile graph failed。图1 报错提示原因分析模型转换时未指定Ascend后端。处理方法需要在模型转换阶段指定“--device=Ascend”。父主题：常见问题

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导 > 常见问题
查询训练作业指定任务的日志（OBS链接） - AI开发平台ModelArts

参数类型描述 obs_url String 日志OBS临时链接（复制到浏览器可查看当前全量日志）。请求示例如下以查询uuid为2cd88daa-31a4-40a8-a58f-d186b0e93e4f的训练作业对应work-0日志OBS临时链接为例。 GET https://

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
日志提示“no socket interface found” - AI开发平台ModelArts

日志提示“no socket interface found” 问题现象在pytorch镜像运行分布式作业时，设置NCCL日志级别，代码如下： import os os.environ["NCCL_DEBUG"] = "INFO" 会出现如下错误： job0879f61e-jo

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
日志提示“ValueError: label - AI开发平台ModelArts

日志提示“ValueError: label_map not match” 问题现象日志提示“ValueError: label_map not match”，且打印出标签数据，如： ValueError: label_map not match. {1:'apple', 2:'orange'

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 预置算法运行故障
用户创建模型时构建镜像或导入文件失败 - AI开发平台ModelArts

用户创建模型时构建镜像或导入文件失败问题现象用户创建模型时，构建镜像失败，失败日志中提示下载obs文件失败（Get object size from OBS failed！）。图1 下载obs文件失败用户创建模型时，事件提示：复制模型文件失败，请检查OBS权限是否正常（Failed

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
日志提示“errorMessage:The specified key does not exist” - AI开发平台ModelArts

日志提示“errorMessage:The specified key does not exist” 问题现象在用moxing访问OBS路径时，出现如下错误： ERROR:root: stat:404 errorCode:NoSuchKey errorMessage:The specified

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
创建模型失败，提示模型镜像构建任务超时，没有构建日志 - AI开发平台ModelArts

创建模型失败，提示模型镜像构建任务超时，没有构建日志问题现象创建模型失败，构建日志提示超时“Model image build task timed out”，没有详细构建日志。图1 模型镜像构建任务超时原因分析 imagePacker构建镜像有超时时间限制，默认值为30

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
查询训练作业指定任务的日志（预览） - AI开发平台ModelArts

状态码：200 表2 响应Body参数参数参数类型描述 content String 日志内容。如果日志大小没有超过上限（n兆）则返回全部内容，如果日志超过了上限（n兆）则返回最新的n兆的日志。2022/03/01 00:00:00 (GMT+08:00)后，此参数名称由“context”改为“content”。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
日志提示“Out of bounds nanosecond timestamp” - AI开发平台ModelArts

日志提示“Out of bounds nanosecond timestamp” 问题现象在使用pandas.to_datetime转换时间时，出现如下报错： pandas._libs.tslibs.np_datetime.OutOfBoundsDatetime: Out of

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
日志提示“CUDNN_STATUS_NOT_SUPPORTED. ” - AI开发平台ModelArts

日志提示“CUDNN_STATUS_NOT_SUPPORTED. ” 问题现象在pytorch训练时，出现如下报错： RuntimeError: cuDNN error: CUDNN_STATUS_NOT_SUPPORTED. This error may appear if you

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
训练作业日志中提示“No module named .*” - AI开发平台ModelArts

txt”的文件，并且在文件中指定此whl包的包名。依赖包必须为“.whl”格式的文件。例如，“代码目录”对应的OBS路径下，包含模型文件、whl包，同时还存在“pip-requirements.txt”文件。“代码目录”的结构如下所示： |---模型启动文件所在OBS文件夹

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
日志提示“pandas.errors.ParserError: Error tokenizing data. C error: Expected .* fields” - AI开发平台ModelArts

日志提示“pandas.errors.ParserError: Error tokenizing data. C error: Expected .* fields” 问题现象使用pandas读取csv数据表时，日志报出如下错误导致训练作业失败： pandas.errors.ParserError:

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
ascendfactory-cli方式启动（推荐） - AI开发平台ModelArts

工具启动训练的方式。此方式训练完成后json日志或打屏日志直接打印性能结果，免于计算，方便用户验证发布模型的质量。并且新的训练方式将统一管理训练日志、训练结果和训练配置，使用yaml配置文件方便用户根据自己实际需求进行修改。权重文件支持以下组合方式，用户根据自己实际要求选择：训练stage

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 执行训练任务
在云监控平台查看在线服务性能指标 - AI开发平台ModelArts

在左侧导航栏，选择“云服务监控 > ModelArts”。查看监控图表。查看在线服务监控图表：单击目标在线服务“操作”列的“查看监控指标”。查看模型负载监控图标：单击目标在线服务左侧的，在下拉列表中选择模型负载“操作”列的“查看监控指标”。在监控区域，您可以通过选择时长，查看对应时间的监控数据。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
文件传输（推荐） - AI开发平台ModelArts

文件传输（推荐）该接口支持上传本地文件和文件夹至OBS，支持下载OBS文件和文件夹至本地，推荐使用该接口。示例代码在ModelArts Notebook平台，Session鉴权无需输入鉴权参数。其它平台的Session鉴权请参见Session鉴权。 from modelarts

帮助中心 > AI开发平台ModelArts > SDK参考 > OBS管理

总条数： 1625

上一页
1
...
4
5
6
...
82
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

调优数据集异常日志说明 - AI开发平台ModelArts

监控Lite Cluster资源 - AI开发平台ModelArts

在Windows上安装配置Grafana - AI开发平台ModelArts

训练作业使用MoXing复制数据较慢，重复打印日志 - AI开发平台ModelArts

监控Lite Server资源 - AI开发平台ModelArts

日志提示Compile graph failed - AI开发平台ModelArts

查询训练作业指定任务的日志（OBS链接） - AI开发平台ModelArts

日志提示“no socket interface found” - AI开发平台ModelArts

日志提示“ValueError: label - AI开发平台ModelArts

用户创建模型时构建镜像或导入文件失败 - AI开发平台ModelArts

日志提示“errorMessage:The specified key does not exist” - AI开发平台ModelArts

创建模型失败，提示模型镜像构建任务超时，没有构建日志 - AI开发平台ModelArts

查询训练作业指定任务的日志（预览） - AI开发平台ModelArts

日志提示“Out of bounds nanosecond timestamp” - AI开发平台ModelArts

日志提示“CUDNN_STATUS_NOT_SUPPORTED. ” - AI开发平台ModelArts

训练作业日志中提示“No module named .*” - AI开发平台ModelArts

日志提示“pandas.errors.ParserError: Error tokenizing data. C error: Expected .* fields” - AI开发平台ModelArts

ascendfactory-cli方式启动（推荐） - AI开发平台ModelArts

在云监控平台查看在线服务性能指标 - AI开发平台ModelArts

文件传输（推荐） - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线