搜索_华为云

如何关闭Mox的warmup - AI开发平台ModelArts

用较大的学习率会出现数值不稳定的问题，这是使用warm up的原因。等到训练过程基本稳定之后就可以使用原先设定的初始学习率进行训练。原因分析 Tensorflow分布式有多种执行模式，mox会通过4次执行50 step记录执行时间，选择执行时间最少的模型。处理方法创建训练作

 帮助中心 > AI开发平台ModelArts > 故障排除 > MoXing
ModelArts - AI开发平台ModelArts
ModelArts - AI开发平台ModelArts

None 服务介绍 ModelArts产品产品介绍 03:19 了解什么是ModelArts ModelArts自动学习视频介绍 02:59 ModelArts自动学习简介 ModelArts CodeLab 视频介绍 04:16 ModelArts CodeLab介绍 JupyterLab

帮助中心 > AI开发平台ModelArts > 视频帮助
使用MoXing复制数据报错 - AI开发平台ModelArts

timed out WARNING:root:Retry=9,Wait=0.1, Timestamp = 1567152567.5327423 原因分析当使用MoXing复制数据不成功，可能原因如下：源文件不存在。 OBS路径不正确或者是两个OBS路径不在同一个区域。训练作业空间不足。

帮助中心 > AI开发平台ModelArts > 故障排除 > MoXing
ModelArts训练作业无法解析参数，日志报错 - AI开发平台ModelArts

_exceptions.UnrecognizedFlagError:Unknown command line flag 'task_index' 原因分析运行参数中未定义该参数。在训练环境中，系统可能会传入在Python脚本里没有定义的其他参数名称，导致参数无法解析，日志报错。处理方法

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
出现ModelArts.6333错误，如何处理？ - AI开发平台ModelArts

出现ModelArts.6333错误，如何处理？问题现象在使用Notebook过程中，界面出现“ModelArts.6333”报错信息。原因分析可能由于实例过负载引起故障，Notebook正在自动恢复中，请刷新页面并等待几分钟。常见原因是内存占用满。处理方法当出现此错误时，N

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 实例故障
镜像保存时报错“The container size (xG) is greater than the threshold (25G)”如何解决？ - AI开发平台ModelArts

镜像保存时报错“The container size (30G) is greater than the threshold (25G)”，镜像创建失败。原因分析镜像保存本质是通过在资源集群节点上的agent中进行了docker commit，再配合一系列自动化操作来上传和更新管理数据等。每次Co

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 自定义镜像故障
日志提示“pandas.errors.ParserError: Error tokenizing data. C error: Expected .* fields” - AI开发平台ModelArts

errors.ParserError: Error tokenizing data. C error: Expected 4 field 原因分析 csv中文件的每一行的列数不相等。处理方法可以使用以下方法处理：校验csv文件，将多出字段的行删除。在代码中忽略错误行，参考如下：

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
报错“Connection permission denied (publickey)”如何解决 - AI开发平台ModelArts

You can view the instance keypair information on ModelArts console.” 原因分析可能是密钥文件或放置密钥的文件夹权限问题，密钥不正确等，请按以下步骤排查。解决方案排查/home/ma-user权限，建议将该目录权

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
为什么在ModelArts数据标注平台标注数据提示标注保存失败？ - AI开发平台ModelArts

浏览器Console，单击network查看请求列表，请求状态显示为(failed)net::ERR_ADDRESS_IN_USE。原因分析可能是用户本地网络的原因，网速不稳定或者网络配置有问题，均可能导致保存失败。解决方案 1. 切换为稳定的网络后重试。 2. 初始化网络

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据管理
作为调用发起方的客户端无法访问已经获取到的推理请求地址 - AI开发平台ModelArts

已经通过调用指南页面的信息获取到调用的server端地址，但是调用发起方的客户端访问该地址不通，出现无法连接、域名无法解析的现象。原因分析在调用指南页签中显示的调用地址都是华为云APIG（API网关服务）的地址。调用发起方的客户端和华为云网络不通。处理方法如果客户端位于

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 在线服务
动态挂载OBS并行文件系统成功，但是在Notebook的JupyterLab中无法看到本地挂载点 - AI开发平台ModelArts

demo-yf/，实际在JupyterLab左侧导航看不到此目录。图1 本地挂载目录图2 Notebook的JupyterLab 原因分析本地挂载目录是在Notebook容器的“~/data”目录下创建的demo-yf文件夹，而JupyterLab左侧导航默认路径为“~/w

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 文件上传下载
创建模型失败，提示模型镜像构建任务超时，没有构建日志 - AI开发平台ModelArts

创建模型失败，构建日志提示超时“Model image build task timed out”，没有详细构建日志。图1 模型镜像构建任务超时原因分析 imagePacker构建镜像有超时时间限制，默认值为30min（各区域可能存在差异）。当模型镜像构建时间太长，构建日志最后未能完成构建

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
Pytorch Mox日志反复输出 - AI开发平台ModelArts

INFO:root:Using MoXing-v1.13.0-de803ac9 INFO:root:Using OBS-Python-SDK-3.1.2 原因分析 Pytorch通过spawn模式创建了多个进程，每个进程会调用多进程方式使用Mox下载数据。此时子进程会不断销毁重建，Mox也就会不断的被导入，导致打印很多Mox的版本信息。

帮助中心 > AI开发平台ModelArts > 故障排除 > MoXing
MXNet创建kvstore时程序被阻塞，无报错 - AI开发平台ModelArts

print('start') kv_store = mxnet.kv.create('dist_async') print('end') 原因分析 worker阻塞的原因可能是连不上server。处理方法将如下代码放在“启动文件”里“import mxnet”之前可以看到节点间相互通信状态，同时ps能够重新发送。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
日志提示“CUDNN_STATUS_NOT_SUPPORTED. ” - AI开发平台ModelArts

ED. This error may appear if you passed in a non-contiguous input. 原因分析出现该问题的可能原因如下：数据输入不连续，cuDNN不支持的类型。处理方法禁用cuDNN，在训练前加入如下代码。 torch.backends

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
团队成员查询团队标注任务列表 - AI开发平台ModelArts

accepted_sample_count Integer owner验收通过样本数目。 auto_annotation_sample_count Integer 智能标注待确认样本数目。 deleted_sample_count Integer 已删除的样本数目。 rejected_sample_count

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
远程连接处于retry状态如何解决？ - AI开发平台ModelArts

远程连接处于retry状态如何解决？问题现象原因分析之前下载VS Code server失败，有残留信息，导致本次无法下载。解决方法方法一（本地）：打开命令面板（Windows： Ctrl+Shift+P，macOS：Cmd+Shift+P），搜索“Kill VS Code

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > VS Code连接开发环境失败常见问题
PyTorch1.0引擎提示“RuntimeError: std:exception” - AI开发平台ModelArts

std:exception” 问题现象在使用PyTorch1.0镜像时，必现如下报错： “RuntimeError: std:exception” 原因分析 PyTorch1.0镜像中的libmkldnn软连接与原生torch的冲突，具体可参看文档。处理方法按照issues中的说明，应该是

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
远程连接处于retry状态如何解决？ - AI开发平台ModelArts

远程连接处于retry状态如何解决？问题现象原因分析之前下载VS Code server失败，有残留信息，导致本次无法下载。解决方法方法一（本地）：打开命令面板（Windows： Ctrl+Shift+P，macOS：Cmd+Shift+P），搜索“Kill VS Code

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
创建Workflow服务部署节点 - AI开发平台ModelArts

batch为批量服务，批量服务可对批量数据进行推理，完成数据处理后自动停止。 edge表示边缘服务，通过华为云智能边缘平台，在边缘节点将模型部署为一个Web Service，需提前在IEF（智能边缘服务）创建好节点。是 str service_name 服务名称，支持1-64位可见字符（含

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点

总条数： 405

上一页
1
...
13
14
15
...
21
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

如何关闭Mox的warmup - AI开发平台ModelArts

ModelArts - AI开发平台ModelArts

使用MoXing复制数据报错 - AI开发平台ModelArts

ModelArts训练作业无法解析参数，日志报错 - AI开发平台ModelArts

出现ModelArts.6333错误，如何处理？ - AI开发平台ModelArts

镜像保存时报错“The container size (xG) is greater than the threshold (25G)”如何解决？ - AI开发平台ModelArts

日志提示“pandas.errors.ParserError: Error tokenizing data. C error: Expected .* fields” - AI开发平台ModelArts

报错“Connection permission denied (publickey)”如何解决 - AI开发平台ModelArts

为什么在ModelArts数据标注平台标注数据提示标注保存失败？ - AI开发平台ModelArts

作为调用发起方的客户端无法访问已经获取到的推理请求地址 - AI开发平台ModelArts

动态挂载OBS并行文件系统成功，但是在Notebook的JupyterLab中无法看到本地挂载点 - AI开发平台ModelArts

创建模型失败，提示模型镜像构建任务超时，没有构建日志 - AI开发平台ModelArts

Pytorch Mox日志反复输出 - AI开发平台ModelArts

MXNet创建kvstore时程序被阻塞，无报错 - AI开发平台ModelArts

日志提示“CUDNN_STATUS_NOT_SUPPORTED. ” - AI开发平台ModelArts

团队成员查询团队标注任务列表 - AI开发平台ModelArts

远程连接处于retry状态如何解决？ - AI开发平台ModelArts

PyTorch1.0引擎提示“RuntimeError: std:exception” - AI开发平台ModelArts

远程连接处于retry状态如何解决？ - AI开发平台ModelArts

创建Workflow服务部署节点 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线