搜索_华为云

使用pip install提示Read timed out - AI开发平台ModelArts

在Notebook实例中，使用pip install时，提示“ReadTimeoutError...”或者“Read timed out...”的错误。解决办法建议先尝试使用pip install --upgrade pip，再使用pip install。父主题： Notebook实例常见错误

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > Notebook实例常见错误
yaml配置文件参数配置说明 - AI开发平台ModelArts

则不会进行模型训练。 cutoff_len 4096 文本处理时的最大长度，此处为4096，用户可根据自己要求适配。 packing true 可选项。当选用静态数据长度时，可将不足于文本处理时的最大长度数据弥补到文本处理时的最大长度;当选用动态数据长度则去掉此参数。 deepspeed

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907） > 训练脚本说明
运行训练作业时提示URL连接超时 - AI开发平台ModelArts

error [Errno 110] Connection timed out> 原因分析由于安全性问题在ModelArts上不能联网下载。处理方法如果在运行训练作业时提示连接超时，请您将需要联网下载的数据提前下载至本地，并上传至OBS中。父主题：外网访问限制

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 外网访问限制
日志提示“ValueError: label - AI开发平台ModelArts

3:'banana'} 原因分析训练集中的标签个数与验证集中的个数不一致，导致该错误发生。例如，训练集中的标签共有4个，验证集中的标签只有3个。处理方法请您保持数据中训练集和验证集的标签数量一致。父主题：预置算法运行故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 预置算法运行故障
Yaml配置文件参数配置说明 - AI开发平台ModelArts

则不会进行模型训练。 cutoff_len 4096 文本处理时的最大长度，此处为4096，用户可根据自己要求适配。 packing true 可选项。当选用静态数据长度时，可将不足于文本处理时的最大长度数据弥补到文本处理时的最大长度;当选用动态数据长度则去掉此参数。 deepspeed

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 训练脚本说明
创建训练作业提示错误码ModelArts.2763 - AI开发平台ModelArts

选择的支持实例无效，请检查请求中信息的合法性。原因分析用户选择的训练规格资源和算法不匹配。例如：算法支持的是GPU规格，创建训练作业时选择了ASCEND规格的资源类型。处理方法查看算法代码中设置的训练资源规格。检查创建训练作业时所选的资源规格是否正确，重新创建训练作业选择正确的资源规格。父主题：云上迁移适配故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
安装ModelArts SDK报错“ERROR: Could not install packages due to an OSError” - AI开发平台ModelArts

'c:\python39\Scripts\ephemeral-port-reserve.exe.deleteme ”。原因分析用户使用权限问题导致。处理方法用户电脑切换到管理员角色，键盘快捷键（Windows+R模式）并输入cmd，进入黑色窗口，执行如下命令： python -m pip

帮助中心 > AI开发平台ModelArts > 故障排除 > API/SDK
日志提示“No module name 'unidecode'” - AI开发平台ModelArts

requirements.txt的Unidecode名字写错了，应该把U改成小写，所以导致训练作业的环境没有装上unidecode模块。处理方法将requirements.txt中的Unidecode改为unidecode。建议与总结您可以在训练代码里添加一行： os.system('pip

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
功能咨询 - AI开发平台ModelArts
功能咨询 - AI开发平台ModelArts

为什么选择不了Ascend Snt3资源？线上训练得到的模型是否支持离线部署在本地？服务预测请求体大小限制是多少？在线服务部署是否支持包周期？部署服务如何选择计算节点规格？部署GPU服务支持的Cuda版本是多少？父主题：部署上线

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线
服务启动后，状态断断续续处于“告警中” - AI开发平台ModelArts

is able to process the new request 原因分析该报错是因为发送预测请求后，服务出现停止后又启动的情况。处理方法需要您检查服务使用的镜像，确定服务停止的原因，修复问题。重新创建模型部署服务。父主题：服务部署

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
时序预测-time_series_v2算法部署在线服务预测报错 - AI开发平台ModelArts

当预测的数据行数小于window超参值时，日志中有报错信息：ERROR: data is shorter than windows 。处理方法增加预测数据行数大于训练作业window超参值。重建训练作业，修改window超参值。父主题：服务预测

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
专属资源池关联SFS Turbo显示异常 - AI开发平台ModelArts

Turbo按钮置灰不可操作。图3 关联SFS Turbo状态原因分析 ModelArts缺少SFS Turbo委托权限导致关联或解除关联失败。处理方法需要您给ModelArts配置SFS Turbo委托权限，配置步骤请参考最佳实践的“委托授权ModelArts云服务使用SFS Turbo”章节。

帮助中心 > AI开发平台ModelArts > 故障排除 > 资源池
日志提示“root: XXX valid number is 0” - AI开发平台ModelArts

该日志表示数据集中的有效样本量为0，可能有如下原因：数据未标注。标注的数据是不符合规格的（如目标检测算法要求标注为矩形框，但是提供数据标注为非矩形框）。处理方法请您检查数据是否已标注，或检查数据标注是否符合算法要求。父主题：预置算法运行故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 预置算法运行故障
日志提示“ValueError: Invalid endpoint: obs.xxxx.com” - AI开发平台ModelArts

endpoint: obs. xxxx.com”。原因分析出现该问题的可能原因：直接在OBS上写tensorboard文件，存在不稳定的风险。处理方法建议先将Tensorboard文件写到本地，然后再复制回OBS。建议与总结在创建训练作业前，推荐您先使用ModelArts开发环

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
订阅算法物体检测YOLOv3 - AI开发平台ModelArts

该报错信息表示验证集中有label在训练集中不存在，可能由于在发布数据集版本进行数据切分时，训练集比例填写为0导致发布的数据全部为验证集，所以出现上述报错。处理方法重新发布数据，切分比例为0.8 或者0.9重新创建训练作业进行训练。父主题：训练作业运行失败

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败
训练作业性能降低 - AI开发平台ModelArts

使用ModelArts平台训练算法训练耗时增加。原因分析可能存在如下原因：平台上的代码经过修改优化、训练参数有过变更。训练的GPU硬件工作出现异常。处理方法请您对作业代码进行排查分析，确认是否对训练代码和参数进行过修改。检查资源分配情况（cpu/mem/gpu/snt9/infiniband）是否符合预期。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业性能问题
创建训练作业界面无云存储名称和挂载路径排查思路 - AI开发平台ModelArts

问题现象创建训练作业界面没有云存储名称和挂载路径这两个选项。原因分析用户的专属资源池没有进行网络打通，或者用户没有创建过SFS。处理方法在专属资源池列表中，单击资源池“ID/名称”，进入详情页。单击右上角“配置NAS VPC”，检查是否开启了NAS VPC。详情页面的“NAS

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 专属资源池创建训练作业
是否支持Keras引擎？ - AI开发平台ModelArts

Keras是一个用Python编写的高级神经网络API，它能够以TensorFlow、CNTK或者Theano作为后端运行。Notebook开发环境支持“tf.keras”。如何查看Keras版本在ModelArts管理控制台，创建一个Notebook实例，镜像选择“TensorFlow-1.13”或“TensorFlow-1

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 规格限制
日志报错“DataFrame.dtypes for data must be int, float or bool” - AI开发平台ModelArts

be int, float or bool 原因分析出现该问题的可能原因如下：训练数据中出现了非int、float、bool类型数据。处理方法可参考如下代码，将错误列进行转换： from sklearn import preprocessing lbl = preprocessing

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
使用AI市场物体检测YOLOv3 - AI开发平台ModelArts

does not exist. The operation, 'images', does not exist in the graph。处理方法如果切分了数据集，需要删除推理代码中“Yolov3Service”类中的如下代码： self.model_inputs = {'images':

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署

总条数： 515

上一页
1
...
21
22
23
...
26
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用pip install提示Read timed out - AI开发平台ModelArts

yaml配置文件参数配置说明 - AI开发平台ModelArts

运行训练作业时提示URL连接超时 - AI开发平台ModelArts

日志提示“ValueError: label - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

创建训练作业提示错误码ModelArts.2763 - AI开发平台ModelArts

安装ModelArts SDK报错“ERROR: Could not install packages due to an OSError” - AI开发平台ModelArts

日志提示“No module name 'unidecode'” - AI开发平台ModelArts

功能咨询 - AI开发平台ModelArts

服务启动后，状态断断续续处于“告警中” - AI开发平台ModelArts

时序预测-time_series_v2算法部署在线服务预测报错 - AI开发平台ModelArts

专属资源池关联SFS Turbo显示异常 - AI开发平台ModelArts

日志提示“root: XXX valid number is 0” - AI开发平台ModelArts

日志提示“ValueError: Invalid endpoint: obs.xxxx.com” - AI开发平台ModelArts

订阅算法物体检测YOLOv3 - AI开发平台ModelArts

训练作业性能降低 - AI开发平台ModelArts

创建训练作业界面无云存储名称和挂载路径排查思路 - AI开发平台ModelArts

是否支持Keras引擎？ - AI开发平台ModelArts

日志报错“DataFrame.dtypes for data must be int, float or bool” - AI开发平台ModelArts

使用AI市场物体检测YOLOv3 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线