搜索_华为云

系统容器异常退出 - AI开发平台ModelArts

系统容器异常退出问题现象在训练创建后出现“系统容器异常退出”的故障。 [ModelArts Service Log]2022-10-11 19:18:23,267 - file_io.py[1ine:748] - ERROR: stat:404 errorCode:NoSuchKey

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
在ModelArts的Notebook中实例重新启动后要怎么连接？ - AI开发平台ModelArts

StrictHostKeyChecking no ForwardAgent yes 提示：因为SSH登录时会忽略known_hosts文件，有安全风险父主题： Standard Notebook

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
产品优势 - AI开发平台ModelArts
产品优势 - AI开发平台ModelArts

产品优势 ModelArts服务具有以下产品优势。稳定安全的算力底座，极快至简的模型训练支持万节点计算集群管理。大规模分布式训练能力，加速大模型研发。提供高性价比国产算力。多年软硬件经验沉淀，AI场景极致优化。加速套件，训练、推理、数据访问多维度加速。一站式端到端生产工具链，一致性开发体验

 帮助中心 > AI开发平台ModelArts > 产品介绍
切换Lite Server服务器操作系统 - AI开发平台ModelArts

Server服务器操作系统场景描述 Lite Server为一台弹性裸金属服务器，您可以使用BMS服务提供的切换操作系统功能，对Lite Server资源操作系统进行切换。本文介绍以下三种切换操作系统的方式：在BMS控制台切换操作系统使用BMS Go SDK的方式切换操作系统使用Python封装API的方式切换操作系统

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理
创建生产训练作业 - AI开发平台ModelArts

勾选“无条件自动重启”后，只要系统检测到训练异常，就无条件重启训练作业。为了避免无效重启浪费算力资源，系统最多只支持连续无条件重启3次。系统支持自动监控作业进程的状态和资源利用率来判定作业是否卡死，开启“作业卡死重启”开关后，支持将标记为卡死的作业进行进程级自动重启，以提高资源使用率。因系统无法核实

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
查询数据集标签列表 - AI开发平台ModelArts

内置属性：标签展示的颜色，为色彩的16进制代码，默认为空。例如：“#FFFFF0”。 @modelarts:default_shape String 内置属性：物体检测标签的默认形状（物体检测标签专用属性），默认为空。可选值如下： bndbox：矩形。 polygon：多边形。 circle：圆形。 line：直线。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
Qwen-VL基于Lite Server适配PyTorch NPU的推理指导（6.3.909） - AI开发平台ModelArts

Qwen-VL基于Lite Server适配PyTorch NPU的推理指导（6.3.909） Qwen-VL是规模视觉语言模型，可以以图像、文本、检测框作为输入，并以文本和检测框作为输出。具有强大的性能、多语言对话、多图交错对话、支持中文开放域定位、细粒度识别和理解等特点。本文档主要介绍如何利用训练框架PyTorch_npu

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
日志提示“ Network is unreachable” - AI开发平台ModelArts

‘OSError: [Errno 101] Network is unreachable’ 原因分析出现该问题的可能原因如下：因为安全性问题，ModelArts内部训练机器不能访问外网。处理方法将pretrained改成false，提前下载好预训练模型，加载下载好的预训练模型位置即可，可参考如下代码。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 外网访问限制
运行训练作业时提示URL连接超时 - AI开发平台ModelArts

error.URLERROR:<urlopen error [Errno 110] Connection timed out> 原因分析由于安全性问题在ModelArts上不能联网下载。处理方法如果在运行训练作业时提示连接超时，请您将需要联网下载的数据提前下载至本地，并上传至OBS中。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 外网访问限制
IAM - AI开发平台ModelArts
IAM - AI开发平台ModelArts

先切换至授权区域。如表1所示，包括了ModelArts的所有系统策略权限。如果系统预置的ModelArts权限，不满足您的授权要求，可以创建自定义策略，可参考策略JSON格式字段介绍。表1 ModelArts系统策略策略名称描述类型 ModelArts FullAccess

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 权限控制方式
Qwen-VL基于Lite Server适配PyTorch NPU的Finetune训练指导(6.3.912) - AI开发平台ModelArts

Server适配PyTorch NPU的Finetune训练指导(6.3.912) Qwen-VL是规模视觉语言模型，可以以图像、文本、检测框作为输入，并以文本和检测框作为输出。具有强大的性能、多语言对话、多图交错对话、支持中文开放域定位、细粒度识别和理解等特点。本文档主要介绍如何利用训练框架PyTorch_npu

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
如何禁止Ubuntu 20.04内核自动升级？ - AI开发平台ModelArts

04内核自动升级？场景描述在Ubuntu 20.04每次内核升级后，系统需要重新启动以加载新内核。如果您已经安装了自动更新功能，则系统将自动下载和安装可用的更新，这可能导致系统在不经意间被重启，如果使用的软件依赖于特定版本的内核，那么当系统自动更新到新的内核版本时，可能会出现兼容性问题。在使用Ubuntu20

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
在ModelArts自动学习中模型训练图片异常怎么办？ - AI开发平台ModelArts

ignore 系统已自动过跳过这张图片，不需要用户处理。 2 tf-decode failed 图片无法被TensorFlow解码且不能修复 ignore 系统已跳过这张图片，不需要用户处理。 3 size over 图片大于5MB resize to small 系统已将图片压缩到5MB以内处理，不需要用户处理。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习
认证鉴权 - AI开发平台ModelArts
认证鉴权 - AI开发平台ModelArts

认证鉴权调用接口有如下两种认证方式，您可以选择其中一种进行认证鉴权。推荐使用AK/SK认证，其安全性比Token认证要高。 Token认证：通过Token认证通用请求。 AK/SK认证：通过AK（Access Key ID）/SK（Secret Access Key）加密调用请求。

帮助中心 > AI开发平台ModelArts > API参考 > 如何调用API
Cluster资源池节点故障如何定位 - AI开发平台ModelArts

Lite池故障处理流程对于ModelArts Lite资源池，每个节点会以DaemonSet方式部署node-agent组件，该组件会检测节点状态，并将检测结果写到K8S NodeCondtition中。同时，节点故障指标默认会上报到AOM，您可在AOM配置告警通知。当发生节点异常时

 帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
与其他云服务的关系 - AI开发平台ModelArts

与对象存储服务的关系 ModelArts使用对象存储服务（Object Storage Service，简称OBS）存储数据和模型，实现安全、高可靠和低成本的存储需求。OBS的更多信息请参见《对象存储服务产品文档》。表1 ModelArts各环节与OBS的关系功能子任务 ModelArts与OBS的关系

 帮助中心 > AI开发平台ModelArts > 产品介绍
ModelArts与其他服务的关系 - AI开发平台ModelArts

与对象存储服务的关系 ModelArts使用对象存储服务（Object Storage Service，简称OBS）存储数据和模型，实现安全、高可靠和低成本的存储需求。OBS的更多信息请参见《对象存储服务控制台指南》。表1 ModelArts各环节与OBS的关系功能子任务

 帮助中心 > AI开发平台ModelArts > 常见问题 > 历史文档待下线
打开Notebook实例提示token不存在或者token丢失如何处理？ - AI开发平台ModelArts

incorrect token……”。原因分析原因是由于其他人没有此账号的令牌导致。解决方案在此URL末尾加上Notebook实例的token。出于安全考虑，不建议通过此方式传播Notebook实例，防止实例被恶意利用。 URL参考示例：https://example.com/11136b

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 实例故障
创建Workflow训练作业节点 - AI开发平台ModelArts

NFS文件系统对象，在一个Volume对象中，nfs、pacific、pfs同时只能配置一个否 NFS pacific pacific文件系统对象，在一个Volume对象中，nfs、pacific、pfs同时只能配置一个否 Placeholder pfs OBS并行文件系统对象，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
在Notebook上安装配置Grafana - AI开发平台ModelArts

图1 修改defaults.ini文件其中： root_url的组成为：https:{jupyterlab域名}/{INSTANCE_ID}/grafana。域名和INSTANCE_ID可以从打开的jupyterLab页面地址栏获取，如下： Serve_from_sub_path设置为true

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控 > 使用Grafana查看AOM中的监控指标 > 安装配置Grafana

总条数： 907

上一页
1
2
3
4
5
...
46
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

系统容器异常退出 - AI开发平台ModelArts

在ModelArts的Notebook中实例重新启动后要怎么连接？ - AI开发平台ModelArts

产品优势 - AI开发平台ModelArts

切换Lite Server服务器操作系统 - AI开发平台ModelArts

创建生产训练作业 - AI开发平台ModelArts

查询数据集标签列表 - AI开发平台ModelArts

Qwen-VL基于Lite Server适配PyTorch NPU的推理指导（6.3.909） - AI开发平台ModelArts

日志提示“ Network is unreachable” - AI开发平台ModelArts

运行训练作业时提示URL连接超时 - AI开发平台ModelArts

IAM - AI开发平台ModelArts

Qwen-VL基于Lite Server适配PyTorch NPU的Finetune训练指导(6.3.912) - AI开发平台ModelArts

如何禁止Ubuntu 20.04内核自动升级？ - AI开发平台ModelArts

在ModelArts自动学习中模型训练图片异常怎么办？ - AI开发平台ModelArts

认证鉴权 - AI开发平台ModelArts

Cluster资源池节点故障如何定位 - AI开发平台ModelArts

与其他云服务的关系 - AI开发平台ModelArts

ModelArts与其他服务的关系 - AI开发平台ModelArts

打开Notebook实例提示token不存在或者token丢失如何处理？ - AI开发平台ModelArts

创建Workflow训练作业节点 - AI开发平台ModelArts

在Notebook上安装配置Grafana - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线