搜索_华为云

报错“ssh: connect to host xxx.pem port xxxxx: Connection refused”如何解决？ - AI开发平台ModelArts

网络不通；端口不通。解决方法检查实例是否运行。请前往ModelArts控制台查看实例是否处于运行状态，如果实例已停止，请执行启动操作，如果实例处于其他状态比如“错误”，请尝试先执行停止然后执行启动操作。待实例变为“运行中”后，再次执行远程连接。执行如下命令排查本地网络是否可以访问。 curl

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > VS Code连接开发环境失败常见问题
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

PU镜像被其他容器挂载。请先正常安装NPU设备和驱动，或释放被挂载的NPU。检查containerd是否安装。 containerd -v # 检查containerd是否安装在创建CCE集群时，会选择 containerd 作为容器引擎，并默认给机器安装。如尚未安装，说

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 准备工作
查看批量服务详情 - AI开发平台ModelArts

默认关闭，批量服务的运行日志仅存放在ModelArts日志系统。启用运行日志输出后，批量服务的运行日志会输出存放到云日志服务LTS。LTS自动创建日志组和日志流，默认缓存7天内的运行日志。如需了解LTS专业日志管理功能，请参见云日志服务。说明： “运行日志输出”开启后，不支持关闭。 LTS服务提供的日志查

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理批量推理作业
审核并验收团队标注任务结果 - AI开发平台ModelArts

在弹出的对话框中，设置“抽样策略”，可设置为“按百分比”，也可以设置为“按数量”。设置好参数值后，单击“确定”启动验收。 “按百分比”：按待验收图片总数的一定比例进行抽样验收。 “按数量”：按一定数量进行抽样验收。图6 发起验收验收启动后，界面将展示实时验收报告，您可以在右侧选择“验收结果”（“通过”或“不通过”）。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过团队标注方式标注数据
线下容器镜像构建及调试 - AI开发平台ModelArts

如果在linux服务器上运行就有问题，那么先调通以后再做容器镜像。确认打入镜像的文件是否在正确的位置、是否有正确的权限。训练场景主要查看自研的依赖包是否正常，查看pip list是否包含所需的包，查看容器直接调用的python是否是自己所需要的那个（如果容器镜像装了多个python，需要设置python路径的环境变量）。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
错误码 - AI开发平台ModelArts
错误码 - AI开发平台ModelArts

检查资源规范编码是否设置正确，并确认其是否属于对应的项目下。 400 ModelArts.3837 Resource ID {id} of project {id} does not exist. 项目{1}资源ID {0}不存在。检查资源ID是否设置正确，并确认其是否属于对应的项目下。

帮助中心 > AI开发平台ModelArts > API参考 > 公共参数
查询单个智能标注样本的信息 - AI开发平台ModelArts

/v2/{project_id}/datasets/{dataset_id}/auto-annotations/samples/{sample_id} 表1 路径参数参数是否必选参数类型描述 dataset_id 是 String 数据集ID。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
通过Token认证的方式访问在线服务 - AI开发平台ModelArts

选择“form-data”。在“KEY”值填写模型的入参，和在线服务的输入参数对应，比如本例中预测图片的参数为“images”。然后在“VALUE”值，选择文件，上传一张待预测图片（当前仅支持单张图片预测），如图4所示。图4 填写Body 文本输入选择“raw”，选择JSON(appl

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的认证方式
镜像保存时报错“The container size (xG) is greater than the threshold (25G)”如何解决？ - AI开发平台ModelArts

到原始镜像重新构建环境进行保存。解决方法找到原始镜像重新构建环境。建议使用干净的基础镜像，最小化的安装运行依赖内容，并进行安装后的软件缓存清理，然后保存镜像。父主题：自定义镜像故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 自定义镜像故障
资源选择推荐 - AI开发平台ModelArts

训练各步骤性能参考步骤说明时长镜像下载首次下载镜像的时间（25G）。 8分钟资源调度点创建训练任务开始到变成运行中的时间（资源充足、镜像已缓存）。 20秒训练列表页打开已有50条训练作业，单击训练模块后的时间。 6秒日志加载作业运行中，已经输出1兆的日志文本，单击训练详情页面需要多久加载出日志。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练
增量模型训练 - AI开发平台ModelArts

将被赋值为"/home/ma-user/modelarts/outputs/train_url_0" train_url = args.train_url # 判断输出路径中是否有模型文件。如果无文件则默认从头训练，如果有模型文件，则加载epoch值最大的ckpt文件当做预训练模型。 if os.listdir(train_url):

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
从OBS目录导入数据到数据集 - AI开发平台ModelArts

据，并可以通过创建标注任务进行数据标注。文件型数据标注状态数据标注状态分为“未标注”和“已标注”。未标注：仅导入标注对象（指待标注的图片，文本等），不导入标注内容（指标注结果信息）。已标注：同时导入标注对象和标注内容，当前“自由格式”的数据集不支持导入标注内容。为了确保

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导入数据到ModelArts数据集 > 从OBS导入数据到ModelArts数据集
使用ModelArts PyCharm插件调试训练ResNet50图像分类模型 - AI开发平台ModelArts

ToolKit的版本不正确，请按照文档要求下载新版本的PyCharm ToolKit。下载前请先清除浏览器缓存，如果之前下载过老版本的PyCharm ToolKit，浏览器会有缓存，可能会导致新版本下载失败。在KeyPair中选择该Notebook实例对应的密钥，选择完成后，单击A

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard开发环境
查询单个样本信息 - AI开发平台ModelArts

路径参数参数是否必选参数类型描述 dataset_id 是 String 数据集ID。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 sample_id 是 String 样本ID。表2 Query参数参数是否必选参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
ModelArts昇腾迁移调优工具总览 - AI开发平台ModelArts

精度比对，对PyTorch整网API粒度的数据dump、精度比对，进而定位训练场景下的精度问题支持溢出检测功能，判断是否存在输入正常但输出存在溢出的API，从而判断是否为正常溢出。梯度状态监控，用于采集梯度数据并进行梯度相似度比对，可以精准定位出现问题的step。执行pip install

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

PU镜像被其他容器挂载。请先正常安装NPU设备和驱动，或释放被挂载的NPU。检查containerd是否安装。 containerd -v # 检查containerd是否安装在创建CCE集群时，会选择 containerd 作为容器引擎，并默认给机器安装。如尚未安装，说

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） > 准备工作
服务启动失败 - AI开发平台ModelArts

自定义镜像中的代码开放的端口图3 创建模型界面上配置的端口健康检查配置有问题镜像如果配置了健康检查，服务启动失败，从以下两个方面进行排查：健康检查端口是否可以正常工作自定义镜像中配置了健康检查，需要在测试镜像时，同步测试健康检查接口是否可以正常工作，具体参考从0-1制作自定义镜像并创建AI应用中的本地验证镜像方法。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
在ModelArts Standard上运行GPU训练作业的场景介绍 - AI开发平台ModelArts

训练各步骤性能参考步骤说明预计时长镜像下载首次下载镜像的时间（25G）。 8分钟资源调度点创建训练作业开始到变成运行中的时间（资源充足、镜像已缓存）。 20秒训练列表页打开已有50条训练作业，单击训练模块后的时间。 6秒日志加载作业运行中，已经输出1兆的日志文本，单击训练详情页面需要多久加载出日志。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
VS Code连接开发环境失败时的排查方法 - AI开发平台ModelArts

查看密钥文件的路径，建议放在C:\Users\{user}\.ssh下，并确保密钥文件无中文字符。排查插件包是否为最新版：在extensions中搜索，看是否需要升级。检查Remote-ssh三方插件是否兼容。 4. 检查本地Vscode是否为最新版，最新版可能有bug，建议使用推荐版本v1.82。如果以上步骤排

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
训练作业日志中提示“No module named .*” - AI开发平台ModelArts

训练作业日志中提示“No module named .*” 用户请按照以下思路进行逐步排查：检查依赖包是否存在检查依赖包路径是否能被识别检查训练作业使用的资源规格是否正确建议与总结检查依赖包是否存在如果依赖包不存在，您可以使用以下两种方式完成依赖包的安装。方式一（推荐使用）：在创

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障

总条数： 1154

上一页
1
...
15
16
17
...
58
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

报错“ssh: connect to host xxx.pem port xxxxx: Connection refused”如何解决？ - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

查看批量服务详情 - AI开发平台ModelArts

审核并验收团队标注任务结果 - AI开发平台ModelArts

线下容器镜像构建及调试 - AI开发平台ModelArts

错误码 - AI开发平台ModelArts

查询单个智能标注样本的信息 - AI开发平台ModelArts

通过Token认证的方式访问在线服务 - AI开发平台ModelArts

镜像保存时报错“The container size (xG) is greater than the threshold (25G)”如何解决？ - AI开发平台ModelArts

资源选择推荐 - AI开发平台ModelArts

增量模型训练 - AI开发平台ModelArts

从OBS目录导入数据到数据集 - AI开发平台ModelArts

使用ModelArts PyCharm插件调试训练ResNet50图像分类模型 - AI开发平台ModelArts

查询单个样本信息 - AI开发平台ModelArts

ModelArts昇腾迁移调优工具总览 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

服务启动失败 - AI开发平台ModelArts

在ModelArts Standard上运行GPU训练作业的场景介绍 - AI开发平台ModelArts

VS Code连接开发环境失败时的排查方法 - AI开发平台ModelArts

训练作业日志中提示“No module named .*” - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线