搜索_华为云

管理标注数据 - AI开发平台ModelArts

ModelArts会自动将数据集中新增的数据同步至标注作业，包含数据及当前标注作业支持的标注信息。为了快速获取数据集中最新数据，可在标注作业详情页的“全部”、“未标注”或“已标注”页签中，单击“同步新数据”，快速将数据集中的数据添加到标注作业中。问题现象：将已标注好的数据上传至OBS，同步数据后，显示为未标注。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过人工标注方式标注数据
模型发布失败 - AI开发平台ModelArts

模型发布任务提交失败和模型发布失败问题，一般是因为后台服务故障导致的，建议稍等片刻，然后重新创建训练作业。如果重试超过3次仍无法解决，请获取如下信息，并联系华为云技术支持协助解决故障。获取模型ID。进入“模型管理”页面，在模型管理页面找到自动学习任务中自动创建的模型，自动学习产生的模型都是以“exeML-”开头的

 帮助中心 > AI开发平台ModelArts > 故障排除 > 自动学习 > 模型发布
华为云CCE集群纳管GPU裸金属服务器由于CloudInit导致纳管失败的解决方案 - AI开发平台ModelArts

init中的脚本在创建时自动执行的，可能是由于安装脚本没有注入userdata或者注入了但未执行。经查看是由于userdata未执行，可能原因为服务器A制作镜像时没有清理残留目录导致，即：镜像里面“/var/lib/cloud/instances”残留了制作镜像机器（后面称模

 帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
查看Lite Server服务器详情 - AI开发平台ModelArts

Server服务器创建时绑定的虚拟私有云，单击链接可跳转到虚拟私有云详情页。裸金属服务器 Lite Server服务器为一台裸金属服务器，单击链接可跳转至对应弹性裸金属服务器的详情页。镜像 Lite Server服务器的镜像。创建时间 Lite Server服务器的创建时间。更新时间

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理
训练作业卡死检测 - AI开发平台ModelArts

用率或NPU利用率，并根据这段时间内的GPU利用率或NPU利用率的方差和中位数来判断资源使用率是否有变化。如果没有变化，则判定作业卡死。系统预置了卡死检测的环境变量“MA_HANG_DETECT_TIME=30”，表示30分钟内进程IO无变化则判定作业卡死。如果需要修改卡死检测

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
Yolov8基于DevServer适配MindSpore Lite推理指导（6.3.909） - AI开发平台ModelArts

Value [linux] for parameter [--host_env_os] is invalid. Reason: os not supported, support setting are the OS types of opp package。建议在步骤三：启动容器镜像中通过docker

帮助中心 > AI开发平台ModelArts > 最佳实践 > 内容审核模型训练推理
更新管理 - AI开发平台ModelArts
更新管理 - AI开发平台ModelArts

推理服务有三种升级模式：全量升级、滚动升级（扩实例）和滚动升级（缩实例）。了解三种升级模式的流程，请参见图1。全量升级需要额外的双倍的资源，先全量创建新版本实例，然后再下线旧版本实例。滚动升级（扩实例）需额外消耗部分实例资源用于滚动升级，扩实例越大，升级速度越快。滚动升级（缩实例）

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
自定义镜像训练作业失败定位思路 - AI开发平台ModelArts

ts的基础镜像构建自定义镜像，具体请参见使用ModelArts的基础镜像构建新的训练镜像。如镜像来源于第三方，设法找到自定义镜像的制作者咨询，制作者一般对镜像如何使用更加了解。确定自定义镜像大小自定义镜像的大小推荐15GB以内，最大不要超过资源池的容器引擎空间大小的一半。镜像过大会直接影响训练作业的启动时间。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败
准备镜像环境 - AI开发平台ModelArts

-v ${work_dir}:${container_work_dir} 代表需要在容器中挂载宿主机的目录。宿主机和容器使用不同的文件系统。work_dir为宿主机中工作目录，目录下存放着训练所需代码、数据等文件。container_work_dir为要挂载到的容器中的目录。为方便两个地址可以相同。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 准备工作
AI Gallery功能介绍 - AI开发平台ModelArts

Gallery大模型开源社区，通过大模型为用户提供服务，普及大模型行业。AI Gallery提供了大量基于昇腾云底座适配的三方开源大模型，同步提供了可以快速体验模型的能力、极致的开发体验，助力开发者快速了解并学习大模型。构建零门槛线上模型体验，零基础开发者开箱即用，初学者三行代码使用所有模型通过AI Galler

帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍
服务状态一直处于“部署中” - AI开发平台ModelArts

一般情况都是模型的端口配置有问题。建议您首先检查创建模型的端口是否正确。处理方法模型的端口没有配置，如您在自定义镜像配置文件中修改了端口号，需要在部署模型时，配置对应的端口号，使新的模型重新部署服务。如何修改默认端口号，请参考使用自定义镜像创建在线服务，如何修改默认端口。父主题：服务部署

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
构建条件节点控制分支执行 - AI开发平台ModelArts

# 训练使用的算法对象，示例中使用AIGallery订阅的算法；部分算法超参的值如果无需修改，则在parameters字段中可以不填写，系统自动填充相关超参值 inputs=wf.steps.JobInput(name="data_url", data=obs_data)

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 构建Workflow多分支运行场景
Open-Sora1.2基于DevServer适配PyTorch NPU训练推理指导（6.3.910） - AI开发平台ModelArts

download_datasets.py的内容。 import os import pandas as pd for idx, row in pd.read_csv('results_2M_val.csv').iterrows(): os.system(f"wget -O './dat

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生视频模型训练推理
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

-v ${work_dir}:${container_work_dir} 代表需要在容器中挂载宿主机的目录。宿主机和容器使用不同的文件系统。work_dir为宿主机中工作目录，目录下存放着训练所需代码、数据等文件。container_work_dir为要挂载到的容器中的目录。为方便两个地址可以相同。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.905） > 准备工作
Wav2Lip推理基于DevServer适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

参数说明： -v ${work_dir}:${container_work_dir}：代表需要在容器中挂载宿主机的目录。宿主机和容器使用不同的文件系统。work_dir为宿主机中工作目录，目录下存放着代码、数据等文件。container_work_dir为要挂载到的容器中的目录。为方便两个地址可以相同。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 数字人模型训练推理
PD分离部署使用说明 - AI开发平台ModelArts

间网络通畅，检查代理设置例如no_proxy环境变量，避免scheduler访问P、D实例时走不必要的网关。前提条件已完成推理环境镜像制作，具体参见准备推理环境。步骤一：生成ranktable 介绍如何生成ranktable，以1p1d-tp2分离部署模式为例。当前1p1d

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 分离部署
FLUX.1基于DevSever适配PyTorch NPU Finetune&Lora训练指导（6.3.911） - AI开发平台ModelArts

import re import shutil import os import copy input_file_path = 'pixart-sigma-toy-dataset' input_json = os.path.join(input_file_path, 'InternData'

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
发布和管理AI Gallery镜像 - AI开发平台ModelArts

发布和管理AI Gallery镜像托管镜像到AI Gallery 发布镜像到AI Gallery 管理AI Gallery镜像父主题： AI Gallery（新版）

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
AI Gallery（旧版） - AI开发平台ModelArts

AI Gallery（旧版） AI Gallery简介免费资产和商用资产入驻AI Gallery 我的Gallery介绍订阅使用发布分享参加活动合作伙伴需求广场

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery）
模型管理 - AI开发平台ModelArts
模型管理 - AI开发平台ModelArts

模型管理模型调试导入模型查询模型列表查询模型对象列表查询模型详情删除模型

 帮助中心 > AI开发平台ModelArts > SDK参考

总条数： 1865

上一页
1
...
39
40
41
...
94
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

管理标注数据 - AI开发平台ModelArts

模型发布失败 - AI开发平台ModelArts

华为云CCE集群纳管GPU裸金属服务器由于CloudInit导致纳管失败的解决方案 - AI开发平台ModelArts

查看Lite Server服务器详情 - AI开发平台ModelArts

训练作业卡死检测 - AI开发平台ModelArts

Yolov8基于DevServer适配MindSpore Lite推理指导（6.3.909） - AI开发平台ModelArts

更新管理 - AI开发平台ModelArts

自定义镜像训练作业失败定位思路 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

AI Gallery功能介绍 - AI开发平台ModelArts

服务状态一直处于“部署中” - AI开发平台ModelArts

构建条件节点控制分支执行 - AI开发平台ModelArts

Open-Sora1.2基于DevServer适配PyTorch NPU训练推理指导（6.3.910） - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

Wav2Lip推理基于DevServer适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

PD分离部署使用说明 - AI开发平台ModelArts

FLUX.1基于DevSever适配PyTorch NPU Finetune&Lora训练指导（6.3.911） - AI开发平台ModelArts

发布和管理AI Gallery镜像 - AI开发平台ModelArts

AI Gallery（旧版） - AI开发平台ModelArts

模型管理 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线