搜索_华为云

查询可视化作业详情 - AI开发平台ModelArts

String 可视化作业的具体描述。 duration Long 可视化作业的运行时长，单位为毫秒。 create_time Long 可视化作业的创建时间，时间戳格式。 train_url String 可视化作业输出文件OBS路径。 status Int 可视化作业的运行状态，详细作业状态列表请参见作业状态参考。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 可视化作业
启动推理服务 - AI开发平台ModelArts

--num-gpus：要跟ASCEND_RT_VISIBLE_DEVICES指定的可用卡数一致。 --address：头节点IP+端口号，头节点创建成功后，会有打印。环境变量每个节点都要设置。更新环境变量需要重启Ray集群。选择其中一个节点，添加指定分布式后端参数【--distr

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务部署
Notebook提示磁盘空间已满 - AI开发平台ModelArts

用内存，导致磁盘空间不足。磁盘配额不足。处理方法查看虚拟机所使用的存储空间，再查看回收站文件占用内存，根据实际删除回收站里不需要的大文件。在Notebook实例详情页，查看实例的存储容量。执行如下命令，排查虚拟机所使用的存储空间，一般接近存储容量，请排查回收站占用内存。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 环境配置故障
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

准备镜像镜像方案说明 ECS获取基础镜像 ECS中构建新镜像 ECS中上传新镜像父主题：准备工作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 准备工作
在ModelArts Standard上运行GPU训练作业的场景介绍 - AI开发平台ModelArts

到端实践案例请参见面向AI场景使用OBS+SFS Turbo的存储加速实践。表1 不同场景所需服务及购买推荐场景 OBS SFS SWR DEW ModelArts VPC ECS EVS 单机单卡按需购买（并行文件系统） × 免费免费包月购买免费 × 按需购买单机多卡

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
使用AI Gallery SDK构建自定义模型 - AI开发平台ModelArts

自定义配置类的“__init__”必须接受任何“kwargs”，这些“kwargs”需要传递给“__init__”。完成自定义配置类的编写后，可以使用该类创建配置实例。 newbert1_config = NewBertConfig(num_hidden_layers=6, num_attention_heads=10

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型 > 构建模型
自定义镜像训练作业失败定位思路 - AI开发平台ModelArts

镜像过大会直接影响训练作业的启动时间。 ModelArts公共资源池的容器引擎空间为50G，专属资源池的容器引擎空间的默认为50G，支持在创建专属资源池时自定义容器引擎空间。确定错误类型提示找不到文件等错误，请参见训练作业日志中提示“No such file or directory”。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败
启动团队标注任务 - AI开发平台ModelArts

标注团队名称，名称不能包含!<>=&"'，长度为0-1024位。表5 Worker 参数是否必选参数类型描述 create_time 否 Long 创建时间。 description 否 String 标注成员描述，长度为0-256位，不能包含^!<>=&"'特殊字符。 email 否 String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
IEF节点边缘服务部署失败 - AI开发平台ModelArts

IEF节点边缘服务部署失败问题现象部署边缘服务时，出现“异常”状态。原因分析1 部署边缘服务时，使用到IEF纳管的边缘节点，就需要用户给ModelArts的委托赋予Tenant Administrator权限，否则将无法成功部署边缘服务。具体可参见IEF的权限说明。处理方法1

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
离线训练安装包准备说明 - AI开发平台ModelArts

注意：该文件夹从Megatron-LM中复制得到 |——... 步骤二：资源安装将资源上传至机器中，确保容器能够访问，并进入已创建的容器。 Python依赖包本地安装：进入pip文件所在的路径，并运行安装命令。如下列所示。 pip install numpy pip install

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.910） > 训练脚本说明参考
查询服务更新日志 - AI开发平台ModelArts

un”等，会导致容器异常。建议挂载在空目录下，若目录不为空，请确保目录下无影响容器启动的文件，否则文件会被替换，导致容器启动异常，工作负载创建失败。 storage_type String 挂载类型sfs_turbo极速文件系统挂载。 source_address String 挂载源路径，挂载为极速文件时为sfs

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

906-xxx.zip。准备镜像准备推理模型适用的容器镜像。准备Notebook 本案例在Notebook上部署推理服务进行调试，因此需要创建Notebook。部署推理服务在Notebook调试环境中部署推理服务介绍如何在Notebook中配置NPU环境，部署并启动推理服务，完成精度测试和性能测试。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

准备镜像镜像方案说明 ECS获取基础镜像 ECS中构建新镜像 ECS中上传新镜像父主题：准备工作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912） > 准备工作
解析Manifest文件 - AI开发平台ModelArts

confidence Double 置信度，数值类型，范围0<=confidence<=1，表示机器标注的置信度。 creation_time String 创建该标注的时间。是用户写入标注的时间，不是Manifest生成时间。 annotated_by String 标注人。 annotation_format

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > Manifest管理
自定义镜像模型部署为在线服务时出现异常 - AI开发平台ModelArts

自定义镜像模型部署为在线服务时出现异常问题现象在部署在线服务时，部署失败。进入在线服务详情页面，“事件”页签，提示“failed to pull image, retry later”，同时在“日志”页签中，无任何信息。图1 部署在线服务异常解决方法出现此问题现象，通常

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
包年/包月 - AI开发平台ModelArts
包年/包月 - AI开发平台ModelArts

包年/包月资源生命周期到期预警包年/包月资源池在到期前第7天内，系统将向用户推送到期预警消息。预警消息将通过邮件、短信和站内信的方式通知到华为云账号的创建者。到期后影响当您的包年/包月资源池到期未续费，首先会进入宽限期，资源状态变为“已过期”。宽限期内您可以正常访问ModelArts，但以下操作将受到限制：

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费模式
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

修改为：transformers==4.44.2 为了避免因使用不同版本的transformers库进行训练和推理而导致冲突的问题，建议用户分别为训练和推理过程创建独立的容器环境。通过运行install.sh脚本，还会git clone下载Megatron-LM、MindSpeed、ModelLink源码（install

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

修改为：transformers==4.44.2 为了避免因使用不同版本的 transformers 库进行训练和推理而导致冲突的问题，建议用户分别为训练和推理过程创建独立的容器环境。通过运行install.sh脚本，还会git clone下载Megatron-LM、MindSpeed、ModelLink源码（install

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作
多模态 - AI开发平台ModelArts
多模态 - AI开发平台ModelArts

过会报timeout错误。 PYTORCH_NPU_ALLOC_CONF=expandable_segments:True；允许分配器最初创建一个段，然后在以后需要更多内存时扩展它的大小。开启时可能提升模型性能。报错则关闭。 --model ${container_model_p

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
使用MoXing复制数据报错 - AI开发平台ModelArts

如果是在Notebook使用MoXing复制数据不成功，可以在Terminal界面中使用df -hT命令查看空间大小，排查是否因空间不足导致，可在创建Notebook时使用EVS挂载。如果代码写作正确，仍然无法解决该问题，请提交工单，由专业工程师为您分析并解决问题。父主题： MoXing

帮助中心 > AI开发平台ModelArts > 故障排除 > MoXing

总条数： 1574

上一页
1
...
64
65
66
...
79
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查询可视化作业详情 - AI开发平台ModelArts

启动推理服务 - AI开发平台ModelArts

Notebook提示磁盘空间已满 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

在ModelArts Standard上运行GPU训练作业的场景介绍 - AI开发平台ModelArts

使用AI Gallery SDK构建自定义模型 - AI开发平台ModelArts

自定义镜像训练作业失败定位思路 - AI开发平台ModelArts

启动团队标注任务 - AI开发平台ModelArts

IEF节点边缘服务部署失败 - AI开发平台ModelArts

离线训练安装包准备说明 - AI开发平台ModelArts

查询服务更新日志 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

解析Manifest文件 - AI开发平台ModelArts

自定义镜像模型部署为在线服务时出现异常 - AI开发平台ModelArts

包年/包月 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

多模态 - AI开发平台ModelArts

使用MoXing复制数据报错 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线