搜索_华为云

查询专属资源池作业列表 - AI开发平台ModelArts

Workload type String 作业所属业务类型。可选值如下： train：训练作业 namespace String 作业所属资源池名称。 name String 作业名称。 jobName String 上层业务作业名称。 uid String 作业uid。 jobUUID String

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
自动学习/Workflow计费项 - AI开发平台ModelArts

50 元/小时）。按照计算资源费用、存储费用结算，那么运行这个自动学习作业的费用计算过程如下：计算资源费用 = 规格单价 * 计算节点个数 * 训练作业运行时长（数据校验）+ 规格单价 * 计算节点个数 * 训练作业运行时长（图像分类） + 规格单价 * 计算节点个数 * 服务运行时长

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费项
Yaml配置文件参数配置说明 - AI开发平台ModelArts

Yaml配置文件参数配置说明本小节主要详细描述demo_yaml配置文件、配置参数说明，用户可根据实际自行选择其需要的参数。表1 模型训练脚本参数参数示例值参数说明 model_name_or_path /home/ma-user/ws/model/Qwen2-72B

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 训练脚本说明
下载代码目录失败 - AI开发平台ModelArts

下载代码目录失败问题现象训练作业运行时下载失败，出现如下报错，请参见图1： ERROR：modelarts-downloader.py: Get object key failed: 'Contents' 图1 获取内容失败原因分析在创建训练作业时指定的代码目录不存在导致训练失败。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
复制数据至容器中空间不足 - AI开发平台ModelArts

复制数据至容器中空间不足问题现象 ModelArts训练作业运行时，日志中遇到如下报错，导致数据无法复制至容器中。 OSError:[Errno 28] No space left on device 原因分析数据下载至容器的位置空间不足。处理方法请排查是否将数据下载至“

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
tensorboard显示502 bad gateway - AI开发平台ModelArts

tensorboard显示502 bad gateway 问题现象启动tensorboard后，打开tensorboard提示502 bad gateway，或者偶现502 bad gateway。原因分析出现该问题的可能原因如下: 启动tensorboard对应的summ

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
获取自动化搜索作业yaml模板的信息 - AI开发平台ModelArts

获取自动化搜索作业yaml模板的信息功能介绍获取自动化搜索作业yaml模板的信息。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v2/{projec

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
配置Lite Server存储 - AI开发平台ModelArts

务等。说明：高性能计算：主要是高带宽的需求，用于共享文件存储，比如基因测序、图片渲染这些。如大数据分析、静态网站托管、在线视频点播、基因测序和智能视频监控等。如高性能计算、企业核心集群应用、企业应用系统和开发测试等。说明：高性能计算：主要是高速率、高IOPS的需求，用

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置
昇腾云服务6.3.906版本说明 - AI开发平台ModelArts

昇腾云服务6.3.906版本说明本文档主要介绍昇腾云服务6.3.906版本配套的镜像地址、软件包获取方式和支持的特性能力。配套的基础镜像镜像地址获取方式配套关系镜像软件说明配套关系 PyTorch：西南-贵阳一 swr.cn-southwest-2.myhuaweicloud

帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
单机单卡 - AI开发平台ModelArts
单机单卡 - AI开发平台ModelArts

单机单卡线下容器镜像构建及调试上传镜像上传数据和算法至OBS（首次使用时需要）使用Notebook进行代码调试创建训练任务监控资源父主题：调试与训练

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练
配置Standard专属资源池可访问公网 - AI开发平台ModelArts

配置Standard专属资源池可访问公网场景介绍当您使用专属资源池创建作业时（如训练作业），如果需要作业运行过程中需要专属资源池访问外网，首先专属资源池通过打通VPC的方式，使得专属资源池和已绑定EIP的弹性云服务器实现网络对等连接；然后对已绑定EIP的弹性云服务器配置公网N

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
日志提示"No CUDA-capable device is detected" - AI开发平台ModelArts

用户/训练系统，将CUDA_VISIBLE_DEVICES传错了，检查CUDA_VISIBLE_DEVICES变量是否正常。用户选择了1/2/4卡这些规格的作业，然后设置了CUDA_VISIBLE_DEVICES=‘1’这种类似固定的卡ID号，与实际选择的卡ID不匹配。处理方法尽量代码里不要去

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题
Yaml配置文件参数配置说明 - AI开发平台ModelArts

Yaml配置文件参数配置说明本小节主要详细描述demo_yaml配置文件、配置参数说明，用户可根据实际自行选择其需要的参数。表1 模型训练脚本参数参数示例值参数说明 model_name_or_path /home/ma-user/ws/model/Qwen2-72B

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.5.901） > 训练脚本说明
Yaml配置文件参数配置说明 - AI开发平台ModelArts

Yaml配置文件参数配置说明本小节主要详细描述demo_yaml配置文件、配置参数说明，用户可根据实际自行选择其需要的参数。表1 模型训练脚本参数参数示例值参数说明 model_name_or_path /home/ma-user/ws/tokenizers/Qwen2-72B

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练脚本说明
日志提示“RuntimeError: connect() timed out” - AI开发平台ModelArts

file.copy_parallel(src,dst) torch.distributed.barrier() 建议与总结在创建训练作业前，推荐您先使用ModelArts开发环境调试训练代码，避免代码迁移过程中的错误。直接使用线上notebook环境调试请参考使用JupyterLab开发模型。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题
提前终止自动化搜索作业的某个trial - AI开发平台ModelArts

提前终止自动化搜索作业的某个trial 功能介绍提前终止自动化搜索作业的某个trial。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI POST /v2/{pro

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
获取自动化搜索作业yaml模板的内容 - AI开发平台ModelArts

获取自动化搜索作业yaml模板的内容功能介绍获取自动化搜索作业yaml模板的内容。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v2/{projec

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
服务管理 - AI开发平台ModelArts
服务管理 - AI开发平台ModelArts

服务管理概述在开发环境中部署本地服务进行调试部署在线服务查询服务详情推理服务测试查询服务列表查询服务对象列表更新服务配置查询服务监控信息查询服务日志删除服务

 帮助中心 > AI开发平台ModelArts > SDK参考
Yaml配置文件参数配置说明 - AI开发平台ModelArts

Yaml配置文件参数配置说明本小节主要详细描述demo_yaml配置文件、配置参数说明，用户可根据实际自行选择其需要的参数。表1 模型训练脚本参数参数示例值参数说明 model_name_or_path /home/ma-user/ws/tokenizers/Qwen2-72B

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 训练脚本说明
Yaml配置文件参数配置说明 - AI开发平台ModelArts

Yaml配置文件参数配置说明本小节主要详细描述demo_yaml配置文件、配置参数说明，用户可根据实际自行选择其需要的参数。表1 模型训练脚本参数参数示例值参数说明 model_name_or_path /home/ma-user/ws/tokenizers/Qwen2-72B

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 训练脚本说明

总条数： 939

上一页
1
...
14
15
16
...
47
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查询专属资源池作业列表 - AI开发平台ModelArts

自动学习/Workflow计费项 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

下载代码目录失败 - AI开发平台ModelArts

复制数据至容器中空间不足 - AI开发平台ModelArts

tensorboard显示502 bad gateway - AI开发平台ModelArts

获取自动化搜索作业yaml模板的信息 - AI开发平台ModelArts

配置Lite Server存储 - AI开发平台ModelArts

昇腾云服务6.3.906版本说明 - AI开发平台ModelArts

单机单卡 - AI开发平台ModelArts

配置Standard专属资源池可访问公网 - AI开发平台ModelArts

日志提示"No CUDA-capable device is detected" - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

日志提示“RuntimeError: connect() timed out” - AI开发平台ModelArts

提前终止自动化搜索作业的某个trial - AI开发平台ModelArts

获取自动化搜索作业yaml模板的内容 - AI开发平台ModelArts

服务管理 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线