搜索_华为云

部署在线服务出现报错No CUDA runtime is found - AI开发平台ModelArts

部署在线服务出现报错No CUDA runtime is found 问题现象部署在线服务出现报错No CUDA runtime is found，using CUDA_HOME='/usr/local/cuda'。原因分析从日志报错信息No CUDA runtime is

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
ModelArts训练作业无法解析参数，日志报错 - AI开发平台ModelArts

ArgumentParser() parser.add_argument('--data_url', type=str, default=None, help='obs path of dataset') args, unparsed = parser.parse_known_args() 父主题：云上迁移适配故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
分页查询智能任务列表 - AI开发平台ModelArts

SampleLabels objects 视频在线服务推理结果。 service_id String 在线服务ID。 service_name String 在线服务名称。 service_resource String 用户绑定的在线服务资源ID。 total_sample_count

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
环境配置相关 - AI开发平台ModelArts

环境配置相关如何查看Notebook使用的cuda版本？如何打开ModelArts开发环境的Terminal功能？如何在Notebook中安装外部库？如何获取本机外网IP？如何解决“在IOS系统里打开ModelArts的Notebook，字体显示异常”的问题？ Notebook有代理吗？如何关闭？

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
人工标注图片数据 - AI开发平台ModelArts

选中的图片被自动移动至“已标注”页签，且在“未标注”和“全部”页签中，标签的信息也将随着标注步骤进行更新，如增加的标签名称、标签对应的图片数量。快速复核当前的标注作业无法实现批量复核，如果有某一样本的标签修改或者删除，只能进入到标注页面详情进行，操作繁琐。为了简化用户操作，实现此功能，用户可以批量进行标注信息的审核或者修改，提升用户效率。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过人工标注方式标注数据
简介 - AI开发平台ModelArts
简介 - AI开发平台ModelArts

昇腾迁移方案的基础上，提供了即开即用的云上集成开发环境，包含迁移所需要的算力资源和工具链，以及具体的Notebook代码运行示例和最佳实践，并对于实际的操作原理和迁移流程进行说明，包含迁移后的精度和性能验证、调试方法说明。核心概念推理业务昇腾迁移整体流程及工具链图1 推理业务昇腾迁移整体路径

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
VS Code连接开发环境失败常见问题 - AI开发平台ModelArts

"超过10分钟以上，如何解决？远程连接处于retry状态如何解决？报错“The VS Code Server failed to start”如何解决？报错“Permissions for 'x:/xxx.pem' are too open”如何解决？报错“Bad owner

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
资产识别与管理 - AI开发平台ModelArts

Gallery中的资产，AI Gallery会做统一的保存管理。对于文件类型的资产，AI Gallery会将资产保存在AI Gallery官方的OBS桶内。对于镜像类型的资产，AI Gallery会将资产保存在AI Gallery官方的SWR仓库内。对于用户提供的一些个人信息，AI

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

模型来实现对大模型输出的精确把控，不用进行强化学习，也可以准确判断和学习到使用者的偏好，最后，DPO算法还可以与其他优化算法相结合，进一步提高深度学习模型的性能。 RM奖励模型(Reward Model)：是强化学习过程中一个关键的组成部分。它的主要任务是根据给定的输入和反馈来预

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.909）
Wav2Lip基于DevServer适配PyTorch NPU训练指导（6.3.902） - AI开发平台ModelArts

将音频与图片、音频与视频进行合成时，口型能够自然。 Wav2Lip模型的输入为任意的一段视频和一段语音，输出为一段唇音同步的视频。 Wav2Lip的网络模型总体上分成三块：生成器、判别器和一个预训练好的唇音同步判别模型Pre-trained Lip-sync Expert。生成

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 数字人模型训练推理
代码运行常见错误 - AI开发平台ModelArts

代码运行常见错误 Notebook无法执行代码，如何处理？运行训练代码，出现dead kernel，并导致实例崩溃如何解决训练过程中出现的cudaCheckError错误？开发环境提示空间不足，如何解决？如何处理使用opencv.imshow造成的内核崩溃？使用Wind

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
自定义镜像故障 - AI开发平台ModelArts

pause container xxx”如何解决？镜像保存时报错“container size %dG is greater than threshold %dG”如何解决？保存镜像时报错“too many layers in your image”如何解决？镜像保存时报错“The container

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

izer和推理代码。准备数据准备训练数据，可以用本案使用的数据集，也可以使用自己准备的数据集。准备镜像准备训练模型适用的容器镜像。预训练预训练介绍如何进行预训练，包括训练数据处理、超参配置、训练任务、断点续训及性能查看。微调训练 SFT全参微调介绍如何进行SFT全参微调。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905）
使用SFS盘出现报错rpc_check_timeout:939 callbacks suppressed - AI开发平台ModelArts

callbacks suppressed 问题现象弹性文件服务（Scalable File Service，SFS）提供按需扩展的高性能文件存储（NAS），可以在裸金属服务器中通过网络协议挂载使用，SFS支持NFS和CIFS的网络协议。在使用裸金属服务器时，将数据放在SFS盘中，并发建立多个

 帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
日志提示"Permission denied" - AI开发平台ModelArts

denied: '/xxx/xxxx' 上传数据时文件所属与文件权限未修改，导致训练作业以work用户组访问时没有权限了。在代码目录中的.sh复制到容器之后，需要添加“x”可执行权限。 bash: /bin/ln: Permission denied 因安全问题，不支持用户开通使用In命令。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 权限问题
Wav2Lip训练基于DevServer适配PyTorch NPU训练指导（6.3.907） - AI开发平台ModelArts

推荐使用“西南-贵阳一”Region上的DevServer资源和Ascend Snt9B单机单卡。表1 环境要求名称版本 driver 23.0.6 PyTorch pytorch_2.1.0 获取软件和镜像表2 获取软件和镜像分类名称获取路径插件代码包 AscendCloud-6

帮助中心 > AI开发平台ModelArts > 最佳实践 > 数字人模型训练推理
Standard模型训练 - AI开发平台ModelArts

Standard模型训练使用ModelArts Standard自定义算法实现手写数字识别基于ModelArts Standard运行GPU训练任务

 帮助中心 > AI开发平台ModelArts > 最佳实践
Lite Cluster使用流程 - AI开发平台ModelArts

群托管服务，支持容器化应用的全生命周期管理，为您提供高度可扩展的、高性能的云原生应用部署和管理方案。CCE官网文档可参考云容器引擎。 BMS 裸金属服务器（Bare Metal Server）是一款兼具虚拟机弹性和物理机性能的计算类服务，为您和您的企业提供专属的云上物理服务器，为

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster使用前必读
（可选）本地安装ma-cli - AI开发平台ModelArts

（可选）本地安装ma-cli 使用场景本文以Windows系统为例，介绍如何在Windows环境中安装ma-cli。 Step1：安装ModelArts SDK 参考本地安装ModelArts SDK完成SDK的安装。 Step2：下载ma-cli 下载ma-cli软件包。完成软件包签名校验。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
自定义镜像训练作业失败定位思路 - AI开发平台ModelArts

义镜像，具体请参见使用ModelArts的基础镜像构建新的训练镜像。如镜像来源于第三方，设法找到自定义镜像的制作者咨询，制作者一般对镜像如何使用更加了解。确定自定义镜像大小自定义镜像的大小推荐15GB以内，最大不要超过资源池的容器引擎空间大小的一半。镜像过大会直接影响训练作业的启动时间。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败

总条数： 1962

上一页
1
...
63
64
65
...
99
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

部署在线服务出现报错No CUDA runtime is found - AI开发平台ModelArts

ModelArts训练作业无法解析参数，日志报错 - AI开发平台ModelArts

分页查询智能任务列表 - AI开发平台ModelArts

环境配置相关 - AI开发平台ModelArts

人工标注图片数据 - AI开发平台ModelArts

简介 - AI开发平台ModelArts

VS Code连接开发环境失败常见问题 - AI开发平台ModelArts

资产识别与管理 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

Wav2Lip基于DevServer适配PyTorch NPU训练指导（6.3.902） - AI开发平台ModelArts

代码运行常见错误 - AI开发平台ModelArts

自定义镜像故障 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

使用SFS盘出现报错rpc_check_timeout:939 callbacks suppressed - AI开发平台ModelArts

日志提示"Permission denied" - AI开发平台ModelArts

Wav2Lip训练基于DevServer适配PyTorch NPU训练指导（6.3.907） - AI开发平台ModelArts

Standard模型训练 - AI开发平台ModelArts

Lite Cluster使用流程 - AI开发平台ModelArts

（可选）本地安装ma-cli - AI开发平台ModelArts

自定义镜像训练作业失败定位思路 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线