搜索_华为云

重装的包与镜像装CUDA版本不匹配 - AI开发平台ModelArts

原因分析出现该问题的可能原因如下：新安装的包与镜像中带的CUDA版本不匹配。处理方法必现的问题，使用本地Pycharm远程连接Notebook调试安装。先远程登录到所选的镜像，使用“nvcc -V”查看目前镜像自带的CUDA版本。重装torch等，需要注意选择与上一步版本相匹配的版本。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
查找Notebook实例 - AI开发平台ModelArts

子账号启动其他用户的SSH实例子账号可以看到所有用户的Notebook实例后，如果要通过SSH方式远程连接其他用户的Notebook实例，需要将SSH密钥对更新成自己的，否则会报错ModelArts.6786。更新密钥对具体操作请参见修改Notebook SSH远程连接配置。具体的错误信息提示：ModelArts

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例
自定义镜像规范 - AI开发平台ModelArts

自定义镜像规范 AI Gallery支持托管自定义镜像，但是托管的自定义镜像要满足规范才支持使用AI Gallery工具链服务（微调大师、在线推理服务）。自定义镜像的使用流程托管自定义镜像，操作步骤请参考托管模型到AI Gallery。如果自定义镜像要支持训练，则需要满足自定义镜像规范（训练）。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型 > 构建模型
给子账号配置查看所有Notebook实例的权限 - AI开发平台ModelArts

子账号启动其他用户的SSH实例子账号可以看到所有用户的Notebook实例后，如果要通过SSH方式远程连接其他用户的Notebook实例，需要将SSH密钥对更新成自己的，否则会报错ModelArts.6786。更新密钥对具体操作请参见修改Notebook SSH远程连接配置。具体的错误信息提示：ModelArts

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
OOM导致训练作业失败 - AI开发平台ModelArts

释放一些不需要的tensor，使用过的，如下： del tmp_tensor torch.cuda.empty_cache() 必现的问题，使用本地Pycharm远程连接Notebook调试超参。如果还存在问题，可能需要提工单进行定位，甚至需要隔离节点修复。建议与总结在创建训练作业前，推荐您

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
服务管理概述 - AI开发平台ModelArts

服务管理概述服务管理，包括将已创建成功的模型部署为在线服务或本地服务。可以实现在线预测、本地预测、服务详情查询、查看服务日志等功能。这里的在线服务包括“predictor”和“transformer”两类，都包括下文描述的功能，本章节以“predictor”服务为例进行说明。

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
请求超时返回Timeout - AI开发平台ModelArts

APIG（API网关）和模型。处理方法优先排查APIG（API网关）是否是通的，可以在本地使用curl命令排查，命令行：curl -kv {预测地址}。如返回Timeout则需排查本地防火墙，代理和网络配置。检查模型是否启动成功或者模型处理单个消息的时长。因APIG（API

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
在MaaS应用实践中心查看应用解决方案 - AI开发平台ModelArts

套解决方案。应用中心介绍 “MaaS应用实践中心”提供基于行业客户应用场景的AI解决方案。MaaS提供的模型服务和华为云各AI应用层构建工具之间相互连通，通过灵活的组合方案，来帮助客户快速解决模型落地应用时所面临的业务及技术挑战。 MaaS应用实践中心结合KooSearch企业

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
训练作业失败，返回错误码139 - AI开发平台ModelArts

先去排查跑通和跑不通的日志是否存在pip源更新了依赖包，如下图，安装之前跑通的老版本即可。图1 PIP安装对比图推荐您使用本地Pycharm远程连接Notebook调试。如果上述情况都解决不了，请联系技术支持工程师。建议与总结在创建训练作业前，推荐您先使用ModelAr

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
推理场景介绍 - AI开发平台ModelArts

end Snt9B。如果使用Server资源，请参考Lite Server资源开通，购买Server资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910）
删除Notebook实例 - AI开发平台ModelArts

NOTEBOOK：可以通过https协议访问Notebook。 SSH：可以通过SSH协议远程连接Notebook。 ssh_keys Array of strings SSH密钥对名称列表，允许设置多个密钥对实现同时对SSH实例的访问。 service String 访问Notebook的途径，枚举值如下：

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
TensorFlow在OBS写入TensorBoard到达5GB时停止 - AI开发平台ModelArts

保存summary可能是本地缓存，在每次触发flush时将该summary文件覆盖OBS上的原文件。当超过5GB后，由于达到了OBS单次导入文件大小的上限，导致无法继续写入。处理方法如果在运行训练作业的过程中出现该问题，建议处理方法如下：推荐使用本地缓存的方式来解决，使用如下方法：

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
推理部署使用场景 - AI开发平台ModelArts

推理能力集成到自己的IT平台，或者批量生成推理结果。图1 推理简介训练模型：可以在ModelArts服务中进行，也可以在您的本地开发环境进行，本地开发的模型需要上传到华为云OBS服务。创建模型：把模型文件和推理文件导入到ModelArts的模型仓库中，进行版本化管理，并构建为可运行的模型。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测
Hunyuan-DiT基于DevServer部署适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

镜像配套关系获取基础镜像。步骤一：检查环境请参考DevServer资源开通，购买DevServer资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。购买DevServer资源时如果无可选资源规格，需要联系华为云技术支持申请开通。当容器需要提供服务

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
停止Notebook实例 - AI开发平台ModelArts

NOTEBOOK：可以通过https协议访问Notebook。 SSH：可以通过SSH协议远程连接Notebook。 ssh_keys Array of strings SSH密钥对名称列表，允许设置多个密钥对实现同时对SSH实例的访问。 service String 访问Notebook的途径，枚举值如下：

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
使用CodeLab免费体验Notebook - AI开发平台ModelArts

进入详情页。单击“Run in ModelArts”，进入CodeLab并打开该样例。等待右上角连接成功即可运行Notebook样例。首次进入CodeLab时，会提醒先登录ModelArts控制台，由于需要进行环境准备，需要等待1~2分钟才可顺利进入开发页面，请耐心等待。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
查询Notebook实例详情 - AI开发平台ModelArts

NOTEBOOK：可以通过https协议访问Notebook。 SSH：可以通过SSH协议远程连接Notebook。 ssh_keys Array of strings SSH密钥对名称列表，允许设置多个密钥对实现同时对SSH实例的访问。 service String 访问Notebook的途径，枚举值如下：

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
启动Notebook实例 - AI开发平台ModelArts

NOTEBOOK：可以通过https协议访问Notebook。 SSH：可以通过SSH协议远程连接Notebook。 ssh_keys Array of strings SSH密钥对名称列表，允许设置多个密钥对实现同时对SSH实例的访问。 service String 访问Notebook的途径，枚举值如下：

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
发布数据 - AI开发平台ModelArts
发布数据 - AI开发平台ModelArts

如果选择本地的数据集发布，则参见表3配置数据集信息。表3 参数说明（本地上传）参数说明资产标题在AI Gallery显示的资产名称，建议按照您的目的设置。来源选择“本地上传”。单次最多支持100个文件同时上传，总大小不超过5GB。上传数据从本地文件中选择需要发布的数据集。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 发布分享
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

|──saves/qwen2-7b/sft_lora/ # 训练完成生成目录Qwen2-7B，自动生成上传代码和权重文件到工作环境使用root用户以SSH的方式登录Server。将AscendCloud代码包AscendCloud-xxx-xxx.zip上传到${workdir}目录下并解压缩

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 准备工作

总条数： 1167

上一页
1
...
18
19
20
...
59
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

重装的包与镜像装CUDA版本不匹配 - AI开发平台ModelArts

查找Notebook实例 - AI开发平台ModelArts

自定义镜像规范 - AI开发平台ModelArts

给子账号配置查看所有Notebook实例的权限 - AI开发平台ModelArts

OOM导致训练作业失败 - AI开发平台ModelArts

服务管理概述 - AI开发平台ModelArts

请求超时返回Timeout - AI开发平台ModelArts

在MaaS应用实践中心查看应用解决方案 - AI开发平台ModelArts

训练作业失败，返回错误码139 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

删除Notebook实例 - AI开发平台ModelArts

TensorFlow在OBS写入TensorBoard到达5GB时停止 - AI开发平台ModelArts

推理部署使用场景 - AI开发平台ModelArts

Hunyuan-DiT基于DevServer部署适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

停止Notebook实例 - AI开发平台ModelArts

使用CodeLab免费体验Notebook - AI开发平台ModelArts

查询Notebook实例详情 - AI开发平台ModelArts

启动Notebook实例 - AI开发平台ModelArts

发布数据 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线