搜索_华为云

Standard资源池功能介绍 - AI开发平台ModelArts

在对专属资源池有一定了解后，如果您需要创建一个自己的专属资源池，您可参考创建Standard专属资源池来进行创建。专属资源池创建成功后，可在查看Standard专属资源池详情中查看专属资源池的详细信息。如果专属资源池的规格与您的业务不符，可通过扩缩容Standard专属资源池来调整专属资源池的规格。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理
日志提示"No CUDA-capable device is detected" - AI开发平台ModelArts

配的情况。如果上述方法还出现了错误，可以去notebook里面调试打印CUDA_VISIBLE_DEVICES变量，或者用以下代码测试，查看结果是否返回的是True。 import torch torch.cuda.is_available() 建议与总结在创建训练作业前，推

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题
如何登录并上传镜像到SWR？ - AI开发平台ModelArts

com/deep-learning/tf-1.13.2:latest 图2 上传镜像完成镜像上传后，在“容器镜像服务控制台>我的镜像”页面可查看已上传的自定义镜像。 “swr.example.com/deep-learning/tf-1.13.2:latest”即为此自定义镜像的“SWR_URL”。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard镜像相关
在ModelArts自动学习中，如何进行增量训练？ - AI开发平台ModelArts

其他参数请根据界面提示填写。设置完成后，单击“确定”，即进行增量训练。系统将自动跳转至“模型训练”页面，待训练完成后，您可以在此页面中查看训练详情，如“训练精度”、“评估结果”、“训练参数”等。图1 选择增量训练版本父主题： Standard自动学习

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习
发布模型到AI Gallery - AI开发平台ModelArts

支持1~90个字符，请勿在描述中输入涉政、迷信、违禁等相关敏感词，否则发布审核无法通过。可见范围 “所有用户可见”：表示公开资产，所有用户都可以查看该资产。 “指定用户可见”：输入账号名、账号ID或用户昵称搜索并选择用户，使其可见该资产。可用范围选择是否启用“申请用户可用”。勾选

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型
训练过程中无法找到so文件 - AI开发平台ModelArts

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64 执行如下命令，查看训练环境的cuda版本，确认当前cuda版本是否支持so文件。 os.system("cat /usr/local/cuda/version

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
在MaaS体验模型服务 - AI开发平台ModelArts

1~1 默认值：1 top_k 选择在模型的输出结果中选择概率最高的前K个结果。取值范围：1~1000 默认值：20 在对话框中输入问题，查看返回结果，在线体验模型服务。图2 体验模型服务

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
管理AI Gallery镜像 - AI开发平台ModelArts

下架镜像 AI Gallery中已上架的资产支持下架操作。在AI Gallery首页，选择右上角“我的Gallery”。在“我的资产”下，查看已上架的资产。单击资产名称，进入资产详情页。在资产详情页，单击“下架”，在弹窗中单击“确定”。即可将资产下架。删除镜像当资产不使用时，支持删除，释放AI

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery镜像
发布数据集到AI Gallery - AI开发平台ModelArts

支持1~90个字符，请勿在描述中输入涉政、迷信、违禁等相关敏感词，否则发布审核无法通过。可见范围 “所有用户可见”：表示公开资产，所有用户都可以查看该资产。 “指定用户可见”：输入账号名、账号ID或用户昵称搜索并选择用户，使其可见该资产。可用范围选择是否启用“申请用户可用”。勾选

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery数据集
修复Standard专属资源池故障节点 - AI开发平台ModelArts

操作不会收取费用。单击“操作记录”可查看当前资源池替换节点的操作记录。“运行中”表示节点在替换中。替换成功后，节点列表中会显示新的节点名称。替换最长时间为24小时，超时后仍然未找到合适的资源，状态会变为“失败”。可将鼠标悬浮在图标上，查看具体失败原因。每天累计替换的次数不超

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
VS Code一键连接Notebook - AI开发平台ModelArts

选择正确的密钥文件当左下角显示如下状态时，代表实例连接成功：图10 实例连接成功当弹出如下错误时，代表实例连接失败，请关闭弹窗，并查看OUTPUT窗口的输出日志，请查看FAQ并排查失败原因。图11 实例连接失败远程调试代码在VS Code界面，上传本地代码到云端开发环境。单击“File

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过VS Code远程使用Notebook实例
使用大模型在ModelArts Standard创建模型部署在线服务 - AI开发平台ModelArts

专属资源池磁盘空间大小必须超过1T。您可以通过专属资源池详情页面，规格页签，查看专属资源池磁盘信息。当服务部署失败，提示磁盘空间不足时，请参考服务部署、启动、升级和修改时，资源不足如何处理？图2 查看专属资源池磁盘信息创建模型使用大模型创建模型，选择从对象存储服务（OBS）中导入，需满足以下参数配置：

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
ModelArts中的作业为什么一直处于等待中？ - AI开发平台ModelArts

进入到相关作业或实例上，判断是否使用了专属资源池。如判断相关作业或实例可停止，则可以停止，释放出更多的资源。单击进入专属资源池详情页面，查看作业列表。观察队头是否有其他作业在排队，如果已有作业在排队，则新建的作业需要继续等待。如果通过排查计算，发现资源确实足够，则考虑可能由于资源碎片化导致的。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard专属资源池
设置无条件自动重启 - AI开发平台ModelArts

为了避免丢失训练进度、浪费算力，开启此功能前请确认代码已适配断点续训，操作指导请参见设置断点续训练。当训练过程中触发了自动重启，则系统会记录重启信息，在训练作业详情页可以查看故障恢复详情，具体请参见训练作业重调度。开启无条件自动重启开启无条件自动重启有2种方式：控制台设置或API接口设置。控制台设置在创

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
重试/停止/运行Workflow节点 - AI开发平台ModelArts

面，单击“重试”。在重试之前您也可以前往权限管理页面修改配置，节点重试启动后新修改的配置信息可以在当前执行中立即生效。停止单击指定节点查看详情，可以对运行中的节点进行停止操作。继续运行对于单个节点中设置了需要运行中配置的参数时，节点运行会处于“等待操作”状态，用户完成相关

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 管理Workflow
创建IAM用户并授权使用MaaS - AI开发平台ModelArts

FullAccess权限。 SWR OperateAccess 必选 CES云监控授予子用户使用CES云监控服务的权限。通过CES云监控可以查看ModelArts的在线服务和对应模型负载运行状态的整体情况，并设置监控告警。 CES FullAccess 必选 SMN消息服务授予子

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 配置MaaS访问授权
训练物体检测模型 - AI开发平台ModelArts

在“物体检测”节点中，待训练状态由“运行中”变为“运行成功”，即完成模型的自动训练。图2 运行成功训练完成后，您可以单击物体检测节点上方的按钮，查看相关指标信息，如“准确率”、“评估结果”等。评估结果参数说明请参见表1。图3 模型评估报告表1 评估结果参数说明参数说明 recall：召回率

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现物体检测
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

数据集。准备镜像准备训练模型适用的容器镜像。预训练预训练介绍如何进行预训练，包括训练数据处理、超参配置、训练任务、断点续训及性能查看。微调训练 SFT全参微调介绍如何进行SFT全参微调。 LoRA微调训练介绍如何进行LoRA微调训练。父主题：主流开源大模型基于DevServer适配PyTorch

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905）
给子账号配置文件夹级的SFS Turbo访问权限 - AI开发平台ModelArts

"modelarts:notebook:create" ], modelarts:sfsId SFS Turbo的ID，在SFS Turbo详情页查看。支持填写多个ID，例如： "modelarts:sfsId": [ "0e51c7d5-d90e-475a-b5d0-ecf896da3b0d"

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
自定义镜像训练作业失败定位思路 - AI开发平台ModelArts

&& \ chmod 770 /root && \ usermod -a -G root ma-user 其他现象，可以在已有的训练故障案例查找。建议与总结用户使用自定义镜像训练作业时，建议按照训练作业自定义镜像规范制作镜像。文档中同时提供了端到端的示例供用户参考。父主题：训练作业运行失败

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败

总条数： 1784

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Standard资源池功能介绍 - AI开发平台ModelArts

日志提示"No CUDA-capable device is detected" - AI开发平台ModelArts

如何登录并上传镜像到SWR？ - AI开发平台ModelArts

在ModelArts自动学习中，如何进行增量训练？ - AI开发平台ModelArts

发布模型到AI Gallery - AI开发平台ModelArts

训练过程中无法找到so文件 - AI开发平台ModelArts

在MaaS体验模型服务 - AI开发平台ModelArts

管理AI Gallery镜像 - AI开发平台ModelArts

发布数据集到AI Gallery - AI开发平台ModelArts

修复Standard专属资源池故障节点 - AI开发平台ModelArts

VS Code一键连接Notebook - AI开发平台ModelArts

使用大模型在ModelArts Standard创建模型部署在线服务 - AI开发平台ModelArts

ModelArts中的作业为什么一直处于等待中？ - AI开发平台ModelArts

设置无条件自动重启 - AI开发平台ModelArts

重试/停止/运行Workflow节点 - AI开发平台ModelArts

创建IAM用户并授权使用MaaS - AI开发平台ModelArts

训练物体检测模型 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

给子账号配置文件夹级的SFS Turbo访问权限 - AI开发平台ModelArts

自定义镜像训练作业失败定位思路 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线