搜索_华为云

显存溢出错误 - AI开发平台ModelArts

setting max_split_size_mb to avoid fragmentation. 解决方法：通过npu-smi info查看是否有进程资源占用NPU，导致训练时显存不足。解决可通过kill掉残留的进程或等待资源释放。可调整参数：TP张量并行（tensor-model-parallel-size）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.911） > 常见错误原因和解决方法
显存溢出错误 - AI开发平台ModelArts

setting max_split_size_mb to avoid fragmentation. 解决方法：通过npu-smi info查看是否有进程资源占用NPU，导致训练时显存不足。解决可通过kill掉残留的进程或等待资源释放。可调整参数：TP张量并行（tensor-model-parallel-size）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.908） > 常见错误原因和解决方法
显存溢出错误 - AI开发平台ModelArts

setting max_split_size_mb to avoid fragmentation. 解决方法：通过npu-smi info查看是否有进程资源占用NPU，导致训练时显存不足。解决可通过kill掉残留的进程或等待资源释放。可调整参数：TP张量并行（tensor-model-parallel-size）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.909） > 常见错误原因和解决方法
显存溢出错误 - AI开发平台ModelArts

setting max_split_size_mb to avoid fragmentation. 解决方法：通过npu-smi info查看是否有进程资源占用NPU，导致训练时显存不足。解决可通过kill掉残留的进程或等待资源释放。可调整参数：TP张量并行（tensor-model-parallel-size）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.911） > 常见错误原因和解决方法
显存溢出错误 - AI开发平台ModelArts

setting max_split_size_mb to avoid fragmentation. 解决方法通过npu-smi info查看是否有进程资源占用NPU，导致训练时显存不足。解决可通过kill掉残留的进程或等待资源释放。可调整参数：TP张量并行（tensor-model-parallel-size）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.911） > 常见错误原因和解决方法
训练作业是否支持定时或周期调用？ - AI开发平台ModelArts

训练作业是否支持定时或周期调用？ ModelArts训练作业不支持定时周期化调用。当您的作业处于“运行中”状态时，可以按照业务需求进行调用。父主题：管理训练作业版本

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 管理训练作业版本
自动学习训练后的模型是否可以下载？ - AI开发平台ModelArts

自动学习训练后的模型是否可以下载？不可以下载。但是您可以在AI应用管理页面查看，或者将此模型部署为在线服务。父主题：模型训练

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习 > 模型训练
ModelArts中提示OBS路径错误 - AI开发平台ModelArts

比对您创建的OBS桶所在区域与ModelArts所在区域是否一致。务必保证OBS桶与ModelArts所在区域一致。检查您的账号是否有该OBS桶的访问权限如果在使用Notebook时，需要访问其他账号的OBS桶，请查看您的账号是否有该OBS桶的访问权限。如没有权限，请参见在Note

帮助中心 > AI开发平台ModelArts > 故障排除 > 通用问题
JupyterLab中文件保存失败，如何解决？ - AI开发平台ModelArts

浏览器安装了第三方插件proxy进行了拦截，导致无法进行保存。在Notebook中的运行文件超过指定大小就会提示此报错。 jupyter页面打开时间太长。网络环境原因，是否有连接网络代理。解决方法关掉插件然后重新保存。减少文件大小。重新打开jupyter页面。请检查网络。父主题：环境配置故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 环境配置故障
将AI Gallery中的模型部署为AI应用 - AI开发平台ModelArts

选择计算规格不可用的资源会置灰。右侧“配置信息”区域会显示计算规格的详细数据，AI Gallery会基于资产和资源情况分析该任务是否支持设置“商品数量”，用户可以基于业务需要选择任务所需的资源卡数。在“运行时长控制”选择是否指定运行时长。不限时长：不限制作业的运行时长，AI Gallery工具链服务部署完成后将一直处于“运行中”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery中的AI应用
JupyterLab中文件保存失败，如何解决？ - AI开发平台ModelArts

浏览器安装了第三方插件proxy进行了拦截，导致无法进行保存。在Notebook中的运行文件超过指定大小就会提示此报错。 jupyter页面打开时间太长。网络环境原因，是否有连接网络代理。解决方法关掉插件然后重新保存。减少文件大小。重新打开jupyter页面。请检查网络。父主题：代码运行常见错误

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 代码运行常见错误
查询数据处理任务的版本详情 - AI开发平台ModelArts

描述 add_sample_count Integer 处理后新增的图片数量。 create_time Long 数据处理任务的创建时间。 deleted_sample_count Integer 处理后删除的图片数量。 description String 数据处理任务的版本描述。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
管理Workflow Execution - AI开发平台ModelArts

需要的数据。表3 ExecutionActionPolicy 参数是否必选参数类型描述 rerun_steps 否 Array of strings 重跑的节点。表4 WorkflowParameter 参数是否必选参数类型描述 name 否 String Workflo

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
精度问题诊断 - AI开发平台ModelArts

精度问题诊断逐个替换模型，检测有问题的模型该方式主要是通过模型替换，先定位出具体哪个模型引入的误差，进一步诊断具体的模型中哪个算子或者操作导致效果问题，模型替换原理如下图所示。通过设置开关选项（是否使用onnx模型），控制模型推理时，模型使用的是onnx模型或是mindir的模型。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 模型精度调优
标注多个标签，是否可针对一个标签进行识别？ - AI开发平台ModelArts

标注多个标签，是否可针对一个标签进行识别？数据标注时若标注多个标签进行训练而成的模型，最后部署成在线服务之后也是对标注的多个标签去进行识别的。如果只需要快速识别一种标签，建议单独训练识别此标签的模型使用，并选择较大的部署上线的规格也可以提供识别速度。父主题： Standard数据管理

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据管理
数据保护技术 - AI开发平台ModelArts

加安全的HTTPS协议。数据完整性检查推理部署功能模块涉及到的用户模型文件和发布到AIGallery的资产在上传过程中，有可能会因为网络劫持、数据缓存等原因，存在数据不一致的问题。ModelArts提供通过计算SHA256值的方式对上传下载的数据进行一致性校验。数据隔离机制

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
部署物体检测服务 - AI开发平台ModelArts

模型部署完成后，“服务部署”节点，单击“实例详情”按钮，进入服务预测界面，在“预测”页签单击“上传”，选择本地图片进行测试。单击“预测”进行测试，预测完成后，右侧“预测结果”区域输出结果。如模型准确率不满足预期，可在“数据标注”页签中添加图片并进行标注，重新进行模型训练及模型部署。预测结果中的参数说明请参见表1。如

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现物体检测
管理Lite Cluster资源池 - AI开发平台ModelArts

调度延迟，适用于对CPU缓存和调度延迟敏感的场景。关闭绑核表示关闭工作负载实例独占CPU的功能，优点是CPU共享池可分配的核数较多。也可关闭系统默认绑核后，在业务容器中用taskset等方式进行灵活绑核。 Dropcache：开启后表示启用Linux的缓存清理功能，是一种应用性能

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
训练作业如何调用shell脚本，是否可以执行.sh文件？ - AI开发平台ModelArts

训练作业如何调用shell脚本，是否可以执行.sh文件？ ModelArts支持调用shell脚本，可以使用python调用“.sh”。具体操作步骤如下：上传“.sh”脚本至OBS桶，例如“.sh”所在存储位置为 “ /bucket-name/code/test.sh”。在本地创建“

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 编写训练代码
查询数据处理任务的版本列表 - AI开发平台ModelArts

ersions 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 task_id 是 String 数据处理任务ID。表2 Query参数参数是否必选参数类型描述 limit 否 Integer

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）

总条数： 1156

上一页
1
...
10
11
12
...
58
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

显存溢出错误 - AI开发平台ModelArts

显存溢出错误 - AI开发平台ModelArts

显存溢出错误 - AI开发平台ModelArts

显存溢出错误 - AI开发平台ModelArts

显存溢出错误 - AI开发平台ModelArts

训练作业是否支持定时或周期调用？ - AI开发平台ModelArts

自动学习训练后的模型是否可以下载？ - AI开发平台ModelArts

ModelArts中提示OBS路径错误 - AI开发平台ModelArts

JupyterLab中文件保存失败，如何解决？ - AI开发平台ModelArts

将AI Gallery中的模型部署为AI应用 - AI开发平台ModelArts

JupyterLab中文件保存失败，如何解决？ - AI开发平台ModelArts

查询数据处理任务的版本详情 - AI开发平台ModelArts

管理Workflow Execution - AI开发平台ModelArts

精度问题诊断 - AI开发平台ModelArts

标注多个标签，是否可针对一个标签进行识别？ - AI开发平台ModelArts

数据保护技术 - AI开发平台ModelArts

部署物体检测服务 - AI开发平台ModelArts

管理Lite Cluster资源池 - AI开发平台ModelArts

训练作业如何调用shell脚本，是否可以执行.sh文件？ - AI开发平台ModelArts

查询数据处理任务的版本列表 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线