搜索_华为云

工作负载Pod异常 - AI开发平台ModelArts

${pod_name} volcano资源调度失败当volcano的资源出现争抢时，会出现下图中的问题。解决方法：通过打印所有Pod的信息，并找到命名有scheduler字段的Pod。 kubectl get pod -A -o wide 重启该Pod，通过delete的方式删除，但随后会自动重新启动。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.909） > 常见错误原因和解决方法
附录：大模型推理常见问题 - AI开发平台ModelArts

附录：大模型推理常见问题问题1：在推理预测过程中遇到NPU out of memory。解决方法：调整推理服务启动时的显存利用率，将--gpu-memory-utilization的值调小。问题2：在推理预测过程中遇到ValueError:User-specified max_model_len

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）
附录：大模型推理常见问题 - AI开发平台ModelArts

附录：大模型推理常见问题问题1：在推理预测过程中遇到NPU out of memory。解决方法：调整推理服务启动时的显存利用率，将--gpu-memory-utilization的值调小。问题2：在推理预测过程中遇到ValueError:User-specified max_model_len

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908）
附录：Standard大模型推理常见问题 - AI开发平台ModelArts

附录：Standard大模型推理常见问题问题1：在推理预测过程中遇到NPU out of memory。解决方法：调整推理服务启动时的显存利用率，将--gpu-memory-utilization的值调小。问题2：在推理预测过程中遇到ValueError:User-specified

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
查询作业引擎规格 - AI开发平台ModelArts

查询作业引擎规格功能介绍查看指定作业的引擎类型和版本。创建训练作业和预测作业需要指定引擎规格。 URI GET /v1/{project_id}/job/ai-engines 参数说明如表1所示。表1 参数说明参数是否必选参数类型说明 project_id 是 String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 资源和引擎规格接口
Lite Server - AI开发平台ModelArts
Lite Server - AI开发平台ModelArts

04内核自动升级？哪里可以了解Atlas800训练服务器硬件相关内容使用GPU A系列裸金属服务器有哪些注意事项？ GPU A系列裸金属服务器如何更换NVIDIA和CUDA？

帮助中心 > AI开发平台ModelArts > 常见问题
出现“save error”错误，可以运行代码，但是无法保存 - AI开发平台ModelArts

save error”错误。大多数原因是华为云WAF安全拦截导致的。当前页面，即用户的输入或者代码运行的输出有一些字符被华为云拦截，认为有安全风险。出现此问题时，请提交工单，联系专业的工程师帮您核对并处理问题。父主题：实例故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 实例故障
【下线公告】华为云ModelArts算法套件下线公告 - AI开发平台ModelArts

【下线公告】华为云ModelArts算法套件下线公告华为云ModelArts服务算法套件将在2024年6月30日00:00（北京时间）正式退市。下线范围下线Region：华为云全部Region。下线影响正式下线后，ModelArts Notebook中将不会预置算法套件

 帮助中心 > AI开发平台ModelArts > 服务公告 > 下线公告
Lite Server高危操作一览表 - AI开发平台ModelArts

如果升级/修改操作系统内核或者驱动，很可能导致驱动和内核版本不兼容，从而导致OS无法启动，或者基本功能不可用。相关高危命令如：apt-get upgrade。高如果需要升级/修改，请联系华为云技术支持。切换或者重置操作系统。服务器在进行过“切换或者重置操作系统”操作后，EVS系统盘ID发生变化，和下单时订单中的EVS

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server使用前必读
附录：大模型推理常见问题 - AI开发平台ModelArts

附录：大模型推理常见问题问题1：在推理预测过程中遇到NPU out of memory。解决方法：调整推理服务启动时的显存利用率，将--gpu-memory-utilization的值调小。问题2：在推理预测过程中遇到ValueError:User-specified max_model_len

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910）
升级Standard专属资源池驱动 - AI开发平台ModelArts

会有自定义GPU/Ascend驱动的需求，ModelArts面向此类客户提供了自助升级专属资源池GPU/Ascend驱动的能力。驱动升级有两种升级方式：安全升级、强制升级。安全升级：不影响正在运行的业务，开始升级后会先将节点进行隔离（不能再下发新的作业），待节点上的存量作业运

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
升级Lite Cluster资源池驱动 - AI开发平台ModelArts

会有自定义GPU/Ascend驱动的需求，ModelArts面向此类客户提供了自助升级专属资源池GPU/Ascend驱动的能力。驱动升级有两种升级方式：安全升级、强制升级。安全升级：不影响正在运行的业务，开始升级后会先将节点进行隔离（不能再下发新的作业），待节点上的存量作业运

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
报名实践活动（实践） - AI开发平台ModelArts

Gallery中，可以报名参加正在进行中的实践活动。查找实践活动进入AI Gallery首页，单击“实践”，在下拉框中单击“实践 >”，进入实践首页。在实践页面，有“进行中”、“即将开始”和“已结束”三种状态的实践活动筛选方式。图1 查找实践活动单击右上方的“我的实践”可以跳转到个人中心（“我的Gallery

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 参加活动
【下线公告】华为云ModelArts自动学习下线公告 - AI开发平台ModelArts

正式下线后，所有用户将无法使用自动学习模块创建项目，但仍可在Workflow模块查看、使用历史创建的自动学习作业。如您有任何问题，可随时通过工单或者服务热线（+86-4000-955-988或+86-950808）与我们联系。父主题：下线公告

 帮助中心 > AI开发平台ModelArts > 服务公告 > 下线公告
附录：大模型推理常见问题 - AI开发平台ModelArts

附录：大模型推理常见问题问题1：在推理预测过程中遇到NPU out of memory。解决方法：调整推理服务启动时的显存利用率，将--gpu-memory-utilization的值调小。问题2：在推理预测过程中遇到ValueError:User-specified max_model_len

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909）
附录：大模型推理常见问题 - AI开发平台ModelArts

附录：大模型推理常见问题问题1：在推理预测过程中遇到NPU out of memory。解决方法：调整推理服务启动时的显存利用率，将--gpu-memory-utilization的值调小。问题2：在推理预测过程中遇到ValueError:User-specified max_model_len

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
（可选）本地服务器安装ModelArts SDK - AI开发平台ModelArts

服务。 ModelArts SDK使用限制本地ModelArts SDK不支持进行训练作业调测、模型调试和在开发环境中部署本地服务进行调试，当前仅支持在开发环境Notebook中调试。本地安装ModelArts SDK步骤在本地安装ModelArts SDK，具体的配置步骤如下：

帮助中心 > AI开发平台ModelArts > SDK参考
使用kv-cache-int8量化 - AI开发平台ModelArts

3fn"。dtype类型不影响int8的scale系数的抽取和加载。 Step3 启动kv-cache-int8量化服务参考Step3 启动推理服务，启动推理服务时添加如下命令。 --kv-cache-dtype int8 #只支持int8，表示kvint8量化 --quantization-param-path

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
续费概述 - AI开发平台ModelArts
续费概述 - AI开发平台ModelArts

专属资源池在到期前续费成功，所有资源得以保留，且ModelArts使用不受影响。专属资源池到期后的状态说明，请参见到期后影响。续费相关的功能包年/包月专属资源池续费相关的功能如表1所示。表1 续费相关的功能功能说明手动续费包年/包月专属资源池从购买到被自动删除之前，您可以随时在ModelArts控制台为

 帮助中心 > AI开发平台ModelArts > 计费说明 > 续费
使用kv-cache-int8量化 - AI开发平台ModelArts

3fn"。dtype类型不影响int8的scale系数的抽取和加载。 Step3 启动kv-cache-int8量化服务参考Step3 启动推理服务，启动推理服务时添加如下命令。 --kv-cache-dtype int8 #只支持int8，表示kvint8量化 --quantization-param-path

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908） > 推理模型量化

总条数： 2227

上一页
1
...
82
83
84
...
112
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

工作负载Pod异常 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

附录：Standard大模型推理常见问题 - AI开发平台ModelArts

查询作业引擎规格 - AI开发平台ModelArts

Lite Server - AI开发平台ModelArts

出现“save error”错误，可以运行代码，但是无法保存 - AI开发平台ModelArts

【下线公告】华为云ModelArts算法套件下线公告 - AI开发平台ModelArts

Lite Server高危操作一览表 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

升级Standard专属资源池驱动 - AI开发平台ModelArts

升级Lite Cluster资源池驱动 - AI开发平台ModelArts

报名实践活动（实践） - AI开发平台ModelArts

【下线公告】华为云ModelArts自动学习下线公告 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

（可选）本地服务器安装ModelArts SDK - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

续费概述 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线