搜索_华为云

显存溢出错误 - AI开发平台ModelArts

max_split_size_mb to avoid fragmentation. 解决方法：通过npu-smi info查看是否有进程资源占用NPU，导致训练时显存不足。解决可通过kill掉残留的进程或等待资源释放。父主题：常见错误原因和解决方法

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 常见错误原因和解决方法
分离部署推理服务 - AI开发平台ModelArts

关，--port表示服务部署的端口。每个全量/增量推理实例基于配置的端口号(--port)启动服务，并按照global rank_table中的全量实例、增量实例的顺序，对全量推理实例、增量推理实例启动的端口号进行排序，端口之间用`,`分隔开作为该环境变量的输入。当前端口9000

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 部署推理服务
或者'Port forwarding is disabled.”如何解决？ - AI开发平台ModelArts

${User}@${HostName} -p ${Port} 参数说明： - IdentityFile：本地密钥路径 - User：用户名，例如：ma-user - HostName：IP地址 - Port：端口号在VS Code中手工配置远程连接时，在本地的ssh config文件中增加配置

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
PD分离部署使用说明 - AI开发平台ModelArts

关，--port表示服务部署的端口。每个全量/增量推理实例基于配置的端口号(--port)启动服务，并按照global rank_table中的全量实例、增量实例的顺序，对全量推理实例、增量推理实例启动的端口号进行排序，端口之间用`,`分隔开作为该环境变量的输入。当前端口9000

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 分离部署
分离部署推理服务 - AI开发平台ModelArts

关，--port表示服务部署的端口。每个全量/增量推理实例基于配置的端口号(--port)启动服务，并按照global rank_table中的全量实例、增量实例的顺序，对全量推理实例、增量推理实例启动的端口号进行排序，端口之间用`,`分隔开作为该环境变量的输入。当前端口9000

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908） > 部署推理服务
查询Workflow待办事项 - AI开发平台ModelArts

），并且以英文开头的名称。 execution_id String 工作流执行ID。 step_name String 节点名称。 step_title String 节点的Title。 status String 状态。请求示例查看Workflow工作流的待办事项。 GET

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
在ECS中通过Dockerfile从0制作自定义镜像用于推理 - AI开发平台ModelArts

容器调用接口：指定模型启动的协议和端口号。请确保协议和端口号与自定义镜像中提供的协议和端口号保持一致。镜像复制：选填，选择是否将容器镜像中的模型镜像复制到ModelArts中。健康检查：选填，用于指定模型的健康检查。仅当自定义镜像中配置了健康检查接口，才能配置“健康检查”，否则会导致模型创建失败。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
查询预置算法 - AI开发平台ModelArts

请求消息请求参数如表2所示。表2 查询检索参数参数是否必选参数类型说明 per_page 否 Integer 指定每一页展示作业参数的总量，默认为10，“per_page”可选的范围为[1，100]。 page 否 Integer 指定要查询页的索引，默认为1。 sortBy

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
认证证书 - AI开发平台ModelArts
认证证书 - AI开发平台ModelArts

合规证书华为云服务及平台通过了多项国内外权威机构（ISO/SOC/PCI等）的安全合规认证，用户可自行申请下载合规资质证书。图1 合规证书下载资源中心华为云还提供以下资源来帮助用户满足合规性要求，具体请查看资源中心。图2 资源中心销售许可证&软件著作权证书另外，华为云还提

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
创建Notebook文件后，右上角的Kernel状态为“No Kernel”如何处理？ - AI开发平台ModelArts

code文件名称冲突。解决方案查看“/home/ma-user/log/”下以“kernelgateway”开头的最新日志文件，搜索“Starting kernel”附近的日志。如果看到如下类似的堆栈，可看到是因为用户工作目录下的“code.py”和创建kernel依赖的import code文件名冲突：

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 代码运行故障
推理精度测试 - AI开发平台ModelArts

output_path: 要保存的结果路径。 Step2 查看精度测试结果默认情况下，评测结果会按照result/{model_name}/的目录结果保存到对应的测试工程。执行多少次，则会在{model_name}下生成多少次结果。benchmark_eval下生成的log中记录了客户端产

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
显存溢出错误 - AI开发平台ModelArts

max_split_size_mb to avoid fragmentation. 解决方法：通过npu-smi info查看是否有进程资源占用NPU，导致训练时显存不足。解决可通过kill掉残留的进程或等待资源释放。父主题：常见错误原因和解决方法

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912） > 常见错误原因和解决方法
从0-1制作自定义镜像并创建模型 - AI开发平台ModelArts

容器调用接口：指定模型启动的协议和端口号。请确保协议和端口号与自定义镜像中提供的协议和端口号保持一致。镜像复制：选填，选择是否将容器镜像中的模型镜像复制到ModelArts中。健康检查：选填，用于指定模型的健康检查。仅当自定义镜像中配置了健康检查接口，才能配置“健康检查”，否则会导致模型创建失败。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
查询训练作业参数详情 - AI开发平台ModelArts

String 自定义镜像训练作业的自定义镜像的SWR-URL。 user_command String 自定义镜像训练作业的自定义镜像的容器的启动命令。 spec_code String 训练作业资源规格。 gpu_type String 资源规格gpu的类型。 create_time

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业参数配置
开发环境的应用示例 - AI开发平台ModelArts

开发环境的应用示例本节通过调用一系列API，以创建开发环境实例为例介绍ModelArts API的使用流程。概述创建开发环境实例的流程如下：调用认证鉴权接口获取用户Token，在后续的请求中需要将Token放到请求消息头中作为认证。调用查询支持的镜像列表接口查看开发环境的镜像类型和版本。

帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
推理精度测试 - AI开发平台ModelArts

output_path: 要保存的结果路径。 Step2 查看精度测试结果默认情况下，评测结果会按照result/{model_name}/的目录结果保存到对应的测试工程。执行多少次，则会在{model_name}下生成多少次结果。benchmark_eval下生成的log中记录了客户端产

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906）
如何在ModelArts训练作业中加载部分训练好的参数？ - AI开发平台ModelArts

如何在ModelArts训练作业中加载部分训练好的参数？在训练作业时，需要从预训练的模型中加载部分参数，初始化当前模型。请您通过如下方式加载：通过如下代码，您可以查看所有的参数。 from moxing.tensorflow.utils.hyper_param_flags import

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
ma-cli image镜像构建支持的命令 - AI开发平台ModelArts

显示详细的信息开关，默认关闭。 -i / --image-id String 否查询指定镜像ID的镜像详情。 -n / --image-name String 否查询指定镜像名称的镜像详情。 -wi / --workspace-id String 否查询指定工作空间下的镜像信息。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
查询训练作业版本详情 - AI开发平台ModelArts

训练作业的系统监控指标。具体请参见表6。 user_image_url String 自定义镜像训练作业的自定义镜像的SWR-URL。 user_command String 自定义镜像训练作业的自定义镜像的容器的启动命令。 resource_id String 训练作业的计费资源ID。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
预置框架启动文件的启动流程说明 - AI开发平台ModelArts

适配加速芯片Ascend的一组AI框架+运行环境+启动方式的集合。由于主流的Snt9系列Ascend加速卡都跑在ARM CPU规格的机器上，因此上层docker镜像也都是ARM镜像。相对于GPU场景的镜像中安装了与GPU驱动适配的CUDA（由英伟达推出的统一计算架构）计算库，A

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 准备模型训练代码

总条数： 1354

上一页
1
...
7
8
9
...
68
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

显存溢出错误 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

或者'Port forwarding is disabled.”如何解决？ - AI开发平台ModelArts

PD分离部署使用说明 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

查询Workflow待办事项 - AI开发平台ModelArts

在ECS中通过Dockerfile从0制作自定义镜像用于推理 - AI开发平台ModelArts

查询预置算法 - AI开发平台ModelArts

认证证书 - AI开发平台ModelArts

创建Notebook文件后，右上角的Kernel状态为“No Kernel”如何处理？ - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

显存溢出错误 - AI开发平台ModelArts

从0-1制作自定义镜像并创建模型 - AI开发平台ModelArts

查询训练作业参数详情 - AI开发平台ModelArts

开发环境的应用示例 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

如何在ModelArts训练作业中加载部分训练好的参数？ - AI开发平台ModelArts

ma-cli image镜像构建支持的命令 - AI开发平台ModelArts

查询训练作业版本详情 - AI开发平台ModelArts

预置框架启动文件的启动流程说明 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线