搜索_华为云

服务启动失败 - AI开发平台ModelArts

健康检查配置有问题镜像如果配置了健康检查，服务启动失败，从以下两个方面进行排查：健康检查端口是否可以正常工作自定义镜像中配置了健康检查，需要在测试镜像时，同步测试健康检查接口是否可以正常工作，具体参考从0-1制作自定义镜像并创建AI应用中的本地验证镜像方法。创建模型界面上配置的健康检查地址与实际配置的是否一致

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
上传远端文件至JupyterLab - AI开发平台ModelArts

图3 输入有效的远端文件URL 图4 远端文件上传成功异常处理远端文件上传失败。可能是网络原因。请先在浏览器中输入该远端文件的URL地址，测试该文件是否能下载。图5 远端文件上传失败父主题：上传文件至JupyterLab

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发 > 上传文件至JupyterLab
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

关闭详细日志命令： unset DETAIL_TIME_LOG 配置后重启推理服务生效。 Step7 推理性能和精度测试推理性能和精度测试操作请参见推理性能测试和推理精度测试。附录：基于vLLM（v0.3.2）不同模型推理支持的max-model-len长度说明基于vLLM（v0

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
AI CPU算子替换样例 - AI开发平台ModelArts

当前PyTorch支持的dtype类型如下，详见Link。图1 PyTorch支持的dtype 基于此对常见的算子如MUL、EQUAL、TENSOREQUAL等做单算子测试，看有哪些类型的算子是执行在AICPU上的，然后尝试转换到支持AICORE单元的类型dtype上计算，实现效率提升的目的。 MUL 图2 Mul

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > MA-Advisor自动诊断工具使用指导
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

--test_count=3 (随机选择 3个数据作为测试集) user_id: 用户的唯一不重复的ID值，必选。 excel_addr: 待处理的excel文件的地址，必选。 dataset_name: 处理后的数据集名称，必选。 proportion: 测试集所占份数，范围[1,9]，可选。 test_count:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.909） > 准备工作
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

--test_count=3 (随机选择 3个数据作为测试集) user_id: 用户的唯一不重复的ID值，必选。 excel_addr: 待处理的excel文件的地址，必选。 dataset_name: 处理后的数据集名称，必选。 proportion: 测试集所占份数，范围[1,9]，可选。 test_count:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.910） > 准备工作
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

--test_count=3 (随机选择 3个数据作为测试集) user_id: 用户的唯一不重复的ID值，必选。 excel_addr: 待处理的excel文件的地址，必选。 dataset_name: 处理后的数据集名称，必选。 proportion: 测试集所占份数，范围[1,9]，可选。 test_count:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.908） > 准备工作
AIGC工具tailor使用指导 - AI开发平台ModelArts

具体功能模型转换固定shape转模型动态shape传入指定档位转模型支持fp32 支持AOE优化 benchmark 支持测试性能支持精度测试 profiling 支持分析算子的profiling 环境准备本工具支持x86和ARM的系统环境，使用前需要安装以下软件。表2

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
GPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

2a1 -j 8 编译时需要加上MPI=1的参数，否则无法进行多机之间的测试。 MPI路径版本需要匹配，可以通过“ls /usr/mpi/gcc/”查看openmpi的具体版本。 nccl-test测试。单机测试： /root/nccl-tests/build/all_reduce_perf

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置 > 配置Lite Server软件环境
推理部署使用场景 - AI开发平台ModelArts

部署服务：模型构建完成后，根据您的业务场景，选择将模型部署成对应的服务类型。将模型部署为实时推理作业将模型部署为一个Web Service，并且提供在线的测试UI与监控功能，部署成功的在线服务，将为用户提供一个可调用的API。将模型部署为批量推理服务批量服务可对批量数据进行推理，完成数据处理后自动停止。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测
部署模型为在线服务 - AI开发平台ModelArts

在线服务的“状态”变为“运行中”时，表示服务部署完成。使用预测功能测试在线服务模型部署为在线服务成功后，您可以在“预测”页签进行代码调试或添加文件测试。根据模型定义的输入请求不同（JSON文本或文件），测试服务包括如下两种方式： JSON文本预测：如当前部署服务的模型，其输入

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

--test_count=3 (随机选择 3个数据作为测试集) user_id: 用户的唯一不重复的ID值，必选。 excel_addr: 待处理的excel文件的地址，必选。 dataset_name: 处理后的数据集名称，必选。 proportion: 测试集所占份数，范围[1,9]，可选。 test_count:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

\"crossbow\"], \"type\": \"string\"}}}" }' Step5 推理性能和精度测试推理性能和精度测试操作请参见推理性能测试和推理精度测试。父主题：主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
简介 - AI开发平台ModelArts
简介 - AI开发平台ModelArts

模型编排。模型裁剪。精度校验。精度对比误差统计工具。自动化精度对比工具。网络结构可视化工具。性能调优。性能测试。性能调优三板斧。性能分析与诊断。迁移测试报告。推理迁移验收表。 ModelArts开发环境 ModelArts作为华为云上的AI开发平台，提供交互式云上

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

--test_count=3 (随机选择 3个数据作为测试集) user_id: 用户的唯一不重复的ID值，必选。 excel_addr: 待处理的excel文件的地址，必选。 dataset_name: 处理后的数据集名称，必选。 proportion: 测试集所占份数，范围[1,9]，可选。 test_count:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.911） > 准备工作
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

--test_count=3 (随机选择 3个数据作为测试集) user_id: 用户的唯一不重复的ID值，必选。 excel_addr: 待处理的excel文件的地址，必选。 dataset_name: 处理后的数据集名称，必选。 proportion: 测试集所占份数，范围[1,9]，可选。 test_count:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.911） > 准备工作
克隆GitHub开源仓库文件到JupyterLab - AI开发平台ModelArts

al中通过执行git clone https://github.com/jupyterlab/extension-examples.git测试网络连通情况。图6 Clone仓库失败如果克隆时遇到Notebook当前目录下已有该仓库，系统给出提示仓库名称重复，此时可以单击“覆盖”继续克隆仓库，也可以单击取消。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发 > 上传文件至JupyterLab
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

"top_k": -1 "use_beam_search":true "best_of":2 Step5 推理性能和精度测试推理性能和精度测试操作请参见推理性能测试和推理精度测试。父主题：主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
Standard模型部署 - AI开发平台ModelArts

供了一整套安全可靠的一站式部署方式。图1 部署模型的流程在线推理服务，可以实现高并发，低延时，弹性伸缩，并且支持多模型灰度发布、A/B测试。支持各种部署场景，既能部署为云端的在线推理服务和批量推理任务，也能部署到端，边等各种设备。一键部署，可以直接推送部署到边缘设备中，选择智能边缘节点，推送模型。

帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
日志提示"No CUDA-capable device is detected" - AI开发平台ModelArts

D不匹配的情况。如果上述方法还出现了错误，可以去notebook里面调试打印CUDA_VISIBLE_DEVICES变量，或者用以下代码测试，查看结果是否返回的是True。 import torch torch.cuda.is_available() 建议与总结在创建训练作业

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题

总条数： 262

上一页
1
...
6
7
8
...
14
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

服务启动失败 - AI开发平台ModelArts

上传远端文件至JupyterLab - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

AI CPU算子替换样例 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

AIGC工具tailor使用指导 - AI开发平台ModelArts

GPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

推理部署使用场景 - AI开发平台ModelArts

部署模型为在线服务 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

简介 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

克隆GitHub开源仓库文件到JupyterLab - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

Standard模型部署 - AI开发平台ModelArts

日志提示"No CUDA-capable device is detected" - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线