搜索_华为云

部署在线服务出现报错No CUDA runtime is found - AI开发平台ModelArts

部署在线服务出现报错No CUDA runtime is found 问题现象部署在线服务出现报错No CUDA runtime is found，using CUDA_HOME='/usr/local/cuda'。原因分析从日志报错信息No CUDA runtime is

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
模型的自定义镜像制作流程 - AI开发平台ModelArts

图2 模型的自定义镜像制作场景二场景三：预置镜像既不满足软件环境要求，同时需要放入模型包，新的镜像超过35G，在服务器（如ECS）上制作。具体案例参考在ECS中通过Dockerfile从0制作自定义镜像用于推理。图3 模型的自定义镜像制作场景三约束限制自定义镜像中不能包含恶意代码。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
精度问题处理 - AI开发平台ModelArts

p16，fp32的性能较差。因此，通常只在检测到某个模型精度存在问题时，才会考虑是否使用fp32进行尝试）。使用fp32精度模式的配置文件如下：配置文件： # config.ini [ascend_context] precision_mode=enforce_fp32 # 使用fp32。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 模型精度调优
ModelArts权限管理基本概念 - AI开发平台ModelArts

单击“添加授权”后，系统会引导您为特定用户或所有用户进行委托配置，通常默认会创建一个名为“modelarts_agency_<用户名>_随机ID”的委托条目。在权限配置的区域，您可以选择ModelArts提供的预置配置，也可以自定义选择您所授权的策略。如果这两种形态对于您的诉求均

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理
启动推理服务 - AI开发平台ModelArts

--disable-async-output-proc：关闭异步后处理特性，关闭后性能会下降。多机部署启动推理服务（可选）当单机显存无法放下模型权重时，可选用多机方式部署；多机部署方式，需要机器在同一个集群，NPU卡之间IP能够ping通方可，具体步骤如下：查看卡IP，在其中一个宿主机上执行。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务部署
在ModelArts的Notebook中如何设置VS Code背景色为豆沙绿？ - AI开发平台ModelArts

在ModelArts的Notebook中如何设置VS Code背景色为豆沙绿？在VS Code的配置文件settings.json中添加如下参数 "workbench.colorTheme": "Atom One Light", "workbench.colorCustomizations":

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
SDXL基于Standard适配PyTorch NPU的LoRA训练指导（6.3.908） - AI开发平台ModelArts

Step6 准备镜像创建ECS。参考ECS文档购买弹性云服务器。网络配置、高级配置等后续步骤，可根据默认选择，或进行自定义。创建完成后，单击“远程登录”，并在控制台发送后续步骤中的远程命令。注意：创建的ECS虚拟机使用ARM镜像创建。图1 购买ECS 安装Docker。检查docker是否安装。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
约束与限制 - AI开发平台ModelArts

Standard推理部署在线服务单个账号最多可创建20个在线服务。是提交工单申请提升配额更多信息，请参见部署在线服务。 Standard推理部署批量服务单个账号最多可创建1000个批量服务。否更多信息，请参见部署批量服务。 Standard推理部署边缘服务单个账号最多可创建1000个边缘服务。

帮助中心 > AI开发平台ModelArts > 产品介绍
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

Turbo功能，则需要配置ModelArts和SFS Turbo间网络直通，以及配置ModelArts网络关联SFS Turbo。若ModelArts网络关联SFS Turbo失败，则需要授权ModelArts云服务使用SFS Turbo，具体操作请参见配置ModelArts和SFS

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 准备工作
服务预测失败 - AI开发平台ModelArts

服务预测失败问题现象在线服务部署完成且服务已经处于“运行中”的状态，向服务发起推理请求，预测失败。原因分析及处理方法服务预测需要经过客户端、外部网络、APIG、Dispatch、模型服务多个环节。每个环节出现都会导致服务预测失败。图1 推理服务流程图出现APIG.XX

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
在ModelArts的Notebook中实例重新启动后要怎么连接？ - AI开发平台ModelArts

在ModelArts的Notebook中实例重新启动后要怎么连接？可以在本地的ssh config文件中对这个Notebook配置参数“StrictHostKeyChecking no”和“UserKnownHostsFile=/dev/null”，如下参考所示： Host roma-local-cpu

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
管理Lite Cluster节点 - AI开发平台ModelArts

当前支持“换件维修”和“重部署”两种修复方式： - 换件维修：通过更换硬件实现原地修复，修复耗时较长，对于非本地盘类故障，本地盘数据可以保留。 - 重部署：通过更换为新服务器实现修复，修复耗时较短，本地盘数据会丢失。修复期间实例将无法工作，请确保相关实例业务已离线。如果云服务器上的业务不可停止，请勿修复，并联系技术支持进行处理。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
在Standard上部署SD WebUI推理服务 - AI开发平台ModelArts

--api 按照上述配置完参数后，单击右下角的立即创建，完成AI应用的创建。图5 填写参数（2）当AI应用状态变为正常时，表示创建完成。图6 AI应用创建完成步骤五部署服务单击AI应用名称，进入AI应用详情页，单击部署在线服务。图7 部署在线服务填写如下服务部署参数。名称：

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理 > SD WEBUI套件适配PyTorch NPU的推理指导（6.3.908）
执行训练任务（推荐） - AI开发平台ModelArts

yaml文件参数配置，样例yaml配置文件结构如下： base块：基础配置块，主要为公共配置参数 ModelName块：该模型所需配置的参数，如qwen2.5-7b块 exp_name：实验块，训练策略-序列长度所需参数配置样例yaml文件仅展示常用实验配置，如需其他配置需根据样例自行添加。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
SDXL基于Standard适配PyTorch NPU的Finetune训练指导（6.3.905） - AI开发平台ModelArts

Step6 准备镜像创建ECS。参考ECS文档购买弹性云服务器。网络配置、高级配置等后续步骤，可根据默认选择，或进行自定义。创建完成后，单击“远程登录”，并在控制台发送后续步骤中的远程命令。注意：创建的ECS虚拟机使用ARM镜像创建。图1 购买ECS 安装Docker。检查docker是否安装。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
服务管理 - AI开发平台ModelArts
服务管理 - AI开发平台ModelArts

服务管理服务管理概述在开发环境中部署本地服务进行调试部署在线服务查询服务详情推理服务测试查询服务列表查询服务对象列表更新服务配置查询服务监控信息查询服务日志删除服务

 帮助中心 > AI开发平台ModelArts > SDK参考
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

sh #安装opencompass脚本 ├──vllm_api.py #启动vllm api服务器 ├──vllm.py #构造vllm评测配置脚本名字父主题：准备工作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906） > 准备工作
推理服务部署 - AI开发平台ModelArts

推理服务部署准备推理环境启动推理服务父主题：主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）
准备权重 - AI开发平台ModelArts
准备权重 - AI开发平台ModelArts

建文件夹model/llama-2-13b-hf。利用OBS Browser+工具将下载的模型文件上传至创建的文件夹目录下。在ECS服务器中安装obsutil工具，具体命令可参考obsutil工具快速使用，将OBS桶中的数据下载至SFS Turbo中。注意：需要使用用户账号中

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

sh #安装opencompass脚本 ├──vllm_api.py #启动vllm api服务器 ├──vllm.py #构造vllm评测配置脚本名字父主题：准备工作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911） > 准备工作

总条数： 2045

上一页
1
...
18
19
20
...
103
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

部署在线服务出现报错No CUDA runtime is found - AI开发平台ModelArts

模型的自定义镜像制作流程 - AI开发平台ModelArts

精度问题处理 - AI开发平台ModelArts

ModelArts权限管理基本概念 - AI开发平台ModelArts

启动推理服务 - AI开发平台ModelArts

在ModelArts的Notebook中如何设置VS Code背景色为豆沙绿？ - AI开发平台ModelArts

SDXL基于Standard适配PyTorch NPU的LoRA训练指导（6.3.908） - AI开发平台ModelArts

约束与限制 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

服务预测失败 - AI开发平台ModelArts

在ModelArts的Notebook中实例重新启动后要怎么连接？ - AI开发平台ModelArts

管理Lite Cluster节点 - AI开发平台ModelArts

在Standard上部署SD WebUI推理服务 - AI开发平台ModelArts

执行训练任务（推荐） - AI开发平台ModelArts

SDXL基于Standard适配PyTorch NPU的Finetune训练指导（6.3.905） - AI开发平台ModelArts

服务管理 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

推理服务部署 - AI开发平台ModelArts

准备权重 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线