搜索_华为云

GPU A系列裸金属服务器如何更换NVIDIA和CUDA？ - AI开发平台ModelArts

A系列裸金属服务器如何更换NVIDIA和CUDA？场景描述当裸金属服务器预置的NVIDIA版本和业务需求不匹配时，需要更换NVIDIA驱动和CUDA版本。本文介绍华为云A系列GPU裸金属服务器（Ubuntu20.04系统）如何从“NVIDIA 525+CUDA 12.0”更换为“NVIDIA

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
管理Workflow工作流 - AI开发平台ModelArts

kflow。删除后的Workflow无法恢复，请谨慎操作。删除Workflow后，对应的训练作业和在线服务不会随之被删除，需要分别在“模型训练>训练作业”和“模型部署>在线服务”页面中手动删除任务。父主题：管理Workflow

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 管理Workflow
从AI Gallery订阅模型 - AI开发平台ModelArts

侧展开版本列表，当订阅模型的版本列表的状态显示为“就绪”时表示模型可以使用。图1 进入“我的订阅” 在展开的版本列表中，单击“部署 > 在线服务”跳转至部署页面。图2 部署模型如果您选择部署的是商用模型，则选择服务类型后会弹出“修改配额”窗口，根据需要选择配额后单击“确定”即可跳转至“部署”页面。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
ModelArts入门指引 - AI开发平台ModelArts

Gallery中预置的模型、算法、数据、Notebook等资产，零代码完成AI建模和应用。如果您想了解如何使用ModelArts Standard一键部署现有的模型，并在线使用模型进行预测，您可以参考使用ModelArts Standard一键完成商超商品识别模型部署。 ModelArts Standard同

 帮助中心 > AI开发平台ModelArts > 快速入门
使用自定义引擎在ModelArts Standard创建模型 - AI开发平台ModelArts

model:/home/mind/model custom_engine:v1 该指令无法完全模拟线上，主要是由于-v挂载进去的目录是root权限。在线上，模型文件从OBS下载到/home/mind/model目录之后，文件owner将统一修改为ma-user。在本地机器上启动另一个终端

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
如果不再使用ModelArts，如何停止收费？ - AI开发平台ModelArts

作业”页面，检查是否有“运行中”的训练作业。如果有，单击该作业列表右方操作下的“停止”即可停止计费。进入“ModelArts>模型部署>在线服务”页面，检查是否有“运行中”的推理作业。如果有，单击该作业列表右方操作下的“停止”即可停止计费。进入“ModelArts>模型部署>

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费FAQ
使用SmoothQuant量化 - AI开发平台ModelArts

export ASCEND_RT_VISIBLE_DEVICES=0,1 NPU卡编号可以通过命令npu-smi info查询。执行权重转换。 cd autosmoothquant/examples/ python smoothquant_model.py --model-path

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
使用SmoothQuant量化 - AI开发平台ModelArts

export ASCEND_RT_VISIBLE_DEVICES=0,1 NPU卡编号可以通过命令npu-smi info查询。执行权重转换。 cd autosmoothquant/examples/ python smoothquant_model.py --model-path

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
使用kv-cache-int8量化 - AI开发平台ModelArts

径是examples/llama/convert_checkpoint.py。执行convert_checkpoint.py脚本进行权重转换生成量化系数，详细参数解释请参见https://github.com/NVIDIA/TensorRT-LLM/tree/main/exam

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.906） > 推理模型量化
使用ModelArts Standard部署模型并推理预测 - AI开发平台ModelArts

Standard部署模型并推理预测推理部署使用场景创建模型创建模型规范参考将模型部署为实时推理作业将模型部署为批量推理服务管理ModelArts模型管理同步在线服务管理批量推理作业

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

介绍如何在Notebook中配置NPU环境，部署并启动推理服务，完成精度测试和性能测试。在推理生产环境中部署推理服务介绍如何在创建AI应用，部署并启动推理服务，在线预测在线服务。父主题：主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

//docs.vllm.ai/en/latest/getting_started/quickstart.html。以下服务启动介绍的是在线推理方式，离线推理请参见https://docs.vllm.ai/en/latest/getting_started/quickstart

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
服务管理 - AI开发平台ModelArts
服务管理 - AI开发平台ModelArts

服务管理服务管理概述在开发环境中部署本地服务进行调试部署在线服务查询服务详情推理服务测试查询服务列表查询服务对象列表更新服务配置查询服务监控信息查询服务日志删除服务

 帮助中心 > AI开发平台ModelArts > SDK参考
切换Lite Server服务器操作系统 - AI开发平台ModelArts

切换Lite Server服务器操作系统场景描述 Lite Server为一台弹性裸金属服务器，您可以使用BMS服务提供的切换操作系统功能，对Lite Server资源操作系统进行切换。本文介绍以下三种切换操作系统的方式：在BMS控制台切换操作系统使用BMS Go SDK的方式切换操作系统

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理
使用SmoothQuant量化 - AI开发平台ModelArts

export ASCEND_RT_VISIBLE_DEVICES=0,1 NPU卡编号可以通过命令npu-smi info查询。执行权重转换。 cd autosmoothquant/examples/ python smoothquant_model.py --model-path

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用SmoothQuant量化 - AI开发平台ModelArts

export ASCEND_RT_VISIBLE_DEVICES=0,1 NPU卡编号可以通过命令npu-smi info查询。执行权重转换。 cd autosmoothquant/examples/ python smoothquant_model.py --model-path

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
使用SmoothQuant量化 - AI开发平台ModelArts

export ASCEND_RT_VISIBLE_DEVICES=0,1 NPU卡编号可以通过命令npu-smi info查询。执行权重转换。 cd autosmoothquant/examples/ python smoothquant_model.py --model-path

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.906） > 推理模型量化
分离部署推理服务 - AI开发平台ModelArts

基本参数请参考步骤八启动scheduler实例，额外的参数如下： --dynamic：是否开启自适应角色转换，如果不开启，则下方参数无效 --replan-interval：重新计算pd配比转换的间隔时间，默认6000，单位为秒 --profile-input-len：profiling的输入长度，默认"64

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 部署推理服务
自定义引擎创建模型规范 - AI开发平台ModelArts

model:/home/mind/model custom_engine:v1 该指令无法完全模拟线上，主要是由于-v挂载进去的目录是root权限。在线上，模型文件从OBS下载到/home/mind/model目录之后，文件owner将统一修改为ma-user。在本地机器上启动另一个终端

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
使用Notebook进行AI开发调试 - AI开发平台ModelArts

使用Notebook进行AI开发调试 Notebook使用场景创建Notebook实例通过JupyterLab在线使用Notebook实例进行AI开发通过PyCharm远程使用Notebook实例通过VS Code远程使用Notebook实例通过SSH工具远程使用Notebook

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard）

总条数： 915

上一页
1
...
33
34
35
...
46
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

GPU A系列裸金属服务器如何更换NVIDIA和CUDA？ - AI开发平台ModelArts

管理Workflow工作流 - AI开发平台ModelArts

从AI Gallery订阅模型 - AI开发平台ModelArts

ModelArts入门指引 - AI开发平台ModelArts

使用自定义引擎在ModelArts Standard创建模型 - AI开发平台ModelArts

如果不再使用ModelArts，如何停止收费？ - AI开发平台ModelArts

使用SmoothQuant量化 - AI开发平台ModelArts

使用SmoothQuant量化 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

使用ModelArts Standard部署模型并推理预测 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

服务管理 - AI开发平台ModelArts

切换Lite Server服务器操作系统 - AI开发平台ModelArts

使用SmoothQuant量化 - AI开发平台ModelArts

使用SmoothQuant量化 - AI开发平台ModelArts

使用SmoothQuant量化 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

自定义引擎创建模型规范 - AI开发平台ModelArts

使用Notebook进行AI开发调试 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线