搜索_华为云

准备工作 - AI开发平台ModelArts
准备工作 - AI开发平台ModelArts

准备工作准备环境准备代码准备数据准备镜像父主题：主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.905）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.905）
推理精度测试 - AI开发平台ModelArts

推理精度测试本章节介绍如何进行推理精度测试，数据集是ceval_gen、mmlu_gen。前提条件确保容器可以访问公网。 Step1 配置精度测试环境获取精度测试代码。精度测试代码存放在代码包AscendCloud-LLM的llm_tools/llm_evaluation目录中，代码目录结构如下。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.906）
部署推理服务 - AI开发平台ModelArts

部署推理服务本章节介绍如何使用vLLM 0.5.0框架部署并启动推理服务。前提条件已准备好Server环境，具体参考资源规格要求。推荐使用“西南-贵阳一”Region上的Server和昇腾Snt9b资源。安装过程需要连接互联网git clone，确保容器可以访问公网。 Step1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.907）
SFT全参微调训练 - AI开发平台ModelArts

SFT全参微调训练前提条件已上传训练代码、训练权重文件和数据集到SFS Turbo中，具体参考代码上传至OBS和使用Notebook将OBS数据导入SFS Turbo。 Step1 在Notebook中修改训练超参配置以llama2-13b SFT微调为例，执行脚本 0_pl_sft_13b

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905）
推理性能测试 - AI开发平台ModelArts

推理性能测试本章节介绍如何进行推理性能测试，建议在Notebook的JupyterLab中另起一个Terminal，执行benchmark脚本进行性能测试。若需要在生产环境中进行推理性能测试，请通过调用接口的方式进行测试。 benchmark方法介绍性能benchmark包括两部分。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
CogVideoX1.5 5b模型基于Lite Server适配PyTorch NPU全量训练指导（6.5.901） - AI开发平台ModelArts

CogVideoX1.5 5b模型基于Lite Server适配PyTorch NPU全量训练指导（6.5.901）本文档主要介绍如何在ModelArts的Lite Server环境中，使用NPU卡对CogVideoX模型进行全量微调。本文档中提供的脚本，是基于原生CogVid

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生视频模型训练推理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

场景介绍方案概览本文档利用训练框架PyTorch_npu+华为自研Ascend Snt9B硬件，为用户提供了常见主流开源大模型在ModelArts Standard上的预训练和全量微调方案。本方案目前仅适用于部分企业客户，完成本方案的部署，需要先联系您所在企业的华为方技术支持。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.5.901）
主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.5.901） - AI开发平台ModelArts

主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.5.901） Ascend-vLLM介绍支持的模型列表版本说明和要求推理服务部署推理关键特性使用推理服务精度评测推理服务性能评测附录父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

场景介绍 Qwen大模型是一个包含多种参数数量模型的语言模型。本文档以Qwen-7B/14B/72B为例，利用训练框架Pytorch_npu+华为自研Ascend Snt9b硬件，为用户提供了开箱即用的预训练和微调训练方案。操作流程图1 操作流程图表1 操作任务流程说明阶段

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Qwen系列模型基于Lite Server适配PyTorch NPU训练指导（6.3.904）
准备工作 - AI开发平台ModelArts
准备工作 - AI开发平台ModelArts

准备工作准备资源准备数据准备权重准备代码准备镜像准备Notebook（可选）父主题：主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.5.901）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.5.901）
部署推理服务 - AI开发平台ModelArts

部署推理服务本章节介绍如何启动推理服务。前提条件已准备好DevServer环境。推荐使用“西南-贵阳一”Region上的DevServer和昇腾Snt9b资源。确保容器可以访问公网。 Step1 检查环境 SSH登录机器后，检查NPU设备检查。运行如下命令，返回NPU设备信息。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.904）
导出ModelArts数据集中的数据为新数据集 - AI开发平台ModelArts

导出ModelArts数据集中的数据为新数据集针对数据集中的数据，用户可以选中部分数据或者通过条件筛选出需要的数据，导出成新的数据集。用户可以通过任务历史查看数据导出的历史记录。本章主要介绍将ModelArts数据集中的数据为新数据集的方式，新导出的数据集可直接在ModelArts控制台数据集列表中显示。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导出ModelArts数据集中的数据
导出ModelArts数据集中的数据到AI Gallery - AI开发平台ModelArts

导出ModelArts数据集中的数据到AI Gallery 针对数据集中的数据，用户可以选中部分数据或者通过条件筛选出需要的数据，导出到AI Gallery。用户可以通过任务历史查看数据导出的历史记录。发布到AI Gallery中的数据集，可以设置是否公开，将数据集公开给其他人使用。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导出ModelArts数据集中的数据
训练预测分析模型 - AI开发平台ModelArts

训练预测分析模型创建自动学习后，将会进行模型的训练，得到预测分析的模型。模型部署步骤将使用预测模型发布在线预测服务。操作步骤在新版自动学习页面，单击创建成功的项目名称，查看当前工作流的执行情况。在“预测分析”节点中，待节点状态由“运行中”变为“运行成功”，即完成了模型的自动训练。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现预测分析
部署预测分析服务 - AI开发平台ModelArts

部署预测分析服务模型部署模型部署操作即将模型部署为在线服务，并且提供在线的测试UI与监控能力。完成模型训练后，可选择准确率理想且训练状态为“运行成功”的版本部署上线。具体操作步骤如下。在“运行节点”页面中，待训练状态变为“等待输入”，双击“服务部署”节点，完成相关参数配置。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现预测分析
配置仪表盘查看指标数据 - AI开发平台ModelArts

配置仪表盘查看指标数据 Grafana中可以自定义配置各种视图的仪表盘，ModelArts也提供了针对集群的配置模板。本章节通过使用ModelArts提供的模板查看指标和创建Dashboards查看指标的方式，说明如何进行仪表盘配置。Grafana的更多使用请参考Grafana官方文档。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控 > 使用Grafana查看AOM中的监控指标
应用快速接入 - 设备接入 IoTDA
应用快速接入 - 设备接入 IoTDA

请根据实际情况选择。高级配置产品ID 定制ProductID，用于唯一标识一个产品。如果携带此参数，平台将产品ID设置为该参数值；如果不携带此参数，产品ID在物联网平台创建产品后由平台分配获得。产品描述产品描述。请根据实际情况填写。步骤3：配置环境下载并安装Postman，

帮助中心 > 设备接入 IoTDA > 快速入门
会议空间 - 华为云WeLink
会议空间 - 华为云WeLink

与会人、会议多场景于一体的会议管理协作平台，致力于打造流畅会议服务体验，并融合会前、会中、会后全场景、多平台互通的，一站式会务管理平台，让企业会议高效便捷的沟通与协作无处不在。使用OneRoom后，您将融合会前、会中、会后全场景、多工具平台协作互通，满足您的会议管理需求，具体服务地图如下：

帮助中心 > 华为云WeLink > 客户端用户指南 > Windows端 > 会议空间
如何选择操作系统？ - 镜像服务 IMS

如何选择操作系统？ Windows 适用于Windows环境下的开发平台或运营业务。系统盘要求40GB及以上、内存1GB及以上。可以安装IIS、SQL Server等。 Linux 适用于Linux环境下的开发平台或运营业务。当前提供CentOS（推荐）和Ubuntu等类型操作系统。

帮助中心 > 镜像服务 IMS > 常见问题 > 操作系统类
同步数据至WeLink - 应用身份管理服务 OneAccess

可同步至WeLink。登录WeLink开放平台。在WeLink开放平台，选择“应用开发 > 企业内部应用 > We码”，创建应用，填写应用信息。具体可参考WeLink开放平台的帮助文档。配置应用参数。具体可参考WeLink开放平台的帮助文档。在“开发指引”页签，选择“开发

 帮助中心 > 应用身份管理服务 OneAccess > 最佳实践 > 同步企业数据

总条数： 10000

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备工作 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

SFT全参微调训练 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

CogVideoX1.5 5b模型基于Lite Server适配PyTorch NPU全量训练指导（6.5.901） - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.5.901） - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

准备工作 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

导出ModelArts数据集中的数据为新数据集 - AI开发平台ModelArts

导出ModelArts数据集中的数据到AI Gallery - AI开发平台ModelArts

训练预测分析模型 - AI开发平台ModelArts

部署预测分析服务 - AI开发平台ModelArts

配置仪表盘查看指标数据 - AI开发平台ModelArts

应用快速接入 - 设备接入 IoTDA

会议空间 - 华为云WeLink

如何选择操作系统？ - 镜像服务 IMS

同步数据至WeLink - 应用身份管理服务 OneAccess

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线