搜索_华为云

准备Notebook - AI开发平台ModelArts

准备Notebook ModelArts Notebook云上云下，无缝协同，更多关于ModelArts Notebook的详细资料请查看Notebook使用场景介绍。本案例中使用ModelArts的开发环境Notebook部署推理服务进行调试，请按照以下步骤完成Notebook的创建。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906） > 准备工作
LoRA微调训练 - AI开发平台ModelArts

LoRA微调训练前提条件已上传训练代码、训练权重文件和数据集到OBS中，具体参考代码上传至OBS。 Step1 创建训练任务创建训练作业，并自定义名称、描述等信息。选择自定义算法，启动方式自定义，以及选择上传的镜像。图1 创建训练作业训练作业启动命令中输入： cd /h

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912）
主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） - AI开发平台ModelArts

主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） Ascend-vLLM介绍支持的模型列表版本说明和要求推理服务部署推理关键特性使用推理服务精度评测推理服务性能评测附录父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
查看日志和性能 - AI开发平台ModelArts

查看日志和性能单击作业详情页面，则可查看训练过程中的详细信息。图1 查看训练作业在作业详情页的日志页签，查看最后一个节点的日志，其包含“elapsed time per iteration (ms)”数据，可换算为tokens/s/p的性能数据。吞吐量（tokens/s/p）：global

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

场景介绍方案概览本文档利用训练框架PyTorch_npu+华为自研Ascend Snt9B硬件，为用户提供了常见主流开源大模型在ModelArts Lite Server上的预训练和全量微调方案。训练框架使用的是ModelLink。本方案目前仅适用于部分企业客户，完成本方案

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912）
准备Notebook - AI开发平台ModelArts

准备Notebook ModelArts Notebook云上云下，无缝协同，更多关于ModelArts Notebook的详细资料请查看Notebook使用场景介绍。本案例中使用ModelArts的开发环境Notebook部署推理服务进行调试，请按照以下步骤完成Notebook的创建。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909） > 准备工作
准备工作 - AI开发平台ModelArts
准备工作 - AI开发平台ModelArts

准备工作准备环境准备代码准备镜像父主题：主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
推理精度测试 - AI开发平台ModelArts

推理精度测试本章节介绍如何使用lm-eval工具开展语言模型的推理精度测试，数据集包含mmlu、ARC_Challenge、GSM_8k、Hellaswag、Winogrande、TruthfulQA等。约束限制确保容器可以访问公网。当前的精度测试仅适用于语言模型精度验证

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
准备Notebook - AI开发平台ModelArts

准备Notebook ModelArts Notebook云上云下，无缝协同，更多关于ModelArts Notebook的详细资料请查看Notebook使用场景介绍。本案例中使用ModelArts的开发环境Notebook部署推理服务进行调试，请按照以下步骤完成Notebook的创建。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911） > 准备工作
WiseDBA展示的Schema与数据库实例Schema不一致 - 应用平台 AppStage

WiseDBA展示的Schema与数据库实例Schema不一致问题描述 WiseDBA展示的Schema与数据库实例Schema不一致。解决方法进入AppStage运维中心。在顶部导航栏选择服务。单击，选择“微服务开发 > 数据库治理”。选择左侧导航栏的“实例管理 >

帮助中心 > 应用平台 AppStage > 常见问题 > 运维中心数据库治理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

场景介绍方案概览本文档利用训练框架PyTorch_npu+华为自研Ascend Snt9B硬件，为用户提供了常见主流开源大模型在ModelArts Lite Server上的预训练和全量微调方案。训练框架使用的是ModelLink。本方案目前仅适用于部分企业客户，完成本方案

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.909）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

场景介绍方案概览本文档利用训练框架LlamaFactory+华为自研Ascend Snt9B硬件，为用户提供了常见主流开源大模型在ModelArts Lite DevServer上的不同训练阶段方案，包括指令监督微调、DPO偏好训练、RM奖励模型训练、PPO强化训练方案。 DPO(Direct

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.911）
升级Metrics Server - 应用管理与运维平台 ServiceStage

升级Metrics Server 已安装的Metrics Server插件版本低于当前最新版本时，您可以升级插件到当前最新版本。使用限制升级Metrics Server插件版本过程中由于无法正常进行弹性伸缩，如果操作过程中流量异常可能会导致组件服务异常。前提条件待操作Metrics

帮助中心 > 应用管理与运维平台 ServiceStage > 用户指南 > 环境管理 > 管理CCE资源 > 管理插件 > 管理Metrics Server插件
微服务引擎转包周期 - 应用管理与运维平台 ServiceStage

微服务引擎转包周期计费模式为按需计费的用户，可以选择“转包周期”，变更实例计费模式为包年/包月。约束与限制实例从按需变为包周期计费，只是改变计费方式，不会影响应用。状态为“已冻结”、“删除中”的实例，不支持转包周期。微服务引擎转包周期登录ServiceStage控制台，选择“微服务引擎

 帮助中心 > 应用管理与运维平台 ServiceStage > 用户指南 > 微服务引擎 > 管理微服务引擎
关闭弹性伸缩-HPA策略 - 应用管理与运维平台 ServiceStage

关闭弹性伸缩-HPA策略您可以根据实际业务需要，关闭不再使用的弹性伸缩-HPA策略。关闭弹性伸缩-HPA策略后，所有数据将清空，请谨慎操作。前提条件已创建组件弹性伸缩-HPA策略，请参考创建弹性伸缩-HPA策略。删除弹性伸缩-HPA策略登录ServiceStage控制台。

帮助中心 > 应用管理与运维平台 ServiceStage > 用户指南 > 组件管理 > 设置组件实例伸缩策略 > 管理弹性伸缩-HPA策略
重启Metrics Server - 应用管理与运维平台 ServiceStage

重启Metrics Server 您可以根据实际业务需要，重新启动Metrics Server负载进程。使用限制启动Metrics Server负载过程中由于无法正常进行弹性伸缩，如果操作过程中流量异常可能会导致组件服务异常。前提条件待操作Metrics Server插件已经安装，请参考安装Metrics

帮助中心 > 应用管理与运维平台 ServiceStage > 用户指南 > 环境管理 > 管理CCE资源 > 管理插件 > 管理Metrics Server插件
查看微服务引擎实例数配额 - 应用管理与运维平台 ServiceStage

查看微服务引擎实例数配额本章节指导您查看微服务引擎的实例数配额及配额使用情况。查看微服务引擎实例数配额登录ServiceStage控制台，选择“微服务引擎 > 引擎实例”。在页面上方“微服务引擎”下拉列表，选择待查看的微服务引擎。在“服务发现 & 配置”区域，查看引擎的实例数配额及配额使用情况。

帮助中心 > 应用管理与运维平台 ServiceStage > 用户指南 > 微服务引擎 > 管理微服务引擎
查看微服务引擎配置条目配额 - 应用管理与运维平台 ServiceStage

查看微服务引擎配置条目配额本章节指导您查看微服务引擎的配置条目配额及配额使用情况。该章节内容只适用于微服务引擎版本为2.x。查看微服务引擎配置条目配额登录ServiceStage控制台，选择“微服务引擎 > 引擎实例”。在页面上方“微服务引擎”下拉列表，选择待查看的微服务引擎。

帮助中心 > 应用管理与运维平台 ServiceStage > 用户指南 > 微服务引擎 > 管理微服务引擎
ServiceComb引擎仪表盘中的数据通过ServiceStage对接到AOM - 应用管理与运维平台 ServiceStage

ServiceComb引擎仪表盘中的数据通过ServiceStage对接到AOM 背景信息接入ServiceComb引擎的Java Chassis应用，在ServiceComb引擎仪表盘上的实时监控数据默认保留5分钟。如果需要持久化存储历史监控数据用于后续查询分析，可以使用Se

帮助中心 > 应用管理与运维平台 ServiceStage > 最佳实践
微服务日常运维 - 应用管理与运维平台 ServiceStage

微服务日常运维业务场景 ServiceStage支持应用监控、事件、告警、日志和调用链诊断，内置AI能力，可以实现轻松运维。用户故事在实际的使用场景中，用户可以通过图形化指标数据和阈值告警等能力，实时监控应用运行情况，同时结合性能管理与日志策略，快速定位应用的运行问题，分析性能瓶颈等。

帮助中心 > 应用管理与运维平台 ServiceStage > 最佳实践 > 使用ServiceStage托管和治理天气预报微服务应用

总条数： 10000

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备Notebook - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

准备Notebook - AI开发平台ModelArts

准备工作 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

准备Notebook - AI开发平台ModelArts

WiseDBA展示的Schema与数据库实例Schema不一致 - 应用平台 AppStage

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

升级Metrics Server - 应用管理与运维平台 ServiceStage

微服务引擎转包周期 - 应用管理与运维平台 ServiceStage

关闭弹性伸缩-HPA策略 - 应用管理与运维平台 ServiceStage

重启Metrics Server - 应用管理与运维平台 ServiceStage

查看微服务引擎实例数配额 - 应用管理与运维平台 ServiceStage

查看微服务引擎配置条目配额 - 应用管理与运维平台 ServiceStage

ServiceComb引擎仪表盘中的数据通过ServiceStage对接到AOM - 应用管理与运维平台 ServiceStage

微服务日常运维 - 应用管理与运维平台 ServiceStage

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线