搜索_华为云

工具介绍及准备工作 - AI开发平台ModelArts

工具介绍及准备工作本章节主要介绍针对LLaMAFactory开发的测试工具benchmark，支持训练、性能对比、下游任务评测、loss和下游任务对比能力。对比结果以excel文件呈现。方便用户验证发布模型的质量。所有配置都通过yaml文件设置，用户查看默认yaml文件即可知道最优性能的配置

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 训练benchmark工具
将数据预热到SFS Turbo - AI开发平台ModelArts

将数据预热到SFS Turbo 训练任务开始前可通过数据预热功能将文件元数据和数据内容全部从OBS导入到SFS Turbo高性能文件存储中，数据预热功能的具体操作请参考创建SFS Turbo 和 OBS 之间的联动任务。在ECS服务器挂载SFS Turbo已经将SFS Turbo

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 准备工作
使用kv-cache-int8量化 - AI开发平台ModelArts

使用kv-cache-int8量化 kv-cache-int8是实验特性，在部分场景下性能可能会劣于非量化。当前支持per-tensor静态量化、per-tensor+per-head静态量化以及per-token，支持kv-cache-int8量化和FP16、BF16、AWQ、smoothquant

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
Prefix Caching - AI开发平台ModelArts

Prefix Caching 什么是Prefix Caching 在LLM推理应用中，经常会面临具有长system prompt的场景以及多轮对话的场景。长system prompt的场景，system prompt在不同的请求中但是相同的，KV Cache的计算也是相同的；多轮对话场景中

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
multi-lora - AI开发平台ModelArts
multi-lora - AI开发平台ModelArts

multi-lora 什么是multi-lora LoRA（Low-Rank Adaptation）是一种适用于大模型的轻量化微调技术方法。原理是通过在模型层中引入低秩矩阵，将大模型的权重降维处理，来实现高效的模型适配。相比于传统的微调方法，LoRA不仅能大幅减少所需的训练参数，还降低了显存和计算成本

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
通过Token认证的方式访问在线服务 - AI开发平台ModelArts

因APIG（API网关）限制，平台每次请求预测的时间不超过40秒。前提条件已经获取用户Token、预测文件的本地路径、在线服务的调用地址和在线服务的输入参数信息。用户Token的获取请参见获取Token认证。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的认证方式
GPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

GPU服务器上配置Lite Server资源软件环境场景描述本文旨在指导如何在GPU裸金属服务器上，安装NVIDIA、CUDA驱动等环境配置。由于不同GPU预置镜像中预安装的软件不同，您通过Lite Server算力资源和镜像版本配套关系章节查看已安装的软件。下面为常见的软件安装步骤

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置 > 配置Lite Server软件环境
在Lite Cluster资源池上使用Snt9B完成分布式训练任务 - AI开发平台ModelArts

在Lite Cluster资源池上使用Snt9B完成分布式训练任务场景描述本案例介绍如何在Snt9B上进行分布式训练任务，其中Cluster资源池已经默认安装volcano调度器，训练任务默认使用volcano job形式下发lite池集群。训练测试用例使用NLP的bert模型

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
在SLB中进行降级配置 - 应用平台 AppStage

在SLB中进行降级配置降级配置是在业务高峰期时，需要临时减少对于目标服务的访问，达到降低目标服务负载；或者屏蔽对于非关键服务的访问，保持本服务的核心处理能力的治理措施。降级执行流程如图1所示。图1 降级执行流程前提条件需要具备AppStage服务运维岗位权限或运维管理员权限

 帮助中心 > 应用平台 AppStage > 运行时引擎用户指南（即将下线） > 配置运行时引擎负载均衡 > 在SLB中创建和管理负载均衡实例
在SLB中导出OLC规则的IAC信息 - 应用平台 AppStage

在SLB中导出OLC规则的IAC信息由于OLC规则比较复杂，推荐在SLB管理台上配置好部分规则后导出IAC包，然后在导出的文件基础上进行修改。使用IAC配置中心规则的功能只支持配置在SLB管理台创建的OLC服务，不支持在Cloud Map管理台创建的OLC服务。导出IAC信息

 帮助中心 > 应用平台 AppStage > 运行时引擎用户指南（即将下线） > 配置运行时引擎负载均衡 > 在SLB中创建和管理流控服务
复制和迁移SLB配置信息 - 应用平台 AppStage

复制和迁移SLB配置信息导出SLB实例的所有信息并在新增实例配置页面快速导入，可以实现配置信息的复制和迁移。前提条件需要具备AppStage服务运维岗位权限或运维管理员权限，权限申请操作请参见申请权限。导出所有信息导出SLB实例的所有信息，包括SLB节点信息、nginx.conf

帮助中心 > 应用平台 AppStage > 运行时引擎用户指南（即将下线） > 配置运行时引擎负载均衡 > 在SLB中创建和管理负载均衡实例
导入导出应用中对象的元数据 - 华为云Astro轻应用

导入导出应用中对象的元数据将当前系统中的对象元数据导出，然后在其他环境或账号导入，实现数据迁移和备份，如迁移旧的元数据和数据去新的环境，保持对象的一致和兼容。从而实现在不同的账号间或环境间的数据迁移，避免重复开发和不兼容的开发。导出对象元数据在AstroZero服务控制台，单击

 帮助中心 > 华为云Astro轻应用 > 用户指南（低代码） > AstroZero低代码平台管理中心 > 管理AstroZero中已安装应用的资源 > 迁移应用中的对象数据
使用发布单实现组件跨可用区批量升级 - 应用管理与运维平台 ServiceStage

使用发布单实现组件跨可用区批量升级本章节指导您基于ServiceStage发布管理的批量升级实现组件跨可用区的升级，并指定在不同可用区组件的升级顺序。操作步骤登录ServiceStage控制台。选择“发布管理 > 创建发布单”。填写“发布单名称”（例如：release-upgrade

帮助中心 > 应用管理与运维平台 ServiceStage > 最佳实践 > 使用ServiceStage基于发布管理实现组件跨可用区搬迁和顺序升级
查看微服务版本信息 - 应用平台 AppStage

查看微服务版本信息本文介绍如何查看及删除微服务版本信息。查看微服务版本信息进入AppStage运维中心。在顶部导航栏选择服务。单击，选择“微服务开发 > 服务发现”。选择左侧导航栏的“服务目录 > 一方服务”。选择“微服务列表”页签，单击微服务列表中的微服务名。选择左侧导航栏的

 帮助中心 > 应用平台 AppStage > 运维中心用户指南 > 管理运行时资源 > 管理Cloud Map中的服务资源 > 查看注册到CloudMap的微服务信息
在WiseDBA中变更数据库实例规格 - 应用平台 AppStage

在WiseDBA中变更数据库实例规格可以根据业务需要对包年/包月和按需实例的规格进行变更，规格指实例的CPU/内存。使用须知此操作预计耗时约10分钟，程序可能会有10s以内的中断，请自行评估影响。前提条件需要具备AppStage服务运维岗位权限或运维管理员权限，权限申请操作请参见申请权限

 帮助中心 > 应用平台 AppStage > 运维中心用户指南 > 管理已纳管资源 > 管理数据库 > 在WiseDBA中纳管和管理数据库实例
在SLB中配置负载均衡实例共享 - 应用平台 AppStage

在SLB中配置负载均衡实例共享 AppStage的资源按照服务级隔离，跨服务使用负载均衡实例时，需要配置共享。前提条件需要具备AppStage服务运维岗位权限或运维管理员权限，权限申请操作请参见申请权限。配置SLB实例共享进入AppStage运维中心。在顶部导航栏选择服务

 帮助中心 > 应用平台 AppStage > 运维中心用户指南 > 管理运行时资源 > 配置运维中心负载均衡 > 创建和管理负载均衡实例
为微服务配置告警策略 - 应用平台 AppStage

为微服务配置告警策略支持对某个服务下的单个微服务或者多个微服务配置告警策略，告警信息会进行上报，业务可在监控服务（ServiceInsight）管理台上查看告警信息。前提条件需要具备AppStage服务运维岗位权限或运维管理员权限，权限申请操作请参见申请权限。新增告警配置

 帮助中心 > 应用平台 AppStage > 运维中心用户指南 > 管理运行时资源 > 管理Cloud Map中的服务资源 > 查看注册到CloudMap的服务信息
ECS获取和上传基础镜像 - AI开发平台ModelArts

ECS获取和上传基础镜像 Step1 创建镜像组织在SWR服务页面创建镜像组织。图1 创建镜像组织 Step2 登录ECS服务器根据创建ECS服务器创建完成ECS服务器后，单击“远程登录”，可使用华为CloudShell远程登录如图所示。后续安装Docker、获取镜像、构建镜像等操作均在该

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作 > 准备镜像
ECS中构建新镜像 - AI开发平台ModelArts

ECS中构建新镜像通过ECS获取和上传基础镜像获取基础镜像后，可通过ECS运行Dockerfile文件，在镜像的基础上构建新镜像。 Step1 构建新ModelArts Standard训练镜像获取模型软件包，并上传到ECS的目录下（可自定义路径），获取地址参考表1。解压AscendCloud

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作 > 准备镜像
训练中的权重转换说明 - AI开发平台ModelArts

训练中的权重转换说明以 llama2-13b 举例，运行 0_pl_pretrain_13b.sh 脚本。脚本同样还会检查是否已经完成权重转换的过程。如果已完成权重转换，则直接执行预训练任务。如果未进行权重转换，则会自动执行 scripts/llama2/2_convert_mg_hf.sh

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明参考

总条数： 10000

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

工具介绍及准备工作 - AI开发平台ModelArts

将数据预热到SFS Turbo - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

Prefix Caching - AI开发平台ModelArts

multi-lora - AI开发平台ModelArts

通过Token认证的方式访问在线服务 - AI开发平台ModelArts

GPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

在Lite Cluster资源池上使用Snt9B完成分布式训练任务 - AI开发平台ModelArts

在SLB中进行降级配置 - 应用平台 AppStage

在SLB中导出OLC规则的IAC信息 - 应用平台 AppStage

复制和迁移SLB配置信息 - 应用平台 AppStage

导入导出应用中对象的元数据 - 华为云Astro轻应用

使用发布单实现组件跨可用区批量升级 - 应用管理与运维平台 ServiceStage

查看微服务版本信息 - 应用平台 AppStage

在WiseDBA中变更数据库实例规格 - 应用平台 AppStage

在SLB中配置负载均衡实例共享 - 应用平台 AppStage

为微服务配置告警策略 - 应用平台 AppStage

ECS获取和上传基础镜像 - AI开发平台ModelArts

ECS中构建新镜像 - AI开发平台ModelArts

训练中的权重转换说明 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线