搜索_华为云

主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）推理场景介绍准备工作部署推理服务推理性能测试推理精度测试推理模型量化附录：基于vLLM不同模型推理支持最小卡数和最大序列说明附录：大模型推理常见问题附录：工作负载Pod异常问题和解决方法

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

Ascend: 8*ascend-snt9b表示Ascend 8卡。购买并开通资源如果使用Cluster资源，请先阅读k8s Cluster资源购买，熟悉集群资源开通流程，再开始操作购买Cluster资源。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

Ascend: 8*ascend-snt9b表示Ascend 8卡。购买并开通资源如果使用Cluster资源，请先阅读k8s Cluster资源购买，熟悉集群资源开通流程，再开始操作购买Cluster资源。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） - AI开发平台ModelArts

主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）推理场景介绍准备工作部署推理服务推理性能测试推理精度测试推理模型量化 eagle投机小模型训练附录：基于vLLM不同模型推理支持最小卡数和最大序列说明附录：大模型推理常见问题

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
使用AOM查看Lite Cluster监控指标 - AI开发平台ModelArts

Label名字 Label描述容器级别指标 pod_name 容器所属pod的名字。 pod_id 容器所属pod的ID。 node_ip 容器所属的节点IP值。 container_id 容器ID。 cluster_id 集群ID。 cluster_name 集群名称。 container_name

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理 > 监控Lite Cluster资源
昇腾云服务6.3.905版本说明 - AI开发平台ModelArts

容器镜像OS：hce_2.0 PyTorch：pytorch_2.1.0 FrameworkPTAdapter：6.0.RC2 如果用到CCE，版本要求是CCE Turbo v1.25及以上软件包获取地址软件包名称软件包说明获取地址 AscendCloud-3rdLLM-6.3.905-20240611214128

帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
在ECS上构建自定义镜像并在Notebook中使用 - AI开发平台ModelArts

准备一台Linux环境，这里以ECS为例。在ECS中构建镜像（本文档提供了Dockflie样例文件）。将构建的镜像推到SWR。注册SWR镜像到ModelArts。创建Notebook并验证新镜像。准备Docker机器并配置环境信息准备一台具有Docker功能的机器，如果没有，建议申请一台弹性云

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于创建Notebook
主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.910） - AI开发平台ModelArts

主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.910）场景介绍准备工作预训练任务 SFT全参微调训练任务 LoRA微调训练查看日志和性能训练脚本说明常见错误原因和解决方法父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.909） - AI开发平台ModelArts

主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.909）场景介绍准备工作预训练任务 SFT全参微调训练任务 LoRA微调训练查看日志和性能训练脚本说明常见错误原因和解决方法父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
昇腾云服务6.3.906版本说明 - AI开发平台ModelArts

容器镜像OS：hce_2.0 PyTorch：pytorch_2.1.0 FrameworkPTAdapter：6.0.RC2 如果用到CCE，版本要求是CCE Turbo v1.25及以上软件包获取地址软件包名称软件包说明获取地址 AscendCloud-6.3.906-xxx

帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

Ascend: 8*ascend-snt9b表示Ascend 8卡。购买并开通资源如果使用Cluster资源，请先阅读k8s Cluster资源购买，熟悉集群资源开通流程，再开始操作购买Cluster资源。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.911） - AI开发平台ModelArts

主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.911）场景介绍准备工作预训练任务 SFT全参微调训练任务 LoRA微调训练查看日志和性能训练脚本说明常见错误原因和解决方法父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） - AI开发平台ModelArts

主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912）场景介绍准备工作训练任务查看日志和性能训练脚本说明参考常见错误原因和解决方法父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
释放Lite Cluster资源 - AI开发平台ModelArts

释放Lite Cluster资源针对不再使用的Lite Cluster资源，可以释放资源，停止计费相关介绍请见停止计费。 Lite Cluster资源池资源释放后不可恢复，请谨慎操作。退订包年/包月的Lite Cluster资源登录ModelArts管理控制台，在左侧菜单栏中选择“AI专属资源池

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
使用Prometheus查看Lite Cluster监控指标 - AI开发平台ModelArts

- role: pod relabel_configs: - source_labels: [__meta_kubernetes_pod_name] # 指定从maos-node-agent-字符串开头的POD收集指标数据

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理 > 监控Lite Cluster资源
PD分离部署使用说明 - AI开发平台ModelArts

以下介绍如何启动全量推理实例。启动容器镜像前请先按照参数说明修改${}中的参数。docker启动失败会有对应的error提示，启动成功会有对应的docker id生成，并且不会报错。 docker run -itd \ --device=/dev/davinci4 \ --device=/dev/davinci5

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 分离部署
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

检查docker是否安装。 docker -v #检查docker是否安装如尚未安装，运行以下命令安装docker。 yum install -y docker-engine.aarch64 docker-engine-selinux.noarch docker-runc

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

检查docker是否安装。 docker -v #检查docker是否安装如尚未安装，运行以下命令安装docker。 yum install -y docker-engine.aarch64 docker-engine-selinux.noarch docker-runc

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
准备镜像环境 - AI开发平台ModelArts

检查是否安装docker。 docker -v #检查docker是否安装如尚未安装，运行以下命令安装docker。 yum install -y docker-engine.aarch64 docker-engine-selinux.noarch docker-runc.aarch64

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理 > SD1.5&SDXL Koyha框架基于DevServer适配PyTorch NPU训练指导（6.3.908）
语言模型推理性能测试 - AI开发平台ModelArts

参数说明 --backend：服务类型，支持tgi、vllm、mindspore、openai等后端。本文档使用的推理接口是openai。 --host：服务部署的IP，${docker_ip}替换为宿主机实际的IP地址。 --port：推理服务端口。 --tokenizer：tok

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909） > 推理性能测试

总条数： 2351

上一页
1
...
8
9
10
...
118
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） - AI开发平台ModelArts

使用AOM查看Lite Cluster监控指标 - AI开发平台ModelArts

昇腾云服务6.3.905版本说明 - AI开发平台ModelArts

在ECS上构建自定义镜像并在Notebook中使用 - AI开发平台ModelArts

主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.910） - AI开发平台ModelArts

主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.909） - AI开发平台ModelArts

昇腾云服务6.3.906版本说明 - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.911） - AI开发平台ModelArts

主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） - AI开发平台ModelArts

释放Lite Cluster资源 - AI开发平台ModelArts

使用Prometheus查看Lite Cluster监控指标 - AI开发平台ModelArts

PD分离部署使用说明 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线