搜索_华为云

查看ModelArts模型详情 - AI开发平台ModelArts

元模型存储路径如果元模型来源于对象存储服务，显示元模型的存放路径。容器镜像存储路径如果元模型来源于容器镜像，显示容器镜像存储路径。 AI引擎如果元模型来源于训练作业/对象存储服务，显示模型使用的AI引擎。引擎包地址如果元模型来源于对象存储服务（AI引擎为Custom），显示引擎包地址。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理ModelArts模型
SDXL&SD1.5 WebUI基于Lite Cluster适配NPU推理指导（6.3.906） - AI开发平台ModelArts

检查docker是否安装。 docker -v #检查docker是否安装如尚未安装，运行以下命令安装docker。 yum install -y docker-engine.aarch64 docker-engine-selinux.noarch docker-runc

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
多模态模型推理性能测试 - AI开发平台ModelArts

多模态模型推理性能测试多模态模型推理的性能测试目前仅支持静态性能测试。静态性能测试是指评估在固定输入、固定输出和固定并发下，模型的吞吐与首token延迟。该方式实现简单，能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。性能benchmark验证使用到的脚本存放在代码包AscendCloud-LLM-xxx

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务性能评测
产品优势 - AI开发平台ModelArts
产品优势 - AI开发平台ModelArts

AI工程化能力，支持AI全流程生命周期管理支持MLOps能力，提供数据诊断、模型监测等分析能力，训练智能日志分析与诊断。容错能力强，故障恢复快提供机柜、节点、加速卡、任务多场景故障感知和检测。提供节点级、作业级、容器级，多级故障恢复，保障千卡作业稳定训练。多种资源形态集群模式，开箱即提供好Kubernetes集群，直接使用，方便高效。

帮助中心 > AI开发平台ModelArts > 产品介绍
监控Lite Cluster资源 - AI开发平台ModelArts

监控Lite Cluster资源使用AOM查看Lite Cluster监控指标使用Prometheus查看Lite Cluster监控指标父主题： Lite Cluster资源管理

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
语言模型推理性能测试 - AI开发平台ModelArts

benchmark_serving.csv --backend：服务类型，如tgi，vllm，mindspore、openai。 --host ${docker_ip}：服务部署的IP地址，${docker_ip}替换为宿主机实际的IP地址。 --port：推理服务端口。 --dataset：数据集路径。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 推理性能测试
不同机型的对应的软件配套版本 - AI开发平台ModelArts

集群类型：CCE Standard 集群版本：v1.23|v1.25|v1.28（推荐）集群规模：50|200|1000|2000 集群网络模式：容器隧道网络|VPC 集群转发模式：iptables|ipvs 驱动和插件版本与CCE集群版本适配关系表3 插件版本与CCE集群版本适配关系

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster使用前必读
从OBS中导入模型文件创建模型 - AI开发平台ModelArts

s定义”修改模型的配置信息。 “部署类型” 选择此模型支持部署服务的类型，部署上线时只支持部署为此处选择的部署类型，例如此处只选择在线服务，那您导入后只能部署为在线服务。当前支持“在线服务”、“批量服务”和“边缘服务”。 “启动命令” 选填参数，指定模型的启动命令，您可以自定义该命令。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
管理Lite Cluster节点池 - AI开发平台ModelArts

见Step6 购买Cluster资源。查看节点列表当您想查看某一节点池下的节点相关信息，可单击操作列的“节点列表”，可查询节点的名称、规格及可用区。更新节点池当您想更新节点池配置时，可单击操作列的“更新”，相关参数介绍请参见Step6 购买Cluster资源。需注意，更

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
释放Lite Cluster资源 - AI开发平台ModelArts

释放Lite Cluster资源针对不再使用的Lite Cluster资源，可以释放资源，停止计费相关介绍请见停止计费。 Lite Cluster资源池资源释放后不可恢复，请谨慎操作。退订包年/包月的Lite Cluster资源登录ModelArts管理控制台，在左侧菜单栏中选择“AI专属资源池

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
扩缩容Lite Cluster资源池 - AI开发平台ModelArts

Interface (CRI) 与容器引擎交互，以管理镜像和容器。其中Containerd调用链更短，组件更少，更稳定，占用节点资源更少，Containerd和Docker差异对比请见容器引擎。若CCE集群版本低于1.23，仅支持选择Docker作为容器引擎。若CCE集群版本大于等于1.2

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
Lite Cluster资源管理介绍 - AI开发平台ModelArts

监控Lite Cluster资源：ModelArts支持使用AOM和Prometheus对资源进行监控，方便您了解当前的资源使用情况。释放Lite Cluster资源：针对不再使用的Lite Cluster资源，您可以释放资源。图1 Lite Cluster资源管理介绍父主题：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
创建Standard专属资源池 - AI开发平台ModelArts

议商用场景选择手动分配，确保网段符合用户诉求。自定义：需要自定义K8S容器网段和K8S服务网段。 K8S容器网段：集群下容器使用的网段，决定了集群下容器的数量上限。创建后不可修改。 K8S服务网段：同一集群下容器互相访问时使用的Service资源的网段。决定了Service资源的上限。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理
管理Lite Cluster资源池 - AI开发平台ModelArts

节点池管理操作请参见管理Lite Cluster节点池节点管理操作请参见管理Lite Cluster节点扩缩容Lite Cluster资源池操作请参见扩缩容Lite Cluster资源池升级Lite Cluster资源池驱动操作请参见升级Lite Cluster资源池驱动升级Lite

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
创建IAM用户并授权使用ModelArts - AI开发平台ModelArts

行数据中转。 OBS OperateAccess 必选 SWR容器镜像仓库授予子用户使用SWR服务权限。ModelArts的自定义镜像功能依赖镜像服务SWR FullAccess权限。 SWR OperateAccess 必选密钥管理服务当子用户使用ModelArts No

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard准备工作 > 配置ModelArts Standard访问授权
推理性能测试 - AI开发平台ModelArts

benchmark方法介绍性能benchmark包括两部分。静态性能测试：评估在固定输入、固定输出和固定并发下，模型的吞吐与首token延迟。该方式实现简单，能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。动态性能测试：评估在请求并发在一定范围内波动，且输入输出长度也在一

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.906）
推理性能测试 - AI开发平台ModelArts

benchmark方法介绍性能benchmark包括两部分。静态性能测试：评估在固定输入、固定输出和固定并发下，模型的吞吐与首token延迟。该方式实现简单，能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。动态性能测试：评估在请求并发在一定范围内波动，且输入输出长度也在一

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于LIte Server适配PyTorch NPU推理指导（6.3.905）
Lite Cluster高危操作一览表 - AI开发平台ModelArts

Lite Cluster高危操作一览表当您在CCE、ECS或BMS服务控制台直接操作ModelArts Lite Lite Cluster资源时，可能会导致资源池部分功能异常。下表可帮助您定位异常出现的原因，风险操作包括但不限于以下内容。高危操作风险等级说明：高：对于可能直

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster使用前必读
Lite Cluster资源使用 - AI开发平台ModelArts

Lite Cluster资源使用在Lite Cluster资源池上使用Snt9B完成分布式训练任务在Lite Cluster资源池上使用ranktable路由规划完成Pytorch NPU分布式训练在Lite Cluster资源池上使用Snt9B完成推理任务

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster）
推理性能测试 - AI开发平台ModelArts

benchmark方法介绍性能benchmark包括两部分。静态性能测试：评估在固定输入、固定输出和固定并发下，模型的吞吐与首token延迟。该方式实现简单，能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。动态性能测试：评估在请求并发在一定范围内波动，且输入输出长度也在一

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.907）

总条数： 1170

上一页
1
2
3
4
5
...
59
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查看ModelArts模型详情 - AI开发平台ModelArts

SDXL&SD1.5 WebUI基于Lite Cluster适配NPU推理指导（6.3.906） - AI开发平台ModelArts

多模态模型推理性能测试 - AI开发平台ModelArts

产品优势 - AI开发平台ModelArts

监控Lite Cluster资源 - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

不同机型的对应的软件配套版本 - AI开发平台ModelArts

从OBS中导入模型文件创建模型 - AI开发平台ModelArts

管理Lite Cluster节点池 - AI开发平台ModelArts

释放Lite Cluster资源 - AI开发平台ModelArts

扩缩容Lite Cluster资源池 - AI开发平台ModelArts

Lite Cluster资源管理介绍 - AI开发平台ModelArts

创建Standard专属资源池 - AI开发平台ModelArts

管理Lite Cluster资源池 - AI开发平台ModelArts

创建IAM用户并授权使用ModelArts - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

Lite Cluster高危操作一览表 - AI开发平台ModelArts

Lite Cluster资源使用 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线