搜索_华为云

AI服务部署 - 云容器引擎 CCE
AI服务部署 - 云容器引擎 CCE

AI服务部署 AI推理框架插件 AI推理网关插件 LeaderWorkerSet插件 kagent插件父主题：云原生AI

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生AI
AI任务管理 - 云容器引擎 CCE
AI任务管理 - 云容器引擎 CCE

AI任务管理 Kubeflow插件 Kuberay 父主题：云原生AI

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生AI
云原生AI插件 - 云容器引擎 CCE
云原生AI插件 - 云容器引擎 CCE

云原生AI插件 CCE AI套件（NVIDIA GPU） CCE AI套件（Ascend NPU）父主题：插件

 帮助中心 > 云容器引擎 CCE > 用户指南 > 插件
AI数据加速 - 云容器引擎 CCE
AI数据加速 - 云容器引擎 CCE

AI数据加速 Fluid数据加速引擎概述 AI数据加速引擎插件父主题：云原生AI

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生AI
CCE AI套件（Ascend NPU） - 云容器引擎 CCE

container_path 否 String 容器里用于挂载Hiai library的路径默认值："/usr/local/HiAI_unused" host_path 否 String 主机上包含Hiai library的路径默认值："/usr/local/HiAI_unused"

帮助中心 > 云容器引擎 CCE > API参考 > API > 插件实例字段说明
CCE AI套件（Ascend NPU） - 云容器引擎 CCE

CCE AI套件（Ascend NPU）插件简介 CCE AI套件（Ascend NPU）是支持容器里使用huawei NPU设备的管理插件。安装本插件后，可创建“AI加速型”节点，实现快速高效地处理推理和图像识别等工作。约束与限制集群中使用“AI加速型”节点时必须安装CCE

帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 云原生AI插件
AI负载调度 - 云容器引擎 CCE
AI负载调度 - 云容器引擎 CCE

AI负载调度本文主要介绍Volcano调度器在AI负载调度方面的关键功能，包括弹性调度、任务调度、异构资源调度和任务队列调度。Volcano调度器提供高性能任务调度引擎、高性能异构芯片管理、高性能任务运行管理等通用计算能力，旨在提升AI负载的调度效率和运行性能。弹性调度 Vo

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生AI
AI推理框架插件 - 云容器引擎 CCE

persistentVolumeClaim: claimName: ${pvc_name} size: 1 workerTemplate: spec: containers: [] 模型部署 AI推理框架插件提供一套完整的AI模型部署方

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生AI > AI服务部署
CCE AI套件（NVIDIA GPU） - 云容器引擎 CCE

Container Runtime等不兼容，继而导致驱动安装失败或者CCE AI套件（NVIDIA GPU）插件异常。对于使用自定义GPU驱动的场景，请您自行验证。安装插件登录CCE控制台，单击集群名称进入集群，在左侧导航栏中选择“插件中心”，在右侧找到CCE AI套件（NVIDIA

帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 云原生AI插件
AI数据加速引擎插件 - 云容器引擎 CCE

AI数据加速引擎插件在处理AI和大数据任务时，Kubernetes面临计算存储分离导致的高延迟和带宽浪费、数据管理不足、存储接口碎片化，以及缺乏智能数据感知与调度等核心挑战。为此，CCE Standard/Turbo集群基于Fluid提供AI数据加速引擎插件。该插件提供数据集抽

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生AI > AI数据加速
CCE AI套件（NVIDIA GPU） - 云容器引擎 CCE

CCE AI套件（NVIDIA GPU）插件介绍 CCE AI套件（NVIDIA GPU）插件是支持在容器中使用GPU显卡的设备管理插件，集群中使用GPU节点时必须安装本插件。字段说明表1 参数描述参数是否必选参数类型描述 basic 是 object 插件基础配置参数。

帮助中心 > 云容器引擎 CCE > API参考 > API > 插件实例字段说明
云原生AI套件概述 - 云容器引擎 CCE

云原生AI套件概述云原生AI套件以华为云CCE服务为基础，为您提供开箱即用的AI训练与推理全流程的解决方案，涵盖AI资源管理、AI负载调度、AI任务管理、AI数据加速及AI服务部署等服务，提供端到端的全栈支持与优化。图1 云原生AI套件架构图 AI资源管理 CCE AI套件（NVIDIA

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生AI
AI推理网关插件 - 云容器引擎 CCE

AI推理网关插件随着大规模语言模型（LLM）及人工智能（AI）推理服务的迅猛发展，云原生AI团队面临着愈加复杂的推理流量治理难题。在AI推理应用场景中，除了传统的基于HTTP路径和协议的流量路由外，还需根据“模型名称”、“推理优先级”以及“模型版本”等AI业务属性，灵活地进行流

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生AI > AI服务部署
云原生AI - 云容器引擎 CCE
云原生AI - 云容器引擎 CCE

云原生AI 云原生AI套件概述 AI负载调度 AI任务管理 AI数据加速 AI服务部署

 帮助中心 > 云容器引擎 CCE > 用户指南
Kubeflow插件 - 云容器引擎 CCE
Kubeflow插件 - 云容器引擎 CCE

executors: # 配置执行器 exec-comp: container: # 容器配置，表示CCE集群中Pod执行的具体任务 image: python:3.9 # 使用python 3.9镜像 command:

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生AI > AI任务管理
Fluid数据加速引擎概述 - 云容器引擎 CCE

Fluid数据加速引擎概述 Fluid是云原生领域的一款分布式数据集编排与加速引擎，专为大数据和AI应用设计。它旨在通过透明的数据管理和优化调度，帮助AI和大数据应用高效利用任何存储的数据，而无需修改现有应用。Fluid支持自动化的数据调度、缓存加速和弹性扩展，提升数据访问效率，

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生AI > AI数据加速
kagent插件 - 云容器引擎 CCE
kagent插件 - 云容器引擎 CCE

agent能力，提供开箱即用的kagent插件，支持一键部署生产级AI运维代理框架，实现智能化的集群管理体验。基本概念表1 插件基本概念概念定义作用代理（Agent） AI Agent是一种基于人工智能的应用程序，能够以自然语言与用户交互，并代表用户执行任务。自然语

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生AI > AI服务部署
Container配置 - 云容器引擎 CCE
Container配置 - 云容器引擎 CCE

ReadinessProbe 无无允许 - 指示容器是否准备好为请求提供服务。如果就绪态探测失败，端点控制器将从与 Pod 匹配的所有服务的端点列表中删除该 Pod 的 IP 地址。初始延迟之前的就绪态的状态值默认为 Failure。如果容器不提供就绪态探针，则默认状态为 Success。

帮助中心 > 云容器引擎 CCE > 配置参考 > Pod
Kuberay - 云容器引擎 CCE
Kuberay - 云容器引擎 CCE

- containerPort: 6379 name: gcs - containerPort: 8265 name: dashboard - containerPort: 10001

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生AI > AI任务管理
LeaderWorkerSet插件 - 云容器引擎 CCE

用于标识Pod角色 spec: containers: - name: vllm-leader image: vllm/vllm-openai:latest # 使用官方vLLM镜像

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生AI > AI服务部署

总条数： 894

上一页
1
2
3
4
5
...
45
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

0/200

提交反馈取消