检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
资源准备 在集群中添加GPU节点 登录CCE控制台,单击已创建的集群,进入集群控制台。 安装GPU插件。 在左侧导航栏中选择“插件管理”,在右侧找到gpu-beta(或gpu-device-plugin),单击“安装”。 在安装插件页面,设置插件关键参数。 Nvidia驱动:填写
测试用例)的附件的总容量。 知识库存储扩展 单价*存储容量*购买时长 制品仓库存储容量 某一Region内,租户中发布库和私有依赖库的总容量 制品仓库存储扩展 代码托管存储容量 某一Region内,租户中所有代码仓的总容量。 代码托管存储扩展 测试计划用例容量 某一Region内,测试计划单版本包含的用例数。
基于Kubernetes构建一个端到端的AI计算平台是非常复杂和繁琐的过程,它需要处理很多个环节。如图1所示,除了熟知的模型训练环节之外还包括数据收集、预处理、资源管理、特性提取、数据验证、模型的管理、模型发布、监控等环节。对于一个AI算法工程师来讲,如果要做模型训练,就不得不搭建一套AI计算平台,这个过程耗时费力,而且需要很多的知识积累。
IfNotPresent imagePullSecrets: - name: default-secret 父主题: 批量计算
设置容量开关 用户可选择是否开启资产自动上架功能、是否显示“容量规划”网格、是否开启区分业务机柜功能、是否开启设计供电功率功能以及是否开启相邻U位不可用功能。 前提条件 已具备“容量开关设置”的操作权限。 操作步骤 选择“运营管理 > 容量管理 > 容量配置”。 在左侧导航栏中,
云备份存储库存储容量不足怎么办? 当存储库存储容量超过上限后,系统将不会继续执行备份,不会出现新备份覆盖旧备份的情况。 您可以通过扩容存储库、减少备份副本数量和迁移存储库资源三种方式,解决容量不足的问题。 扩容存储库 如果还需要保留产生的备份,可以选择扩容存储库,具体操作请参见扩容存储库。
容量管理 了解容量管理 操作流程全景图 容量规划 容量配置 父主题: 运营管理
预置条件 本实践提供在CCE上运行caffe的基础分类例子https://github.com/BVLC/caffe/blob/master/examples/00-classification.ipynb的过程。 OBS存储数据预置 创建OBS桶,并确认以下文件夹已创建,文件已上传至指定位置(需要使用OBS
查询DCC容量 功能 查询DCC专属计算集群,即DCC专属计算集群中的CPU\MEM等计算资源总量、已分配使用量,剩余可用量等资源容量数据。 SLA项 定义 请求成功率 ≥99% 可用性 Tier 2 数据一致性 强一致 吞吐量 60 次/分钟 TP50请求时延 200 ms TP99
在“计算节点管理”页面,查找需要发布数据的计算节点名称,单击“计算节点名称”进入计算节点详情页。 图5 选择计算节点 在“计算节点详情”页,单击“前往计算节点”,在登录页正确输入部署计算节点时设置的“登录用户名”和“密码”。 图6 前往计算节点 在左侧导航树上单击“基本信息”,在“基本信息”页面找到“计算节点状态”部分,触发计算节点状态切换操作。
MRS存算分离配置流程说明 MRS支持在大数据存储容量大、计算资源需要弹性扩展的场景下,用户将数据存储在OBS服务中,使用MRS集群仅作数据计算处理的存算分离模式,从而实现按需灵活扩展资源、低成本的海量数据分析方案。 大数据存算分离场景,请务必使用OBS并行文件系统(并行文件系统
应用程序完成后,执行程序的Pod将终止并清理,但驱动程序Pod仍然存在并保持在“已停止”状态,直到最终进行垃圾回收或手动清理。在“已停止”状态下,驱动程序Pod不会使用任何计算或内存资源。 图1 提交机制的工作原理 在CCE上运行SparkPi例子 在执行Spark的机器上安装kubectl,详情请参见通过kubectl连接集群。
"clickhousekeeperinstallations.clickhouse-keeper.altinity.com" deleted ... 父主题: 批量计算
专属计算资源池的内存分配率是如何计算的? 在“资源使用详情”区域内,内存分配率统计了当前系统的真实情况,包括部分系统管理内存。各项指标的计算方法如下。 总量:可用内存容量,指所有DeC物理服务器上的物理内存容量总和。内存总量数值为“分配给DeC物理服务器的总内存容量”减去“物理服
Tensorflow训练 Kubeflow部署成功后,使用ps-worker的模式来进行Tensorflow训练就变得非常容易。本节介绍一个Kubeflow官方的Tensorflow训练范例,您可参考TensorFlow Training (TFJob)获取更详细的信息。 创建MNIST示例
查询物理设备资源容量 查询计算资源池、存储资源池可用的资源容量。 计算资源池(构建资源池用到的物理计算集群)即包含:可分配总量(vCPU\MEM)、已分配量(vCPU\MEM)、剩余可用量(vCPU\MEM)等资源容量数据。 存储资源池(构建资源池用到的物理存储集群)即包含:可分
计算服务 本章节主要介绍弹性云服务器、裸金属服务器和镜像服务,让您更好的了解这些计算服务。 弹性云服务器 弹性云服务器(Elastic Cloud Server,ECS)是由CPU、内存、镜像、云硬盘组成的一种可随时获取、弹性可扩展的计算服务器,同时它结合VPC、虚拟防火墙、数据
安装Spark 前提条件 您需要准备一台可访问公网的Linux机器,节点规格建议为4U8G及以上。 配置JDK 以CentOS系统为例,安装JDK 1.8。 查询可用的JDK版本。 yum -y list java* 选择安装JDK 1.8。 yum install -y java-1
为什么裸金属服务器操作系统内查看的容量大小比官网标称中容量要小? 在操作系统中查看硬盘容量时,获得的容量可能会比BMS服务官网标称的容量小,造成该差异的因素有以下几类: 硬件厂商对于存储容量的计算方式和操作系统不同。硬件厂商在生产硬盘时采用十进制来计算容量,1GB=1000*1000*
签名计算工具 OBS提供可视化签名计算工具,帮助您轻松完成签名计算。 表1 签名计算工具 签名计算方式 签名计算工具获取地址 Header中携带签名 可视化签名计算工具 URL中携带签名 可视化签名计算工具 工具使用步骤 本节介绍如何使用工具计算签名 使用工具计算Header中携带的签名