数仓DWS支持多少节点
GaussDB(DWS)场景与案例 GaussDB(DWS)场景与案例 标准数仓、实时数仓、云数仓等多种产品形态,覆盖政府、金融、企业、教育、通信、互联网等各种行业的各种应用场景。 标准数仓、实时数仓、云数仓等多种产品形态,覆盖政府、金融、企业、教育、通信、互联网等各种行业的各种应用场景。
5步快速使用云数据仓库 5步快速使用云数据仓库 01 注册华为云并实名认证 打开华为云网站,单击”注册“,根据提示信息完成注册,注册成功后,按指引完成个人或企业实名认证。 02 创建集群 针对不同分析场景和业务规模,可以选择标准数仓、实时数仓和IoT数仓,并选择合适的数据存储容量。为
对象存储服务(OBS)的计费规则进行计费。 免费空间大小是您的集群的总存储空间大小,即单节点存储空间大小 x 节点数。 标准数仓存储 用户在可选范围内自定义集群使用的存储类型与存储容量,采用存储资源独立计费的方式。 冷数据存储 冷数据采用OBS存储性价比高,按需或包周期集群均使用按需计费,无需提前购买。
GaussDB(DWS)学习与资源 GaussDB(DWS)学习与资源 数据仓库服务GaussDB(DWS)的培训课程、知识讲座和社区论坛。 数据仓库服务GaussDB(DWS)的培训课程、知识讲座和社区论坛。 数据分析实验室 — 手把手教您使用云数仓 数据分析实验室是华为云官方
数据仓库服务 GaussDB(DWS)兼容性 GaussDB(DWS)采用开放性的设计理念,不但支持标准数仓功能,还致力于融合大数据平台、与云原生服务互联互通。 无缝对接Hadoop GaussDB(DWS)可以无缝对接HDFS存储,通过外表机制,能够交互式查询分析Hadoop平
湖内数据全触达,实现湖、仓、智融合统一。 LakeFormation服务是数智融合的关键基础设施,帮助客户简单高效完成数智融合一体化解决方案搭建,为客户提供多种引擎元数据统一管理、统一权限控制、统一事务的能力,保障云原生数据湖内数据和模型自由流转,湖内数据全触达,实现湖、仓、智融合统一。
互联网 方案概述 通过数据复制服务+flink实时计算引擎构建实时数仓系统,轻量级数仓建模完成数据集市层和数据应用层构建;通过DataArts Studio数据开发进行实时作业/数仓任务的开发、编排调度、数据分析、运营运维 业务价值 基于业务诉求,构建用户分析系统、日志分析系统、营销
定集群的所有配置数据和业务数据,快照可用于还原某一时刻的集群。用户可以为集群手动创建快照,也可以开启定时创建自动快照。自动快照有保留天数限制,用户可以对自动快照进行复制,生成手工快照以便长期保留。 当您从快照恢复集群时,系统将为您创建一个与原始集群规格相同、节点数也相同的新集群,并导入快照数据。
采用一致性Hash技术使得重分布过程中需要迁移的数据量最小。 重分布过程中支持多表并行及用户自主选择表的重分布顺序。 支持扩容进度查询,实时监控扩容进度。 随着节点数增加,集群性能线性增长。 在全并行分布式架构下,随着节点数的增加,集群的数据加载性能、业务处理性能和容量可线性扩展。 透明安全技术 GaussD
具备使用数仓产品GaussDB(DWS)进行开发和部分运维的工程师。课程内容:GaussDB(DWS)概览,GaussDB(DWS)数据库设计,GaussDB(DWS)SQL开发,GaussDB(DWS)开发应用,GaussDB(DWS)安全设计,GaussDB(DWS)集群管理
DWS.DCS设计云系统是一个高度集成且协同化的研发管理系统,通过平台的建设可为用户单位提供精准定位连接内部研发所需的图形硬件支撑资源(工作站/图形服务器)、三维应用工具软件,用户无论身处何地,都能轻松访问平台,进行高质量的三维设计业务开展产品功能:戴西DWS.DCS设计云系统是
爱数 AnyBackup Family 7 是联合华为云基础服务,共同打造的一种适合混合 IT 架构,以按需订阅方式降低整体 TCO 的备份服务爱数 AnyBackup Family 7 是联合华为云基础服务,共同打造的一种适合混合 IT 架构,以按需订阅方式降低整体 TCO 的备份服务。服务类型说明:爱数
戴西DWS数字化研发平台是一种综合性数字化研发解决方案,由戴西软件结合15年经验自主研发,面向于工业制造业各企业提供集设计、仿真、数据、试验、流程、许可、知识、文档管理、协同研发流程等一体化的可定制化数字化方案服务。产品功能:戴西DWS数字化研发平台主要功能涵盖统一门户、统一用户
爱数 AnyBackup Family 7 (HCS版) 是联合华为云基础服务,提供混合云下的数据备份与容灾解决方案,降低整体 TCO,保障数据安全。服务类型说明:爱数 AnyBackup Family 7 支持服务(HCS版) 提供3种服务:专业服务、维保服务和配套服务。 一.
LakeInsight 是数元灵研发的一站式实时数据分析和 AI 开发平台,基于自研开源湖仓一体框架 LakeSoul 和云原生容器化架构。提供多源数据实时集成,实时数仓建模,BI 指标报表和 AI 开发,与华为云生态深度集成。LakeInsightLakeInsight 是数元灵基于国产开
精容数安备份与恢复系统,是精容数安根据《信息安全技术 网络安全等级保护基本要求》,自主研发的全栈式灾备管理系统,通过统一的管理界面,全面覆盖“等保2.0”中1-4级的所有灾备功能需求,助力用户合理合规地保护其数字资产及其业务的连续性运行。精容数安提供的配套服务分为:专家咨询服务、交付服务和远程服务。1
平台是赋能集团/企业与外部企业数据跨节点计算及价值挖掘的轻量级隐私计算产品。提供包括联邦学习、多方安全计算等核心隐私计算算法及安全的隐私安全计算环境,并提供全流程的节点发现、数据发现、授权管理、计算管理、任务管理,实现多方数据安全流通。数据应用:我们不限制买卖方的数据条件,无论是否有标签都可以成为发起方。
云仓系统可基于鲲鹏云服务器进行部署,是一套仓库精细化管理系统,精确管理物料在收、发、转、装等环节准确的信息以及质量管控,帮助企业打造数字化、透明化仓储。云仓系统可基于鲲鹏云服务器进行部署,是一套仓库精细化管理系统,精确管理物料在收、发、转、装等环节准确的信息以及质量管控,通过对仓
时序生态函数等服务功能,基于时序表提供时序计算能力。 demo体验 立即购买 IoT数仓与标准数仓的区别 GaussDB(DWS)中的IoT数仓与标准数仓是两种不同类型产品,在使用上也存在一定差异,具体可参考表1进行对比分析。 表1 IoT数仓与标准数仓的差异 数仓类型 适用场景
数据仓库服务迁移类型 IoT数仓与标准数仓是GaussDB(DWS)的两种不同类型产品,在使用上也存在一定差异,具体可参考表1进行对比分析。 表1 IoT数仓与标准数仓的差异 数仓类型 适用场景 产品优势 功能特点 从OBS并行导入数据 OBS 支持将存储在OBS上的TXT、CSV、ORC及CARB
合数据分析。 传统数仓替换 传统数据库或数仓产品面临数据存不下、查不出、扩容难、成本高的痛点。GaussDB(DWS)作为新一代全场景数据仓库,具备极致性能、高扩展、极简易用、一站式分析等特性,满足大数据时代企业构建新型数仓的需求。 优势 平滑迁移:提供配套的迁移工具,可支持Te
这些角色的权限。 查看更多 实现数据列的加解密 数据加密作为有效防止未授权访问和防护数据泄露的技术,在各种信息系统中广泛使用。作为信息系统的核心,GaussDB(DWS)数仓支持使用SQL函数加密。 查看更多 用户管理实践 GaussDB(DWS)集群中,常用的用户分别是系统管理
更多精选文章推荐 什么是数据仓库服务GaussDB(DWS) 什么是DWS的IoT数仓 DWS有哪些连接工具和数据迁移工具 DWS数据库监控DMS介绍 GaussDB(DWS)的SQL on Anywhere Gauss(DWS)数据库加解密 GaussDB(DWS)常用SQL GaussDB(DWS)安全管理
支持多种数仓服务类型 根据需求,可以灵活选择数据服务类型,可以选择DWS服务建数仓,也可以选择MRS服务等数据平台。 安全稳定、降低成本 一站式的服务能力和稳定的数仓服务,让云上数据万无一失;免自建大数据集群、免运维,极大降低企业建设数仓成本。 数据治理中心 DataArts Studio应用场景三:基于行业领域知识库快速构建数据中台
接类型、名称和登录信息等。 并发数:并发数是数据集成作业中,可以从源端并行读取的最大线程数。 作业:在数据开发中,作业由一个或多个节点组成,共同执行以完成对数据的一系列操作。 节点:节点用于定义对数据执行的操作。例如,使用“MRS Spark”节点可以实现在MRS中执行预先定义的Spark作业。
如何调用GuassDB(DWS) API接口示例 精选文章推荐 DWS产品介绍_DWS产品优势_DWS功能 云服务器是什么? 对象存储OBS产品介绍 学习区块链技术 数据仓库服务迁移类型有哪些? 数据仓库服务_SQL on Anywhere GaussDB(DWS)安全管理 DWS如何保障数据库安全?
TMS解决方案。 微仓云WMS仓储管理软件的服务商是哪家公司? 微仓云WMS仓储管理软件的服务商是上海微仓网络科技有限公司。 介绍一下微仓云WMS仓储管理软件的服务商。 微仓云WMS仓储管理软件的服务商是上海微仓网络科技有限公司。该公司是国内知名物流软件服务商富勒科技FLUX投资
数仓DWS支持多少节点
操作场景
数据仓库服务GaussDB(DWS)是完全托管的企业级云上数据仓库服务,具备免运维、在线扩展、高效的多源数据加载能力,兼容 PostgreSQL 生态。助力企业经济高效地对海量数据进行在线分析,实现数据快速变现。
本文以创建3节点的GaussDB(DWS)集群为例,通过导入 OBS 桶上csv格式的数据,完成简单的数据查询。
GaussDB(DWS)集群不支持跨区域访问OBS桶数据,创GaussDB(DWS)集群前需规划好GaussDB(DWS)集群与OBS桶在同一个区域内,本文以“华北-北京四”为例。
- 计费方式:按需
- 版本选择:存算一体
- 集群节点:3
- 连接集群方式:SQL编辑器
- 存储容量:20G/节点
- 数据源:OBS桶的csv数据
- 集群版本:8.1.3.x
操作流程
步骤一:创建GaussDB(DWS)集群
- 登录管理控制台,进入 购买GaussDB (DWS)界面。
- 参见表2进行基础配置。
表2 基础配置 参数
示例
说明
区域
选择“华北-北京四”。
说明:本指导以“华北-北京四”为例进行介绍,如果您需要选择其他区域,请确保其他云服务均在同一区域。
请就近选择靠近您业务的区域,可以降低网络时延、提高访问速度。GaussDB(DWS)创建后无法更换区域,请谨慎选择。
更多信息,请参见区域和可用分区。
计费模式
按需计费。
支持包年/包月计费、按需计费。如长期使用,建议使用包年/包月,可享受更大折扣。
更多信息,请参见计费说明。
可用分区
单AZ,可用区1(如规格售罄,可选择其他可用区)。
- 单AZ:集群的所有节点部署在同一个AZ内。
- 多AZ:集群的节点部署在多个AZ内,满足集群跨AZ高可用要求,对高可用要求更高的业务,建议使用多AZ。
图1 基础配置
- 参见表3,进行数据仓库配置。
表3 数据仓库配置 参数
示例
说明
版本选择
存算一体
- 存算一体:数据存储在计算节点的本地磁盘。
- 存算分离:计算节点本地盘仅做数据缓存和存储元数据,用户数据存储在OBS 对象存储 上。
存储类型
SSD云盘
更多信息,请参见SSD云盘和本地盘的区别。
部署类型
集群
- 集群:至少3个 云服务器 节点组成的服务器群组,计算节点DN形成安全环,保证主备高可靠。
- 单机:单个云服务器节点,成本更低,但无法保证数据高可靠性。
CPU架构
鲲鹏
集群节点的CPU架构:支持鲲鹏和X86。
节点规格
dwsk2.xlarge
说明:如规格售罄,可选择其他可用区或规格。
节点规格是衡量GaussDB(DWS)算力的一个指标,包含vCPUs和内存,请根据业务需求合理选择,通常对查询性能要求越高,选择的规格越大。
更多信息,请参见数据仓库规格。
热数据存储
20GB / 节点
每节点可用存储容量。界面上显示的是业务数据实际存储容量,例如20GB/节点,节点总数3,则业务数据总容量为60GB。对于业务数据量较大的客户,请合理规划存储容量。
节点数量
3
集群节点的数量。支持的节点数范围为3~256。
图2 数据仓库配置
- 单击“下一步:网络配置”。
- 参见表4进行网络配置。
表4 网络配置 参数
示例
说明
vpc-default
GaussDB(DWS)所在的虚拟 私有云 网络。
子网
subnet-default(192.168.0.0/24)
虚拟私有云的子网。
安全组
自动创建安全组
支持“自动创建安全组”或选择已创建的安全组。
系统默认选中“自动创建安全组”,设置为该选项时,系统将会自动创建一个默认安全组。
默认安全组的规则如下:出方向允许所有访问,入方向只开放用户设置的GaussDB(DWS) 集群的数据库端口8000。
公网访问
暂不使用
如果连接GaussDB(DWS)的客户端跟GaussDB(DWS)不在一个虚拟私有云网络内,需要选择使用 弹性公网IP 。
暂不使用
用户使用客户端连接DWS集群时,如果用户仅连接一个CN节点地址,通过该CN节点内网IP或弹性 公网IP 连接时,只能连接到固定的CN节点上,存在CN单点问题。
利用 ELB 健康检查机制可将集群的CN请求快速转发到正常工作的CN节点上,当有CN故障节点时,也能第一时间切换流量到健康节点上,最大化降低集群访问故障。
更多信息,请参见集群绑定和解绑ELB。
图3 网络配置
- 单击“下一步:高级配置”,参见表5进行高级配置。
表5 高级配置 参数
示例
说明
集群名称
dws-demo
集群名称,用户自定义,支持后续修改。
集群版本
使用推荐版本
每个版本支持的数据库功能不同,默认选择推荐版本。如需使用高版本功能,请选择更高版本。
说明:白名单客户界面,会显示其他集群版本,请根据界面实际情况选择。
集群各版本支持功能,请参见产品公告。
管理员用户
dbadmin
指定数据库系统管理员的用户名,默认即可。
数据库系统管理员默认具有SYSADMIN属性,非三权分立模式下,拥有数据库最高权限。可用于规划数据库对象,例如创建数据库、用户、授权用户角色等操作。
更多信息,请参见数据库用户。
管理员密码
-
数据库系统管理员密码。
确认密码
-
数据库系统管理员密码。
数据库端口
8000
客户端连接GaussDB(DWS)数据库的端口,默认8000即可。
企业项目
default
仅当使用企业类型的账号创建GaussDB(DWS)时,会显示该参数。
用于按项目统一管理云资源。
高级配置
默认配置
高级配置支持“默认配置”和“自定义”。当选择“自定义”时,支持以下高级配置:
- 备份设备:OBS或者NFS。
- CN部署量:在大规模集群下,建议部署多个CN。
- 标签:在GaussDB(DWS)中,当用户创建集群后,如果想对集群添加如项目名称、业务类别、背景信息等相关信息的标识,用户可以通过添加标签来实现。如果用户在其他云服务中使用了标签,那么建议用户为同一个业务所使用的云资源创建相同的标签键值对以保持一致性。
- 加密数据库。开启后,GaussDB(DWS)将使用KMS(密钥管理服务)为集群及其快照的数据启用加密功能。
图4 高级配置
- 单击“下一步:确认配置”,确认无误后,单击“立即购买”。
等待约10分钟,集群创建成功。
步骤二:上传数据到OBS桶
- 创建OBS桶,参见OBS用户指南。
关键参数按如下填写,其他参数默认即可。
不支持跨区域访问OBS桶数据,OBS桶需跟GaussDB(DWS)创在同一个区域。例如“华北-北京四”。
- 区域:华北-北京四
- 桶名称:dws-obs01 (如提示冲突,可以依次递增到02、03)
- 桶策略:私有
- 创建OBS桶成功后,左侧选择“桶列表”,单击新创建的dws-obs01桶名,左侧导航选择“对象”,单击“新建文件夹”,文件夹名称为“input_data”,单击“确定”。
图5 新建文件夹
- 在本地PC创建3个csv数据文件,名字(含格式后缀)分别为product_info0.csv、product_info1.csv、product_info2.csv。
图6 创建csv文件
- 使用文本编辑工具分别打开3个csv文件,复制以下内容到每个csv文件中。
- product_info0.csv:
12345
100,XHDK-A,2017-09-01,A,2017 Shirt Women,red,M,328,2017-09-04,715,good! 205,KDKE-B,2017-09-01,A,2017 T-shirt Women,pink,L,584,2017-09-05,40,very good! 300,JODL-X,2017-09-01,A,2017 T-shirt men,red,XL,15,2017-09-03,502,Bad. 310,QQPX-R,2017-09-02,B,2017 jacket women,red,L,411,2017-09-05,436,It's nice. 150,ABEF-C,2017-09-03,B,2017 Jeans Women,blue,M,123,2017-09-06,120,good.
- product_info1.csv:
12345
200,BCQP-E,2017-09-04,B,2017 casual pants men,black,L,997,2017-09-10,301,good quality. 250,EABE-D,2017-09-10,A,2017 dress women,black,S,841,2017-09-15,299,This dress fits well. 108,CDXK-F,2017-09-11,A,2017 dress women,red,M,85,2017-09-14,22,It's really amazing to buy. 450,MMCE-H,2017-09-11,A,2017 jacket women,white,M,114,2017-09-14,22,very good. 260,OCDA-G,2017-09-12,B,2017 woolen coat women,red,L,2004,2017-09-15,826,Very comfortable.
- product_info2.csv:
1 2 3 4 5 6 7 8 910
980,"ZKDS-J",2017-09-13,"B","2017 Women's Cotton Clothing","red","M",112,,, 98,"FKQB-I",2017-09-15,"B","2017 new shoes men","red","M",4345,2017-09-18,547350,"DMQY-K",2017-09-21,"A","2017 pants men","red","37",28,2017-09-25,58,"good","good","good"80,"GKLW-l",2017-09-22,"A","2017 Jeans Men","red","39",58,2017-09-25,72,"Very comfortable."30,"HWEC-L",2017-09-23,"A","2017 shoes women","red","M",403,2017-09-26,607,"good!"40,"IQPD-M",2017-09-24,"B","2017 new pants Women","red","M",35,2017-09-27,52,"very good."50,"LPEC-N",2017-09-25,"B","2017 dress Women","red","M",29,2017-09-28,47,"not good at all."60,"NQAB-O",2017-09-26,"B","2017 jacket women","red","S",69,2017-09-29,70,"It's beautiful."70,"HWNB-P",2017-09-27,"B","2017 jacket women","red","L",30,2017-09-30,55,"I like it so much"80,"JKHU-Q",2017-09-29,"C","2017 T-shirt","red","M",90,2017-10-02,82,"very good."
- product_info0.csv:
- 使用文本编辑工具转为UTF-8编码,并保存。
- 回到浏览器上的OBS控制台,左侧导航选择“桶列表”,单击新创建的dws-obs01桶名。
- 左侧导航选择“对象”,单击“input_data”文件夹。
- 单击“上传对象”,单击“添加文件”。
- 将product_info0.csv、product_info1.csv、product_info2.csv 3个文件上传到OBS桶。
步骤三:连接GaussDB(DWS)集群并导入数据进行分析
- 浏览器切换到GaussDB(DWS)管理控制台。
- 左侧导航选择“数据 > SQL编辑器”,单击“新增数据源”。
- 填写数据库连接信息。
- 集群:选择本文创建的dws-demo集群。
- 数据库:保持gaussdb默认。
- 数据源名称:dws-demo-01。
- 用户名:dbadmin
- 密码:步骤一:创建GaussDB(DWS)集群中创建GaussDB(DWS)时设置的密码。
- 勾选“记住密码”,单击“测试连接”。
图7 数据库连接信息
- 单击“确定”。
如下图,数据源名称前面图标为绿色,表示数据库连接成功。右侧区域为SQL编辑器窗口,可进行后续的SQL编写并执行SQL语句。
图8 连接数据库成功
后续连接会话超时,或者浏览器重新刷新时,图标置为灰色,表示连接断开,可以直接双击数据源名称重新连接数据库。
- 将以下SQL语句复制到SQL编辑器窗口中,并将OBS桶名称、AK值、SK值,替换成实际值。
本文OBS桶名为dws-obs01,AK值和SK值从访问密钥获取。
1 2 3 4 5 6 7 8 9101112131415161718192021222324252627282930
CREATE FOREIGN TABLE product_info_ext ( product_price integer not null, product_id char(30) not null, product_time date, product_level char(10), product_name varchar(200), product_type1 varchar(20), product_type2 char(10), product_monthly_sales_cnt integer, product_comment_time date, product_comment_num integer, product_comment_content varchar(200) ) SERVER gsmpp_server OPTIONS( LOCATION 'obs://OBS桶名称/input_data/', FORMAT ' CS V' , DELIMITER ',', ENCODING 'utf8', HEADER 'false', A CCE SS_KEY 'AK值', SECRET_AC CES S_KEY 'SK值', FILL_MISSING_FIELDS 'true', IGNORE_EXTRA_DATA 'true' )READ ONLY LOG INTO product_info_err PER NODE REJECT LIMIT 'unlimited';
图9 创建OBS外表
- 核对SQL语句无误,单击“运行”,创建OBS外表成功。
图10 创建OBS外表成功
- 复制以下SQL语句,在SQL窗口中执行,创建普通表。
1 2 3 4 5 6 7 8 91011121314151617181920
CREATE TABLE product_info ( product_price integer not null, product_id char(30) not null, product_time date , product_level char(10) , product_name varchar(200) , product_type1 varchar(20) , product_type2 char(10) , product_monthly_sales_cnt integer , product_comment_time date , product_comment_num integer , product_comment_content varchar(200) ) WITH( orientation = column, compression=middle ) DISTRIBUTE BY hash (product_id);
- 复制以下SQL语句,在SQL窗口中执行,通过INSERT语句将OBS外表数据导入GaussDB(DWS)数据库。
1
INSERT INTO product_info SELECT * FROM product_info_ext;
- 复制以下SQL语句,在SQL窗口中执行,进行VACUUM和ANALYZE操作。
了解更多语法,请参考相关SQL语法章节。
12
VACUUM FULL product_info; ANALYZE product_info;
- 复制以下SQL语句,在SQL窗口中执行,查询数据明细成功。
1
SELECT * FROM product_info;
图11 查询数据成功
数仓DWS支持多少节点常见问题
更多常见问题 >>-
GaussDB(DWS)的IoT数仓提供自研的时序引擎,提供扩展的时序场景语法,以及分区管理、时序计算、时序生态函数等服务功能,基于时序表提供时序计算能力。
-
数据仓库是指从业务数据中创建信息数据库,并针对决策和分析进行优化。数据仓库中的信息是面向主题的、集成化的、稳定的、随时间变化的数据集合,用以支持管理决策的过程。
-
数据仓库服务(Data Warehouse Service,简称DWS)是一种基于公有云基础架构和平台的在线数据处理数据库,提供即开即用、可扩展且完全托管的分析型数据库服务。DWS是基于华为融合数据仓库GaussDB产品的云原生服务,兼容标准ANSI SQL 99和SQL 2003,同时兼容PostgreSQL/Oracle数据库生态,为各行业PB级海量大数据分析提供有竞争力的解决方案。
-
华为云关系型数据库服务对此未做限制,取决于数据库引擎参数的默认值和取值范围,例如MySQL引擎的max_connections和max_user_connections参数,用户可在参数模板自定义。
-
DWS数据库内核使用华为自主研发的GaussDB数据库,兼容PostgreSQL 9.2.4的数据库内核引擎,从单机OLTP数据库改造为企业级MPP(大规模并行处理)架构的OLAP分布式数据库,其主要面向海量数据分析场景。
-
存储大量数据的集成中心。BI/DWH,分别指business intelligence和Data Ware House,对于运营商需要在大量的用户数据存储基础上分析客户,做商业智能分析。
更多相关专题
更多精彩内容
域名注册服务机构许可:黔D3-20230001 代理域名注册服务机构:新网、西数