检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
通过多VW实现吞吐/并发的线性提升,同时具备良好的读写分离、负载隔离能力。 湖仓一体 数据湖与数据仓库数据无缝混合查询。 数据湖分析体验数仓的极致性能和精准管控度。 存算一体与存算分离产品形态对比 表2 存算分离与存算一体差异 数仓类型 存算一体 存算分离 存储介质 数据存储在计算节点的本地磁盘。
数据仓库类型 产品类型概述 存算一体:面向数据分析场景,为用户提供高性能、高扩展、高可靠、高安全、低时延、易运维的企业级数仓服务,支持2048节点、20PB级超大规模数据分析能力,适用于“库、仓、市、湖”一体化的融合分析业务。 存算分离:采用存算分离云原生架构,计算、存储分层弹性
创建数据仓库GaussDB(DWS) 参见“创建集群”章节创建GaussDB(DWS)数据仓库。创建成功后,记录集群的内网IP。 为确保ECS与GaussDB(DWS)网络互通,GaussDB(DWS)数据仓库需要与ECS在同一个区域,同一个虚拟私有云和子网下。 表1 DWS规格
数据仓库规格 GaussDB(DWS)的规格按照产品类型分为存算一体和存算分离。其中存算一体还包含单机版模式。各产品类型的不同差异,详情请参见数据仓库类型。 低配置集群,如内存16G、vCPU4核及以下的规格,建议不要用于生产环境,可能会导致资源过载风险。 存算一体规格 存算一体
数据源中抽取出来,进行加工与集成,按照主题进行重组,最终进入数据仓库。 数据仓库主要用于支撑企业决策分析,所涉及的数据操作主要是数据查询。因此数据仓库通过表结构优化、存储方式优化等方式提高查询速度、降低开销。 表1 数据仓库与数据库的对比 维度 数据仓库 数据库 应用场景 OLAP
存储;当指定orientation属性为column时,表为列存储;如果不指定,默认为行存储。行、列存储模型各有优劣,建议根据实际情况选择: 表1 表的存储类型及场景 存储模型 优点 缺点 适用场景 行存 数据按照行进行存储,在查询某一行数据时,可以快速定位到目标位置。 查询时即使只涉及某几列,所有数据也都会被读取。
图解数据仓库服务
共同提供服务。 节点 每个GaussDB(DWS)集群部署节点取值范围为3~256,其中存算一体(单机部署)取值为1,每个节点都支持存储与分析数据。详情请参见GaussDB(DWS)技术指标。 规格 用户创建GaussDB(DWS)集群时需要指定集群节点的规格,不同规格节点使用的CPU、内存和存储资源不同。
了解更多常见问题、案例和解决方案 热门案例 数据库、数据仓库、数据湖、湖仓一体分别是什么? 为什么要使用云数据仓库服务GaussDB(DWS)? 无法连接数据仓库集群时怎么处理? 如何选择公有云DWS或者公有云RDS? 数据在数据仓库服务中是否安全? 如何清理与回收存储空间? 更多 数据库连接 通过gsql客户端无法连接数据库
存储;当指定orientation属性为column时,表为列存储;如果不指定,默认为行存储。行、列存储模型各有优劣,建议根据实际情况选择: 表1 表的存储类型及场景 存储模型 优点 缺点 适用场景 行存 数据按照行进行存储,在查询某一行数据时,可以快速定位到目标位置。 查询时即使只涉及某几列,所有数据也都会被读取。
用户和私有表创建成功。 dbadmin用户执行DROP语句,可成功删除test表。 1 DROP TABLE u1.test; 父主题: 账户与权限
建表与数据导入 GDS方式导入 父主题: 测试方法
应用脱敏函数进行原始数据的变形改写,实现敏感隐私数据的可靠保护,从而增强产品在数据安全和隐私保护方面的能力。 了解更多请参见数据脱敏。 父主题: 数据保护技术
数据仓库错误码 SQL标准错误码说明 第三方库错误码说明 GAUSS-00001 -- GAUSS-00100 GAUSS-00101 -- GAUSS-00200 GAUSS-00201 -- GAUSS-00300 GAUSS-00301 -- GAUSS-00400 GAUSS-00401
典型场景:数据仓库是企业的重要数据分析系统,随着业务量的增长,自建数仓性能逐渐不能满足实际要求,同时扩展性差、成本高,也使扩容极为困难。DWS作为云上企业级数据仓库,具备高性能、低成本、易扩展等特性,满足大数据时代企业数据仓库业务诉求。 发布区域:全部 数据仓库与普通数据库的区别?
随着上云企业越来越多,企业对用云成本问题也越发重视。使用数据仓库服务GaussDB(DWS)时,如何进行成本管理,减轻业务负担呢?本文将从成本构成、成本分配、成本分析和成本优化四个维度介绍成本管理,帮助您通过成本管理节约成本,在保障业务快速发展的同时获得最大成本收益。 成本构成 使用数据仓库服务GaussDB(DWS)时,成本主要包括两个方面:
* FROM student_view01; 查询结果object_name显示多个对象名,包括:表名、视图名及视图所涉及的基表名。 父主题: GaussDB(DWS)集群日志管理
导入数据 从OBS并行导入数据 使用GDS从远端服务器导入数据 从MRS导入数据到集群 从GaussDB(DWS)集群导入数据到新集群 基于GDS的跨集群互联互通 使用开源Kettle导入数据 使用gsql元命令\COPY导入数据 使用COPY FROM STDIN导入数据
整库迁移 使用CDM迁移数据到GaussDB(DWS) 使用DSC工具迁移SQL脚本
导出数据 导出数据到OBS 导出ORC数据到MRS 使用GDS导出数据到远端服务器