5步快速使用云数据仓库
5步快速使用云数据仓库
01 注册华为云并实名认证
打开华为云网站,单击”注册“,根据提示信息完成注册,注册成功后,按指引完成个人或企业实名认证。
02 创建集群
针对不同分析场景和业务规模,可以选择标准数仓、实时数仓和IoT数仓,并选择合适的数据存储容量。为了保证业务连接无单点断连风险,需搭配弹性负载均衡ELB一起使用。
03 连接集群
支持多种连接方式,包括JDBC/ODBC,Python,gsql客户端,WebSQL界面工具DAS、Data Studio。
04 导入数据
支持多种数据源和导入工具完成数据入库:支持OBS外表、GDS外表导入;支持CDM、DRS、DLI实时入库;支持访问远端MRS数据源;支持元数据导入和导出;支持DSC进行SQL脚本迁移等等。
05 数据分析
导入数据后,通过SQL命令完成各种业务场景数据分析。
数据分析实验室--手把手教您使用云数仓
数据分析实验室--手把手教您使用云数仓
快速入门
一键式创建GaussDB(DWS)集群,上传csv本地数据到云存储OBS桶,通过创建OBS外表实现数据导入并简单分析。
大数据融合分析:访问MRS中的Hive数据源
创建数据仓库集群GaussDB(DWS),并导入MRS的Hive数据,实现跨集群进行大数据融合分析。
零售业经营多维度分析
环境已预置样例数据在OBS桶,通过创建OBS外表导入样例数据,再使用聚合函数、group by、order by、视图进行多维度分析。
权限管理
通过实验创建不同用户,不同Schema,基于权限管理实现数据的隔离和互访,了解用户、角色的关系,了解grant的基本用法,了解基于角色的权限管理(RBAC)。
使用Java进行二次开发
使用JDBC驱动连接GaussDB(DWS)进行二次开发,熟悉简单的适配DWS的Java开发用例。
性能调优
掌握通过EXPLAIN语句查询执行计划的方法,了解GaussDB(DWS)几种常见的SQL调优手段。
最佳实践
最佳实践
数据迁移实践
Oracle迁移、MySQL实时同步、Kafka实时写入DWS。
表设计调优实践
介绍如何设计GaussDB(DWS)表结构(包括选择表存储方式、压缩级别、分布方式、分布列以及使用分区表和局部聚簇等),从而实现表性能的优化。
查看或导入MRS的Hive数据
大数据融合分析时代,GaussDB(DWS)如需远端访问或读取MRS数据源,可参考本教程通过建立HDFS外表实现。
分区自动管理优秀实践
GaussDB(DWS) 引入了分区自动管理特性。可通过设置表级参数period、ttl开启分区自动管理功能,使分区表可以自动创建新分区和删除过期分区,降低分区表的维护成本,改善查询性能。
冷热数据管理优秀实践
根据业务系统中用户对不同时期数据的不同使用需求,对膨胀的数据进行“冷热”分级管理,不仅可以提高数据分析性能还能降低业务成本。
资源管理实践
演示GaussDB(DWS)的资源管理功能,帮助企业客户解决数据分析过程中,多用户查询作业遇到的性能瓶颈,最终实现多用户执行SQL作业互不影响,节省资源消耗。