内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • 一篇文章搞懂数据仓库数据仓库架构-Lambda和Kappa对比

    在介绍Lambda和Kappa架构之前,我们先回顾一下数据仓库的发展历程: 传送门-数据仓库发展历程 写在前面 咳,随着数据量的暴增和数据实时性要求越来越高,以及大数据技术的发展驱动企业不断升级迭代,数据仓库架构方面也在不断演进,分别经历了以下过程:早期经典数仓架构 >

    作者: 不吃西红柿
    发表时间: 2021-07-14 17:05:58
    6235
    0
  • Greenplum数据库中的集合运算

    集合运算的结果默认不包括 NULL 值(除了 UNION ALL)。 由于 Greenplum 是基于 PostgreSQL 的 MPP 数据库,集合运算的性能可能受到数据分布和集群状态的影响。 通过上述介绍,你可以开始在 Greenplum 数据库中有效地使用集合运算来处理和分析数据了。

    作者: 林欣
    发表时间: 2024-07-28 10:44:06
    11
    0
  • 什么是数据仓库

    用户都存储的什么信息。  数据仓库 数据仓库数据仓库系统的主要应用主要是OLAP(On-Line Analytical Processing),支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。 数据仓库汇总有可能有很多维度数据的统计分析结果

    作者: 数据社
    发表时间: 2022-09-24 18:08:33
    148
    0
  • 数据仓库的好处

    系统数据需要通过ETL工具时隔数小时后同步到BI系统,无法做到实时分析,销售及运营主管无法实时掌握经营情况。为了解决这个问题,他们后来采用了华为云混合负载数据仓库DWS。DWS采用“一库两用”的设计理念,一套数据仓库集群既可以支持超高并发、低时延的业务交易请求,同时可支撑复杂的海

    作者: 小强鼓掌
    26
    6
  • 数据库 与 数据仓库

    8)常见选型:MySQL、PostgreSQL、Oracle 数据仓库 1)用于OLAP 2)数据仓库是面向主题的,数据相对稳定,来源多样,经过ETL得到,用来分析,决策支撑 3)数据仓库一般存储的历史数据 4)数据仓库的设计一般不符合三范式,并且反规划范,有利于查询 5)数据仓库“通常”采用分布式架构,数据分散存储在多个服务器上,以列存居多

    作者: 云叔记
    发表时间: 2024-03-04 08:17:52
    172
    0
  • GreenPlum的那些事《六》——时间计算

    计算小时 SELECT date_part('hour', '2019-05-03 12:00:00'::TIMESTAMP

    作者: 数据社
    发表时间: 2022-09-24 18:49:36
    91
    0
  • 有针对GreenPlum的迁移指南吗?

    社区搜索了好像还没有,有谁有弄过呢?

    作者: wangke
    1283
    2
  • 面试,如何使用数据仓库

    by小AA 数据仓库知多少 首先,来了解一下数据仓库吧!数据仓库是一个面向主题的、集成的、相对稳定的、反应历史变化的数据集合。 我们来看这几个词: 面向主题,数据仓库会规划各种业务主题,所以我们需要理解各大主题的范畴以及之间的关系,这样就了解了数据仓库的基本架构。集成,

    作者: 数据社
    发表时间: 2022-09-24 19:53:53
    134
    0
  • Python量化数据仓库搭建3:数据落库代码封装

    Python量化数据仓库搭建3:数据落库代码封装 本系列教程为量化开发者,提供本地量化金融数据仓库搭建教程与全套源代码。我们以恒有数(UDATA)金融数据社区为数据源,将金融基础数据落到本地数据库。教程提供全套源代码,包括历史数据下载与增量数据更新,数据更新任务部署与日常监控等操作。

    作者: hailang
    发表时间: 2021-10-27 09:35:52
    1007
    0
  • Greenplum数据库中的集合运算

    认不包括 NULL 值(除了 UNION ALL)。由于 Greenplum 是基于 PostgreSQL 的 MPP 数据库,集合运算的性能可能受到数据分布和集群状态的影响。通过上述介绍,你可以开始在 Greenplum 数据库中有效地使用集合运算来处理和分析数据了。

    作者: 林欣
    9
    2
  • 数据仓库入门浅谈

    数据仓库是商业智能(业务智能、BI)的基础。概念看起来简单,把数据存在静态的仓库里头以便多个维度分析,但实现和应用较复杂困难。几个值得注意的要点:1)数据仓库跟业务执行系统的管理要点完全不同。按事实和维度存储,减少执行流程和执行角色的干扰2)数据仓库要基于精准的业务需要来建立,系

    作者: 大数据小粉
    发表时间: 2017-04-26 11:44:15
    9078
    0
  • 临时转储数据仓库

    临时转储数据仓库

    作者: 慢慢学
    发表时间: 2021-02-25 16:04:10
    5434
    0
  • 数据仓库学习笔记

    关于数据环境:  数据仓库开发最好是以反复的方式进行。首先建立数据仓库的一部分,然后再建立另一部分。即出现所谓的CLDS的数据驱动的开发生命周期,区别于传统的需求驱动开发生命周期(SDLC)。   粒度的选择:   一般采用双重粒度或建立活样本数据库。   数据仓库中分区是在应用层而非系统层进行;

    作者: 大数据小粉
    发表时间: 2017-04-26 09:39:41
    9294
    0
  • 数据仓库平台ETL

    数据仓库平台建设过程中,数据的加载、卸载,各层数据模型之间的数据流转,业务规则的实现等等数据加工过程都会以ETL任务的方式实现。 构建ETL子系统是数据仓库系统实施的一个非常重要的环节,在仓库平台建设过程中搭建一个完整、标准的ETL子系统是数据仓库平台建设的基础性目标之一。ET

    作者: 小强鼓掌
    21
    2
  • 数据仓库设计规范(更新中)1024投稿

    于是数据仓库需要分层。 数据仓库分层的原因 1、用空间换时间,通过数据预处理提高效率,通过大量的预处理可以提升应用系统的用户体验(效率),但是数据仓库会存在大量冗余的数据. 2、增强可扩展性,方便以后业务的变更。如果不分层的话,当源业务系统的业务规则发生变化整个数据仓库需要重

    作者: 孙中明
    发表时间: 2022-01-22 14:25:01
    968
    0
  • 数据仓库的分层

    从数据源的采集到多层清洗加工的过程中,数据仓库的数据逻辑分层一般分为4层。 分层的核心思想就是解耦。 ODS Operation Data Store 原始数据层,也有叫贴源层,该层对采集的原始数据进行原样存储。 DWD Data Warehouse Detail 明细数据层,对ODS进行清洗,解决数据质量问题。

    作者: 黄生
    发表时间: 2024-06-27 10:35:16
    26
    0
  • 【数据产品】【greenplum功能】greenplum从x86 8.2.15版本到arm 9.2.4 程序读不到表

    【功能模块】【操作步骤&问题现象】1、2、【截图信息】【日志信息】(可选,上传日志内容或者附件)

    作者: 小阔爱
    1253
    1
  • 一篇文章搞懂数据仓库数据仓库的8个发展阶段

    企业级数据仓库(EDW,1991)1991年,BillInmon出版了其有关数据仓库的第一本书,这本书不仅仅说明为什么要建数据仓库数据仓库能给你带来什么,更重要的是,Inmon第一次提供了如何建设数据仓库的指导性意见,该书定义了数据仓库非常具体的原则,包括:数据仓库是面向主题的(Subject-Oriente

    作者: 不吃西红柿
    发表时间: 2021-07-14 16:52:48
    3269
    0
  • DWS与Greenplum一些语法差异总结

    as $$ begin         return i+1; end $$ LANGUAGE plpgsql; 四.Greenplum导出文件1.greenplum中可使用pg_dump备份数据库中的元数据pg_dump -U {user_name} -W {password} 

    作者: 行人忆南山
    发表时间: 2020-06-22 15:38:48
    9830
    1
  • 了解数据仓库

    得洞察力、监控企业绩效以及更明智地决策。数据仓库通过高效地存储数据以便最大限度地减少数据输入和输出 (I/O),并快速地同时向成千上万的用户提供查询结果,为这些报告、控制面板和分析工具 由数据仓库提供支持。             数据仓库服务(Data Warehouse Se

    作者: 建赟
    1052
    2