已找到以下 10000 条记录
  • 华为云数据仓库培训服务

    华为商品 培训课程 教育 培训与认证

    OLAP数据库二次开发和管理能力高级工程师华为认证培训华为云数据仓库高级工程师培训培养具有分布式数据库集群开发和运维能力高级工程师,以及对数据库领域相关人员进行技能提升。课程内容:深入讲解GaussDB DWS数据仓库架构、数据库设计与管理、数据迁移、数据库运维与调优,数据库安全管理和高可

    商家: 华为云计算技术有限公司 交付方式: 人工服务
    ¥256180.0/次

    OLAP数据库二次开发和管理能力高级工程师华为认证培训华为云数据仓库高级工程师培训培养具有分布式数据库集群开发和运维能力高级工程师,以及对数据库领域相关人员进行技能提升。课程内容:深入讲解GaussDB DWS数据仓库架构、数据库设计与管理、数据迁移、数据库运维与调优,数据库安全管理和高可

    华为商品 培训课程 教育 培训与认证
    ¥256180.0/次
  • 一篇文章搞懂数据仓库:维度设计原则设计方法)

    s_auction_auctions 是与前台商品中心 系统同步商品,此即是主维。第三步:确定相关维数据仓库是业务源系统数据整合,不同业务系统或者同 一业务系统之间存在 关联性。根据对业务梳 理,确定哪些和主维存在关联关系,并选择其中某些用于生成维度属性。第四步 :确定维度属性

    作者: 不吃西红柿
    发表时间: 2021-07-14 16:07:15
    7701
    0
  • 一篇文章搞懂数据仓库数据仓库规范设计

    中间表一般出现在Job,是Job临时存储中间数据,中间作用域只限于当前Job执行过程,Job一旦执行完成,该中间使命就完成了,是可以删除(按照自己公司场景自由选择,以前公司会保留几天中间数据,用来排查问题)。 规范:mid_table_name_[0~9|dim] t

    作者: 不吃西红柿
    发表时间: 2021-07-14 17:45:08
    3561
    0
  • Cassandra_什么是宽列数据库_云数据库GaussDB for Cassandra

    分区键以及排序键的设计方式,对有时间特点的IoT数据查询天然友好,具有查询性能高,时延低等特点。

  • 数据仓库(01)什么是数据仓库,数仓有什么特点

    需数据从原来数据抽取出来,进行加工与集成,统一与综合之后才能进入数据仓库数据仓库数据是在对原有分散数据库数据抽取、清理基础上经过系统加工、汇总和整理得到,必须消除源数据不一致性,以保证数据仓库信息是关于整个企业一致全局信息。 数据仓库数据主要供企业

    作者: 张飞的猪大数据
    发表时间: 2022-11-06 13:12:38
    190
    0
  • 大数据面试题——数据仓库

    文章目录 数据仓库 什么是数据仓库? 数据库与数据仓库区别? 事实和维度 数据仓库数据模型: 为什么数据仓库要分层? 数据仓库模式:Kimball (金箔)和 Inmon(恩门)

    作者: 孙中明
    发表时间: 2022-01-22 15:04:39
    961
    0
  • ClickHouse设计原则 - MapReduce服务 MRS

    ClickHouse设计原则 设计原则 由于ClickHouse查询性能较优,且当前ClickHouse可支持上万列横向扩展。 在大部分场景下,有大join以及多join场景,且多个join数据变化更新频率较低,这种情况,建议对多个join查询逻辑

  • 数据仓库设计规范(更新

    分层设计 ods→dw→dws→sh→ 数据仓库要求 高效率:数据仓库分析数据一般分为日、周、月、季、年等,可以看出,以日为周期数据要求效率最高,要求24小时甚至12小时内,客户能看到昨天数据分析。由于有的企业每日数据量很大,如果数据仓库设计不好,需要延

    作者: 孙中明
    发表时间: 2022-01-22 15:55:08
    1153
    0
  • 数据仓库分层

    服务数据层,对DWD进行轻度汇总,生成一系列中间,提升公共指标的复用性,减少重复加工,构建出一些,供后续进行业务查询。 APP DWD、DWS数据统计结果存储在APP层,可以直接对外提供查询。 以上摘录自 大数据背景下数据仓库架构设计及实践研究(贺晓松) 分层分法在实践不完全一样,但是大差不差。

    作者: 黄生
    发表时间: 2024-06-27 10:35:16
    26
    0
  • 数据仓库设计规范(更新)1024投稿

    分层设计 ods→dw→dws→sh→ 数据仓库要求 高效率:数据仓库分析数据一般分为日、周、月、季、年等,可以看出,以日为周期数据要求效率最高,要求24小时甚至12小时内,客户能看到昨天数据分析。由于有的企业每日数据量很大,如果数据仓库设计不好,需要延

    作者: 孙中明
    发表时间: 2022-01-22 14:25:01
    968
    0
  • 数据仓库规格 - 数据仓库服务 GaussDB(DWS)

    选择带有h1节点规格,规格详情请参见3。 存算一体(DWS 2.0)本地盘规格,该规格存储容量固定,不能够进行磁盘扩容,只能进行节点扩容,规格详情请参见4。 步长指在集群变配过程增大或减小磁盘大小间隔大小。用户在操作时需要按照对应规格存储步长来选择。 1 存算一体(DWS

  • 设计

    力,使数据处理本地化,提高集群性能和可支持并发度。通过对关联条件和分组条件仔细设计,能够尽可能减少不必要数据shuffle。 选择存储方案 【建议】存储类型是定义设计第一步,客户业务类型是决定存储类型主要因素,存储类型的选择依据请参考表1。

  • 数据仓库类型 - 数据仓库服务 GaussDB(DWS)

    备注1:存算分离数据存储在OBS上,无需重分布,但是元数据和索引存储在本地,仍然需要进行重分布。存算分离在重分布时,只支持读,元数据重分布时间一般比较短,但是,如果上创建了索引,索引会影响重分布性能,重分布完成时间与索引数据量成正比关系,在此期间,只支持读。 存算

  • 什么是数据仓库服务

    Segment,即数据文件,通常每张只对应一个数据文件。如果某张数据大于1GB,则会分为多个数据文件存储。 Table,即,每张只能属于一个数据库。 Block,即数据块,是数据库管理基本单位,默认大小为8KB。 数据有三种分布方式,可以在建时候指定:

  • 一篇文章搞懂数据仓库数据仓库8个发展阶段

    数据仓库发展的第一明显分歧是数据集市概念产生。由于企业级数据仓库设计、实施很困难,使得最早吃数据仓库螃蟹公司遭到大面积失败,因此数据仓库建设者和分析师开始考虑只建设企业级数据仓库一部分,然后再逐步添加,但是这有背于BillInmon原则:各个实施部分数据抽取、清洗、转换和加载是独立,导致了数据混乱

    作者: 不吃西红柿
    发表时间: 2021-07-14 16:52:48
    3269
    0
  • hive数据仓库设计,项目中分了几层,都有什么

    hive数据仓库设计,项目中分了几层,都有什么 ODS层: 是将OLTP数据通过ETL同步到数据仓库来作为数据仓库最基础数据来源。在这个过程,数据经过了一定清洗,比如字段统一,脏数据去除等,但是数据粒度是不会变化。ODS层数据可以只保留一定时间。 DW 层:

    作者: 百忍成金的虚竹
    发表时间: 2021-03-25 15:45:41
    2614
    0
  • 创建数据仓库GaussDB(DWS) - 数据仓库服务 GaussDB(DWS)

    创建数据仓库GaussDB(DWS) 参见“创建集群”章节创建GaussDB(DWS)数据仓库。创建成功后,记录集群内网IP。 为确保ECS与GaussDB(DWS)网络互通,GaussDB(DWS)数据仓库需要与ECS在同一个区域,同一个虚拟私有云和子网下。 1 DWS规格

  • 设计 - 数据仓库服务 GaussDB(DWS)

    化,提高集群性能和可支持并发度。通过对关联条件和分组条件仔细设计,能够尽可能减少不必要数据shuffle。 选择存储方案 【建议】存储类型是定义设计第一步,用户业务类型是决定存储类型主要因素,存储类型选择依据请参考1。 1 存储类型及场景 存储类型

  • 一篇文章搞懂数据仓库数据仓库架构-Lambda和Kappa对比

    有不同漏洞。这种系统实际上非常难维护服务器存储大:数据仓库典型设计,会产生大量中间结果,造成数据急速膨胀,加大服务器存储压力。 Kappa Kappa架构原理 Kappa架构核心思想包括以下三点: 用Kafka或者类似的分布式队列系统保存数据,你需要几天数据量

    作者: 不吃西红柿
    发表时间: 2021-07-14 17:05:58
    6235
    0
  • API设计原则

    无状态性每个请求必须包含服务器必须理解所有信息,而不是依赖于服务器记住先前请求。服务端不能保存除了单次请求之外,任何与其通信客户端状态。客户端所有请求必须包括服务端完成请求所需所有信息(认证,授权,单)。 幂等性幂等性指的是一次和多次请求某一个资源应该具有相同作用。幂等方法意味着

  • 成长地图 - 数据仓库服务 GaussDB(DWS)

    数据库开发指南重点面向数据库设计者、应用程序开发人员或DBA,提供设计、构建、查询和维护数据仓库所需信息。 数据库基本操作 创建和管理数据库 创建和管理 管理用户及权限 配置GUC参数 用户自定义函数 PostGIS空间数据库扩展 全文检索 SQL语法参考 存储过程 系统和视图 导入/导出数据