内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • 数据挖掘:数据仓库相关知识笔记

    原数据库挑选中数据仓库所需要数据,然后将来自不同数据库中数据按照某一标准进行统一处理。 数据是相对稳定:因为数据仓库数据主要是供决策分析使用,一般主要是数据查询操作,不进行修改等操作。数据反映是一段相当长时间内历史数据内容,是不同时间数据库快照集合,然后进行统计、综合、分组的导出数据。

    作者: IT技术分享社区
    发表时间: 2023-01-07 14:17:41
    119
    0
  • 数据仓库可以存储多少业务数据?

    数据仓库可以存储多少业务数据?

    作者: 木又林夕
    10659
    3
  • 解密华为数据仓库产品GaussDB(DWS)

    不需要部署数据仓库服务器,就可以在几分钟之内获得高性能、高可能企业级数据仓库集群。稳定可靠  ——  省事又省心DWS在高可靠基础设施上运行。DWS是分布式MPP数据仓库,是由多个节点组成集群数据仓库,所有的软件进程均有主备保证,数据存储节点数据均有主备保证,能够保证在任

    作者: 彩虹上的水瓶座
    发表时间: 2020-06-28 16:54:29
    14208
    0
  • 【DWS产品】数据仓库使用求助

    在下新接触华为云,请问一下各位专家,我这边需求是现有传统OA,HR,ERP系统,这些系统数据库在华为云RDS上,我们想搭建数据仓库将各个系统数据抽到数据库仓库形成大宽表,后面提供给BI进行数据查询展示。。请问下我需要用到华为云哪些服务,购买哪些产品,哪些是必须,哪些是可选。。有没有实践案例可参考。谢谢

    作者: sulta
    7194
    6
  • 数据仓库解决方案对比

    作者: 彩虹上的水瓶座
    8500
    30
  • 数据仓库中数据模型以及ETL算法

    转换过程需要借助就是ETL算法。打个比方,数据就是数据仓库原材料,而数据模型是不同产品形态模子,不同数据层就是仓库各个“车间”,数据在各个“车间”形成流水线式传动就是依靠调度工具这个流程自动化软件,执行SQL客户端工具是流水线上机械臂,而ETL程序就是驱动机械臂进行产品加工的算法核心。

    作者: babu1801
    发表时间: 2020-07-16 09:04:05
    8221
    0
  • 2020-08-12:数据仓库是怎么分层

    福哥答案2020-08-12:知乎答案一般都是分 ODS -> DW -> APP:ODS(Operational Data Store)就是将各种数据源数据,经过清洗整理到这里这一层。一般涉及各种ETL工具,我们用时sqoop。DW(Data WareHouse),数据仓库层,指的是经过抽象,模块化数据,可以

    作者: 福大大架构师每日一题
    发表时间: 2020-08-19 11:21:43
    2788
    0
  • Hive分布式数据仓库(1)

     Hive 是基于Hadoop构建一套数据仓库分析系统,用来进行数据提取、转化、加载,这是一种可以存储、查询分析存储在Hadoop中大规模数据机制。Hive数据仓库工具能将结构化数据文件映射为一张数据库表,并提供SQL查询功能,能将SQL语句转变成MapReduce任务来执行。Hive优点是学

    作者: 胡辣汤
    1371
    0
  • 数据仓库适用场景讲解------转载

    ”双活模式“需要独立中间件、且严重依赖数据库自身厂商,中间件实现难度大;中间件高可用(稳定性)成为它落地最大障碍;“双ETL模式”升级版,能适应各类数据仓库双集群场景;绝大部分场景下,RPO、RTO均可以接近0,特别是双活同时在线能力,不存在双集群主备切换,RTO可以做到0;同时存在统一视图,不会因

    作者: 小强鼓掌
    22
    5
  • 数据仓库Hadoop大数据平台有什么差别?

    本帖最后由 yd_65688703 于 2017-11-15 17:18 编辑 <br /> 数据仓库Hadoop大数据平台有什么差别?

    作者: 婠
    11506
    1
  • 通俗易懂讲数据仓库之【缓慢变化维】

    在维度中只保存当前最新数据。 用户维度表 用户维度历史表 这种方式优点是可以同时分析当前及前一次变化属性值,缺点是只保留了最后一次变化信息。 3. 数仓项目-拉链表技术介绍 数据仓库数据模型设计过程中,经常会遇到这样需求: 表中部分字段会被update,例如:

    作者: 大数据梦想家
    发表时间: 2021-09-28 14:46:24
    1542
    0
  • 了解数据仓库产品架构

    P大规模并行处理引擎,由众多拥有独立且互不共享CPU、内存、存储等系统资源逻辑节点组成。在这样系统架构中,业务数据被分散存储在多个节点上,数据分析任务被推送到数据所在位置就近执行,并行地完成大规模数据处理工作,实现对数据处理快速响应。应用层数据加载工具、ETL(Extr

    作者: 建赟
    1165
    2
  • 华为云数据仓库第5天——云上数据流动

    OBS,不可选OBS终端节点:地址,不可选端口:默认443访问标识/密钥:填写华为云账号AK/SK填写完成后,点击“测试”, 如果测试成功,点击保存。3. 配置目的端DWS连接。 点击“新建连接”, 选择数据仓库数据仓库服务数据库名称这里我们填写上一节创建dota,填写完成后,点击“测试”, 如果测试成功,点击保存。4

    作者: tengyun
    发表时间: 2019-05-11 00:54:52
    12149
    0
  • 数据仓库服务优势有哪些?

    数据仓库服务优势有哪些?

    作者: 婠
    8331
    1
  • Hive分布式数据仓库(2)

    在Hive流行之前,企业大多采用传统并行数据仓库架构。传统数据仓库一般采用国外知名厂商大型服务器和成熟解决方案,不仅价格昂贵且可拓展性较差,而且平台工具与其他厂商难以适配,用户操作体验也比较差、开发效率不高,当数据量达到TB级别后基本无法得到很好性能。而且,传统数据仓库基本只擅长处理结构

    作者: 胡辣汤
    1169
    0
  • 数据仓库使用哪些安全防护?

    <align=left>如题:数据仓库使用哪些安全防护?</align>

    作者: chanhut
    8131
    1
  • 数据仓库8种ETL算法汇总

    ETL是将业务系统数据经过抽取、清洗转换之后加载到数据仓库过程,是构建数据仓库重要一环,用户从数据源抽取出所需数据,经过数据清洗,最终按照预先定义好数据仓库模型,将数据加载到数据仓库中。目的是将企业中分散、零乱、标准不统一数据整合到一起,为企业决策提供分析依据。1

    作者: wzhyalfa
    1919
    1
  • 数据仓库,数据脱敏、and,or,in处置方案

    数据脱敏函数,是否可根据不同用户查询条件,对行脱敏、行滤除,也是这些脱敏函数么?and,or,in我们在用户查询时会用到,多条件间冲突时,是如何处置,是否有相应处置方案,目前我们也不知哪种处置比较好。

    作者: 发问小达人
    4599
    3
  • PB级数据仓库性能调优

    r做任务规划 分发,规划完之后,把具体任务抛给计算节点。Crew3 Worker1Crew3 Worker2就是任务树中叶节点就是数据扫描任务,接受下级任务数据输入,向上级任务输出数据。Crew2 Worker1Crew2 Worker2中间节点就是各种数据运算任务

    作者: bigdata张凯翔
    发表时间: 2020-09-06 18:06:29
    17282
    1
  • hive数据仓库设计,项目中分了几层,都有什么

    hive数据仓库设计,项目中分了几层,都有什么 ODS层: 是将OLTP数据通过ETL同步到数据仓库来作为数据仓库最基础数据来源。在这个过程中,数据经过了一定清洗,比如字段统一,脏数据去除等,但是数据粒度是不会变化ODS数据可以只保留一定时间。 DW 层:

    作者: 百忍成金的虚竹
    发表时间: 2021-03-25 15:45:41
    2614
    0