已找到以下 10000 条记录
  • Python量化数据仓库搭建系列2:Python操作数据库

    Python量化数据仓库搭建系列2:Python操作数据库 本系列教程为量化开发者,提供本地量化金融数据仓库搭建教程与全套源代码。我们以恒有数(UDATA)金融数据社区为数据源,将金融基础数据落到本地数据库。教程提供全套源代码,包括历史数据下载与增量数据更新,数据更新任务部署与日常监控等操作。

    作者: hailang
    发表时间: 2021-10-27 09:29:29
    959
    0
  • 数据挖掘:数据仓库相关知识笔记

    数据是反映历史变化的:主要表现三个方面,数据仓库随时间变化不断增加新的数据内容,定时获取OLTP数据库中变化的数据追加到数据仓库中去; 随时间变化不断删除旧的数据内容;数据仓库中包含大量综合数据会隔一段时间进行抽样处理等。 3、数据仓库的模式 主要有星型模式、雪花模式、事实星型模式。 4、数据仓库的体系结构

    作者: IT技术分享社区
    发表时间: 2023-01-07 14:17:41
    119
    0
  • 实时数仓语法 - 数据仓库服务 GaussDB(DWS)

    实时数仓语法 CREATE TABLE INSERT DELETE UPDATE UPSERT MERGE INTO SELECT ALTER TABLE

  • 实时数仓语法 - 数据仓库服务 GaussDB(DWS)

    实时数仓语法 CREATE TABLE INSERT DELETE UPDATE UPSERT MERGE INTO SELECT ALTER TABLE

  • 【DWS产品】数据仓库的使用求助

    在下新接触华为云,请问一下各位专家,我这边的需求是现有传统的OA,HR,ERP系统,这些系统的数据库在华为云RDS上,我们想搭建数据仓库将各个系统的数据抽到数据库仓库形成大宽表,后面提供给BI进行数据查询和展示。。请问下我需要用到华为云的哪些服务,购买哪些产品,哪些是必须的,哪些是可选的。。有没有实践案例可参考。谢谢

    作者: sulta
    7193
    6
  • Hive分布式数据仓库(1)

           Hive 是基于Hadoop构建的一套数据仓库分析系统,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。Hive数据仓库工具能将结构化的数据文件映射为一张数据库表,并提供SQL查询功能,能将SQL语句转变成MapRe

    作者: 胡辣汤
    1371
    0
  • 是否支持批量创建数据仓库

    <align=left>是否支持批量创建数据仓库?</align>

    作者: 54mali
    7321
    1
  • 使用greenplum-spark connect连接器遇到的坑

       我最近开发了一个maven项目,想使用spark读取/写入greenplum的数据,但是由于jdbc的传输速度限制。所以想采用greenplum-spark connect这个连接器。当我使用--jars将项目和这个依赖包一起提交上去的时候出现了jar包冲突 报错:clas

    作者: yd_235664071
    127
    3
  • 传统BI项目与数据仓库

    集市。我们所涉及的数据仓库其实更多的聚焦于分析层,但是整个BI项目的核心之一。分析层包括了对商业逻辑的数据建模,不仅要根据用户对可视化数据的展现要求,也要根据数据集市中数据分布、容量、业务种类多样性来综合设计。作为分析层中,提供分析数据物理存储基础就是数据仓库,仓库中的数据是经过聚合、清洗、分类以及映射过得clean

    作者: tony_sniper
    6754
    4
  • 数据仓库适用场景讲解------转载

    在分钟级;d) “双ETL模式”需要两套ETL调度环境,整体成本翻倍,但调度逻辑清晰、易于理解和维护;较容易匹配不同规模的数据仓库平台采纳;较难实现数据实时比对,以及数据发生不一致之后的控制逻辑(若需要实现,对于调度逻辑侵入性大);ETL调度批量中途,较难实现两套调度链路协调重跑

    作者: 小强鼓掌
    21
    5
  • 基于大数据平台数据仓库方案

    后台包括数据的采集与集成,采集通过长亮的交换平台、外部数据管理平台实现内、外部数据,结构与非结构化数据,实时与批量数据的采集与交换。数据集成包括搭建数据仓库、非结构平台、实时数据平台、数据挖掘平台、历史数据平台等,实现面向不同场景、不同数据的整合与存储。数据中台主要是将数据进行服

    交付方式: License
  • 数据仓库中数据模型以及ETL算法

    加工的算法核心。 上图是数据仓库工具箱-维度建模权威指南一书中的数据仓库混合辐射架构 2.2 金融行业中的分层模型&nbsp; &nbsp; &nbsp; 金融行业中的数据仓库是对模型建设要求最高也是最为成熟的一个行业,在多年的金融行业数据仓库项目建设过程中,基本上都形成了

    作者: babu1801
    发表时间: 2020-07-16 01:04:05
    5040
    0
  • 实时数仓GUC参数 - 数据仓库服务 GaussDB(DWS)

    实时数仓GUC参数 autovacuum 参数说明:控制是否启动数据库自动清理进程(autovacuum)。 参数类型:SIGHUP 取值范围:布尔型 on表示开启数据库自动清理进程。 off表示关闭数据库自动清理进程。 默认值:on autovacuum_compaction_rows_limit

  • 数据仓库双活模式-----转载

    句,实现对象动态注册;通过命令行指令实现对象注册;适当增加对象索引、约束索引的注册信息,用于扩展细粒度对象锁能力,提高数据仓库ETL SQL并发能力;*数据仓库环境下,只需要考虑到表级双活的能力,不建议实施字段级、记录级双活;vi.     对象锁能力根据SQL指令给相应对象动态

    作者: 小强鼓掌
    13
    5
  • 数据仓库可以存储多少业务数据?

    数据仓库可以存储多少业务数据?

    作者: 木又林夕
    10658
    3
  • 数据仓库专家服务 - 专业服务

    双方达成一致的业务保障目标,客户完成服务付款。 服务范围 本项目华为云数据仓库专家服务包括以下一项或多项内容: 华为云数据仓库产品咨询服务 华为云数据仓库平台安装部署规划与实施 数据仓库迁移方案设计与实施支持 基于华为云数据仓库平台的开发支持 本项目华为云数据仓库专家服务不包括以下内容: 应用程序改造、应用程序设计、数据库逻辑结构设计

  • 金融数据仓库解决方案

    数据安全 实时数据分析 实时数据分析 移动互联网时代,金融业务会产生大量实时数据,为了快速获取数据价值,需要对数据进行实时分析,华为云DWS的快速入库和查询能力可支持实时数据分析 流式数据实时入库 IoT、互联网等数据经过流计算及AI服务处理后,可实时写入DWS。 实时监控与预测

  • 数据仓库详细介绍(九.数据质量)流程与工具

    的数据准确性。 在线业务系统复杂多变,每次变更都会产生数据的变化。为保证数据质量,就需要考虑如何能将源端业务系统的变更,更高效地通知给数据仓库维护人员。 首先,我们可以从人员管理入手,制定流程规范,要求前端业务变更发版上线前必须通知下游下游数仓运维人员。 其次,我们可以使用

    作者: 数据社
    发表时间: 2022-09-24 16:55:30
    176
    0
  • Snowflake:数据仓库的终极形态?

    服务层解决了数据仓库易用性的问题,目前我还没有看到任何一款数据平台产品能够帮用户处理这么多的非功能性任务。即使是同为云数据仓库的Azure Data Warehouse,需要的管理和运维成本不可同日而语。数据仓库的进化    Snowflake的架构完美诠释了数据仓库产品的进化史

    作者: 大数据小白条
    1823
    0
  • Hadoop数据仓库之数据治理

    访问日志)安全审计制定详细的规则。为数据的合规使用制定规范,必须在合规范围内安全使用数据。3. 参考资料《大数据之路》《hadoop构建数据仓库

    作者: 旧时光里的温柔
    1276
    2