已找到以下 10000 条记录
  • Hive MetaStore元数据库分析

    ore 服务即可。HiveMetaStore:是为Apache hive提供元数据的元数据服务,它属于Apache hive开源项目,目前已经可以作为Standalone提供服务,且不限于Hive,第三方服务也可以使用其作为元数据库服务。二:SchemaHive MetaStor

    作者: 云中台
    发表时间: 2020-10-31 18:16:33
    10207
    0
  • 数据仓库入门浅谈

    务概念和业务流程。3)数据仓库的存储数据偏静态,但是使用过程是动态不固定的。并非用几个dashboard和KPI模板看固定的格式数据就是数据仓库。真正的价值在于业务分析和BI的数据推送结合,起到量化分析、有效支撑决策作用。4)数据仓库实现而其他工具难以实现的几个特性:   快速

    作者: 大数据小粉
    发表时间: 2017-04-26 11:44:15
    9078
    0
  • HIVE】【hive对接】Kettle7.1如何对接MRS-HIVE

    【问题描述】:已通过FI客户端替换kettle中Hive相关jar,core-site.xml文件,无法连接,是否为kettle版本问题?【截图信息】:数据库连接配置:测试连接报错:

    作者: szh
    2358
    5
  • 数据仓库的好处

    系统数据需要通过ETL工具时隔数小时后同步到BI系统,无法做到实时分析,销售及运营主管无法实时掌握经营情况。为了解决这个问题,他们后来采用了华为云混合负载数据仓库DWS。DWS采用“一库两用”的设计理念,一套数据仓库集群既可以支持超高并发、低时延的业务交易请求,同时可支撑复杂的海

    作者: 小强鼓掌
    7
    3
  • 大数据技术学习——Hive

    sp;  一句话介绍 Hive是基于HDFS的数据仓库,适合存储结构化或半结构化数据。 2       Hive功能定位 Hive本身不存储数据,数据都存储在HDFS上。Hive提供两个核心功能: 统一元数据

    作者: Eric Shi
    发表时间: 2023-02-25 09:58:40
    1642
    0
  • 临时转储数据仓库

    临时转储数据仓库

    作者: 慢慢学
    发表时间: 2021-02-25 08:04:10
    1812
    0
  • Hive基础增强】Hive数据导入与导出

    student; (2)加载HDFS文件到hive中 上传文件到HDFS hive (default)> dfs -put /opt/module/datas/student.txt /user/zkx/hive; 加载HDFS上数据 hive (default)> load

    作者: 百忍成金的虚竹
    发表时间: 2021-03-25 15:16:51
    3075
    0
  • 数据仓库学习笔记

    关于数据环境:  数据仓库开发最好是以反复的方式进行。首先建立数据仓库的一部分,然后再建立另一部分。即出现所谓的CLDS的数据驱动的开发生命周期,区别于传统的需求驱动开发生命周期(SDLC)。   粒度的选择:   一般采用双重粒度或建立活样本数据库。   数据仓库中分区是在应用层而非系统层进行;

    作者: 大数据小粉
    发表时间: 2017-04-26 09:39:41
    9294
    0
  • hive基础增强】Hive参数配置及数据类型

    1.查看当前所有的配置信息 hive>set; 2.参数的配置三种方式 (1)配置文件方式 默认配置文件:hive-default.xml 用户自定义配置文件:hive-site.xml 注意:用户自定义配置会覆盖默认配置。另外,Hive也会读入Hadoop的配置,因为Hive是作为Had

    作者: 百忍成金的虚竹
    发表时间: 2021-03-27 16:05:07
    2153
    0
  • 数据仓库的分层

    从数据源的采集到多层清洗加工的过程中,数据仓库的数据逻辑分层一般分为4层。 分层的核心思想就是解耦。 ODS Operation Data Store 原始数据层,也有叫贴源层,该层对采集的原始数据进行原样存储。 DWD Data Warehouse Detail 明细数据层,对ODS进行清洗,解决数据质量问题。

    作者: 黄生
    发表时间: 2024-06-27 10:35:16
    26
    0
  • 数据仓库平台ETL

    数据仓库平台建设过程中,数据的加载、卸载,各层数据模型之间的数据流转,业务规则的实现等等数据加工过程都会以ETL任务的方式实现。 构建ETL子系统是数据仓库系统实施的一个非常重要的环节,在仓库平台建设过程中搭建一个完整、标准的ETL子系统是数据仓库平台建设的基础性目标之一。ET

    作者: 小强鼓掌
    15
    2
  • Hive简介

    当列很多或者数据量很大时,如果select *或者不指定分区,全列扫描和全表扫描效率都很低。 Hive中与列裁剪优化相关的配置项是hive.optimize.cp,与分区裁剪优化相关的则是hive.optimize.pruner,默认都是true。在HiveSQL解析阶段对应的则是ColumnPruner逻辑优化器。

    作者: xiatch
    发表时间: 2022-05-31 11:23:07
    671
    0
  • 数据库-数据仓库-数据湖

    湖仓发展历程经过对数据湖和数据仓库的深入阐述和比较,数据湖和数据仓库作为大数据系统的两条不同演进路线,有各自特有的优势和局限性。数据湖和数据仓库一个面向初创用户友好,一个成长性更佳。对企业来说,数据湖和数据仓库是否必须是一个二选一的选择题?是否能有一种方案同时兼顾数据湖的灵活性和云数据仓库的成长性

    作者: Smy1121
    发表时间: 2023-01-03 03:14:29
    200
    0
  • 中国云数据仓库,双第一

    一致,实时业务不稳定的问题,实现营销数据实时接入、处理,复杂分析查询从10分钟级提高到秒级。 安全方面 2022年,华为云GaussDB(DWS)正式通过全球权威信息技术安全性评估标准CC EAL2+ALC_FLR.2级别认证,是目前中国唯一获得CC安全认证的数据仓库产品。

    作者: 华为云头条
    发表时间: 2023-08-18 18:07:12
    103
    0
  • 数据仓库迁移方案

    项目背景比如:XX银行基于Teradata一体机构建的数据仓库,存在成本高、可替换性差、在线升级能力弱等问题,希望引入扩展性更强、具有成本竞争力、在线升级能力强的产品替代。1.2. 项目目标比如项目总体目标:替换的数据仓库产品能力要不低于现网Teradata的整体能力,而且要满

    作者: Sprother
    1081
    2
  • 为什么我们需要数据仓库

    gn> <b>数据仓库解决方案</b><align=left>上面的问题,都可以通过一个建设良好的数据仓库来解决。</align><align=left>业务数据库是面向操作的,主要服务于业务产品和开发。而数据仓库则是面向分析的,主要服务于我们分析人员。评价数据仓库做的好不好,就

    作者: J Lee
    17470
    10
  • 安装和体验hive

    再次进入mysql容器,以hive账号的身份登录mysql: mysql -uhive -p 创建名为hive的数据库: CREATE DATABASE hive; 安装hivehive官网下载,地址是:http://mirror.bit.edu.cn/apache/hive/ ,选择合适的版本,如下图:

    作者: 程序员欣宸
    发表时间: 2022-11-01 00:26:59
    155
    0
  • 数据如何存储到数据仓库服务?

    数据如何存储到数据仓库服务?

    作者: 木又林夕
    9242
    1
  • Hive基础05、Hive引入数据

    ​ &nbsp;点击并拖拽以移动点击并拖拽以移动​编辑 Hive基础05、Hive引入数据 前提 Hive表中的数据不能通过insert语句插入,而是load data语句进行加载,其中加载的数据来源主要包括: 1、本地文件系统加载数据 2、HDFS文件系统加载数据 load

    作者: 红目香薰
    发表时间: 2022-07-29 02:14:18
    190
    0
  • 了解数据仓库

    得洞察力、监控企业绩效以及更明智地决策。数据仓库通过高效地存储数据以便最大限度地减少数据输入和输出 (I/O),并快速地同时向成千上万的用户提供查询结果,为这些报告、控制面板和分析工具 由数据仓库提供支持。             数据仓库服务(Data Warehouse Se

    作者: 建赟
    1051
    2