已找到以下 10000 条记录
  • Hive 常用函数

    Hive数据库中内置一些常用的函数,同时hive也支持自定义函数。hive自定义函数,主要是通过java编程实现,因为hive是java所写的。下面主要是介绍一些hive当中的一些常用的函数的使用。通过对函数的学习,有利于对于hive的业务操作。步骤 1 首先执行环境变量。 > source

    作者: wuweibang
    2372
    0
  • kettle如何连接hive

    doop hive 2-》根据hive的实际情况填入连接信息,连接名称随便填: 点击测试,弹出如下界面表示成功: 点击右下角确认后,将刚才创建的hive拖入右侧: 点击获取sql查询语句可以顺利获取hive中的表: 点击预览后,顺利查看hive表数据:

    作者: 小小明-代码实体
    发表时间: 2021-10-12 14:49:44
    2139
    0
  • Hive简介

    而使用Hive来完成WordCount,只需要3条HQL语句。 Hive提供了两种命令行工具,CLI与Beeline,分别对应hive与beeline命令。CLI一般在Hive主机上使用,而Beeline支持远程连接。使用Beeline需要首先在Hive主机中启动HiveServer2服务。

    作者: 黄生
    发表时间: 2023-09-12 08:32:53
    105
    1
  • 创建Hive用户自定义函数 - MapReduce服务 MRS

    total; } } 创建Hive用户自定义函数 准备执行函数的用户。 使用admin用户登录Manager界面,选择“集群 > 集群属性”,查看集群的“认证模式”并记录。 选择“集群 > 服务 > Hive”,单击页面右上角的“更多”查看Hive是否启用Ranger鉴权。 选择“系统

  • Hive 和 Hudi

    Apache Hive 是一个建立在 Hadoop 之上的数据仓库基础设施,它提供了一种类似于 SQL 的查询语言(HiveQL),用于处理大规模的结构化数据。Hive 允许用户通过 SQL 语句来执行数据查询、汇总和分析,非常适合数据仓库和分析场景。Hive 的数据存储依赖于

    作者: 黄生
    22
    4
  • 配置HiveMetaStore客户端连接负载均衡 - MapReduce服务 MRS

    配置HiveMetaStore客户端连接负载均衡 操作场景 Hive的MetaStore客户端连接支持负载均衡,即可通过服务端在ZooKeeper记录的连接数,选择连接最少的节点进行连接,防止大业务场景下造成某个MetaStore高负载,其他MetaStore空闲情况,开启此功能不影响原有连接方式。

  • Hive】【ODBC】Hive-ODBC样例对接

    【功能模块】Hive-ODBC样例对接【操作步骤&问题现象】1、目前卡在了平台下用odbc连接这块,请问该报错是何种原因导致?2、HiveODBC能否实现Unicode接口,即支持中文?【截图信息】【日志信息】(可选,上传日志内容或者附件)

    作者: szh
    1148
    1
  • Hive优化(十)-控制hive任务中的map数和reduce数

    主要的决定因素有:input的文件总个数,input的文件大小,集群设置的文件块大小(目前为128M,可在hive中通过set dfs.block.size;命令查看到,该参数不能自定义修改); 2)举例: a) 假设input目录下有1个文件a,大小为780M,那么had

    作者: 百忍成金的虚竹
    发表时间: 2021-03-25 17:12:50
    1684
    0
  • Hive SQL逻辑优化 - MapReduce服务 MRS

    Hive SQL逻辑优化 操作场景 在Hive上执行SQL语句查询时,如果语句中存在“(a&b) or (a&c)”逻辑时,建议将逻辑改为“a & (b or c)”。 样例 假设条件a为“p_partkey = l_partkey”,优化前样例如下所示: select

  • 创建Hive用户自定义函数 - MapReduce服务 MRS

    total; } } 创建Hive用户自定义函数 准备执行函数的用户。 使用admin用户登录Manager界面,选择“集群 > 集群属性”,查看集群的“认证模式”并记录。 选择“集群 > 服务 > Hive”,单击页面右上角的“更多”查看Hive是否启用Ranger鉴权。 选择“系统

  • Flink使用HiveCatalog访问hive的鉴权问题

    "2.3.4"; HiveCatalog hive = new HiveCatalog(name, defaultDatabase, hiveConfDir, version); tableEnv.registerCatalog("myhive", hive); // set

    作者: Honor_xiaobing
    5662
    1
  • 【FI产品】Hive查询报错

    Hive执行命令报错,截图如下:

    作者: LIHAOTIAN
    4481
    2
  • 配置Hive任务的最大map数 - MapReduce服务 MRS

    配置Hive任务的最大map数 “hive.mapreduce.per.task.max.splits”参数可用于从服务端限定Hive任务的最大map数,避免HiveSever服务过载而引发的性能问题。 操作步骤 登录FusionInsight Manager页面,选择“集群 >

  • hive元数据库连接

    (1)在hive配置中查到元数据密码,但是是加密状态的,请问怎么获取或者解密密码?(2)元数据库显示的连接地址是浮动IP,想在本地用客户端的方式连接数据库可不可行?(3)如果找不到解密的方法,能不能通过授权的方式创建新的连接账号连接数据库?

    作者: yd_223605119
    377
    6
  • DBeaver对接FusionInsight MRS Hive

    在弹出的对话框中点击 New. 新建的连接名字为FI-hive-test,连接信息如下,完成后点击OK 1. org.apache.hive.jdbc.HiveDriver 2. jdbc:hive2://172.16.4.121:24002,172.16.4.122:24002

    作者: 晋红轻
    发表时间: 2021-10-27 11:13:47
    1882
    0
  • FusionInsight HIVE调优

    介绍Hive基本运维,常见调优思路,调优案例

    播放量  1264
  • Hive Join数据优化 - MapReduce服务 MRS

    解决数据倾斜的问题,可通过设置“set hive.optimize.skewjoin=true”并调整“hive.skewjoin.key”的大小。“hive.skewjoin.key”是指Reduce端接收到多少个key即认为数据是倾斜的,并自动分发到多个Reduce。 父主题: Hive性能调优

  • Hive日志概述

    /hive”各日志功能如下表:表1 Hive日志列表日志类型日志文件名描述HiveServer运行日志hive.logHive运行日志。hive.xxxx-xx-xx.log.zip运行日志的历史归档,以归档时的日期作为标识。如,hive.2016-02-29_13-08-24.[7]

    作者: FI小粉丝
    3393
    1
  • 配置Hive表、列或数据库的用户权限 - MapReduce服务 MRS

    FUNCTION Hive管理员权限(Hive Admin Privilege) DROP FUNCTION Hive管理员权限(Hive Admin Privilege) ALTER DATABASE Hive管理员权限(Hive Admin Privilege) 父主题: Hive用户权限管理

  • Hive快速入门系列(5) | 如何访问HiveJDBC

      此篇博文博主为大家讲解的是如何访问HiveJDBC。 目录 1. 启动hiveserver2服务2. 启动beeline(hive自带的JDBC访问的客户端)3. 连接hiveserver24. hiveserver2和beeline的区别   首先,我们先来看下Hive的bin文件夹的目录:

    作者: 不温卜火
    发表时间: 2020-12-02 14:47:10
    1941
    0