搜索_华为云

什么是数据仓库服务 - 数据仓库服务 GaussDB(DWS)

海量大数据分析提供有竞争力的解决方案。 DWS提供存算一体、存算分离多种产品形态，围绕企业级内核、实时分析、协同计算、融合分析、云原生五大方向构筑业界第一数据仓库。详情请参见数据仓库类型。存算一体：面向数据分析场景，为用户提供高性能、高扩展、高可靠、高安全、易运维的企业级数仓服

 帮助中心 > 数据仓库服务 GaussDB(DWS) > 产品介绍
Hive CBO原理介绍 - MapReduce服务 MRS

Hive中实现CBO的总体过程如下： Hive使用开源组件Apache Calcite实现CBO。首先SQL语句转化成Hive的AST，然后转成Calcite可以识别的RelNodes。Calcite将RelNode中的Join顺序调整后，再由Hive将RelNode转成AST，继续Hiv

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Hive
实时数仓函数 - 数据仓库服务 GaussDB(DWS)

实时数仓函数 hstore_light_merge(rel_name text) 描述：该函数用于手动对HStore表进行轻量化清理操作，持有目标表的三级锁。返回值类型：int 示例： 1 SELECT hstore_light_merge('reason_select');

帮助中心 > 数据仓库服务 GaussDB(DWS) > 实时数仓开发指南(9.1.0.x)
实时数仓函数 - 数据仓库服务 GaussDB(DWS)

实时数仓函数 hstore_light_merge(rel_name text) 描述：该函数用于手动对HStore表进行轻量化清理操作，持有目标表的三级锁。返回值类型：int 示例： 1 SELECT hstore_light_merge('reason_select');

帮助中心 > 数据仓库服务 GaussDB(DWS) > 实时数仓开发指南(8.1.3.x)
实时数仓语法 - 数据仓库服务 GaussDB(DWS)

实时数仓语法 CREATE TABLE INSERT DELETE UPDATE UPSERT MERGE INTO SELECT ALTER TABLE

帮助中心 > 数据仓库服务 GaussDB(DWS) > 实时数仓开发指南(9.1.0.x)
实现Hive进程访问多ZooKeeper - MapReduce服务 MRS

实现Hive进程访问多ZooKeeper 功能简介 FusionInsight支持在同一个客户端进程内同时访问FusionInsight ZooKeeper和第三方的ZooKeeper，分别通过“testConnectHive”和“testConnectApacheZK”方法实现。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Hive开发指南（安全模式） > 开发Hive应用 > Hive JDBC访问样例程序
实现Hive进程访问多ZooKeeper - MapReduce服务 MRS

实现Hive进程访问多ZooKeeper 功能简介 FusionInsight支持在同一个客户端进程内同时访问FusionInsight ZooKeeper和第三方的ZooKeeper，分别通过“testConnectHive”和“testConnectApacheZK”方法实现。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Hive开发指南（普通模式） > 开发Hive应用 > Hive JDBC访问样例程序
订阅实时数仓Binlog - 数据仓库服务 GaussDB(DWS)

全量同步source，再实时消费source端增量。支持消费即清理：对于空间敏感且只关注实时同步与加工的客户，支持消费后即开始异步清理增量，有效减少空间使用。利用Flink强大的实时处理能力和GaussDB(DWS)的Binlog能力，可以快速构建实时数仓，且无需维护其他组件

 帮助中心 > 数据仓库服务 GaussDB(DWS) > 实时数仓开发指南(9.1.0.x) > 实时数仓Binlog
创建Hive表 - MapReduce服务 MRS
创建Hive表 - MapReduce服务 MRS

创建Hive表功能介绍本小节介绍了如何使用HQL创建内部表、外部表的基本操作。创建表主要有以下三种方式：自定义表结构，以关键字EXTERNAL区分创建内部表和外部表。内部表，如果对数据的处理都由Hive完成，则应该使用内部表。在删除内部表时，元数据和数据一起被删除。外部

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Hive开发指南（普通模式） > 开发Hive应用 > Hive JDBC访问样例程序
实时数仓简介 - 数据仓库服务 GaussDB(DWS)

(DWS)的实时数仓中的HStore表就是针对这种情况设计和实现的，面向对于实时入库和实时查询有较强诉求的场景，同时拥有处理传统TP场景的事务能力。 GaussDB(DWS)提供的实时数仓中实现了一种全新的HStore表，可以做到单条或者小批量IUD操作的高并发实时入库，也可以支

 帮助中心 > 数据仓库服务 GaussDB(DWS) > 实时数仓开发指南(9.1.0.x)
Hive - MapReduce服务 MRS
Hive - MapReduce服务 MRS

Hive Hive基本原理 Hive CBO原理介绍 Hive与其他组件的关系 Hive开源增强特性父主题：组件介绍

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍
Hive Join数据优化 - MapReduce服务 MRS

解决数据倾斜的问题，可通过设置“set hive.optimize.skewjoin=true”并调整“hive.skewjoin.key”的大小。“hive.skewjoin.key”是指Reduce端接收到多少个key即认为数据是倾斜的，并自动分发到多个Reduce。父主题： Hive性能调优

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive性能调优
Hive ORC数据存储优化 - MapReduce服务 MRS

Hive ORC数据存储优化操作场景 “ORC”是一种高效的列存储格式，在压缩比和读取效率上优于其他文件格式。建议使用“ORC”作为Hive表默认的存储格式。前提条件已登录Hive客户端，具体操作请参见Hive客户端使用实践。操作步骤推荐：使用“SNAPPY”压缩，适用于压缩比和读取效率要求均衡场景。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive性能调优
如何对Hive表大小数据进行监控 - MapReduce服务 MRS

如何对Hive表大小数据进行监控问题如何对Hive中的表大小数据进行监控？回答当用户要对Hive表大小数据进行监控时，可以通过HDFS的精细化监控对指定表目录进行监控，从而到达监控指定表大小数据的目的。前提条件 Hive、HDFS组件功能正常 HDFS精细化监控功能正常

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive常见问题
如何关闭Hive客户端日志 - MapReduce服务 MRS

如何关闭Hive客户端日志问题如何关闭Hive客户端的运行日志？回答使用root用户登录安装客户端的节点。执行以下命令，切换到客户端安装目录，例如“/opt/client”。 cd /opt/client 执行以下命令配置环境变量。 source bigdata_env

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive常见问题
如何关闭Hive客户端日志 - MapReduce服务 MRS

如何关闭Hive客户端日志问题如何关闭Hive客户端的运行日志？回答使用root用户登录安装客户端的节点。执行以下命令，切换到客户端安装目录，例如“/opt/client”。 cd /opt/client 执行以下命令配置环境变量。 source bigdata_env

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive常见问题
Hive应用开发简介 - MapReduce服务 MRS

Hive应用开发简介 Hive简介 Hive是一个开源的，建立在Hadoop上的数据仓库框架，提供类似SQL的HiveQL语言操作结构化数据，其基本原理是将HiveQL语言自动转换成MapReduce任务或Spark任务，从而完成对Hadoop集群中存储的海量数据进行查询和分析。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Hive开发指南 > Hive应用开发概述
查询Hive表数据 - MapReduce服务 MRS

查询Hive表数据功能介绍本小节介绍了如何使用HQL对数据进行查询分析。从本节中可以掌握如下查询分析方法： SELECT查询的常用特性，如JOIN等。加载数据进指定分区。如何使用Hive自带函数。如何使用自定义函数进行查询分析，如何创建、定义自定义函数请见创建Hive用户自定义函数。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Hive开发指南（普通模式） > 开发Hive应用 > Hive JDBC访问样例程序
Hive服务状态为故障如何处理 - MapReduce服务 MRS

Hive服务状态为故障如何处理可能原因 DBservice服务不可用会导致Hive服务状态为Bad。 HDFS服务不可用会导致Hive服务状态为Bad。 ZooKeeper服务不可用会导致Hive服务状态为Bad。 LDAP/KrbServer服务不可用会导致Hive服务状态为Bad。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hive
Hive SQL运行变慢阶段如何排查 - MapReduce服务 MRS

Hive SQL运行变慢阶段如何排查场景说明对于一个Hive SQL任务，如果运行时间突然变长，可能有多种原因造成，如HiveServer编译变慢、访问HDFS变慢、访问Yarn变慢或访问元数据变慢。操作步骤以下为Hive SQL在哪个阶段执行变慢的排查方法： HiveServer编译变慢

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive故障排除

总条数： 10000

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

什么是数据仓库服务 - 数据仓库服务 GaussDB(DWS)

Hive CBO原理介绍 - MapReduce服务 MRS

实时数仓函数 - 数据仓库服务 GaussDB(DWS)

实时数仓函数 - 数据仓库服务 GaussDB(DWS)

实时数仓语法 - 数据仓库服务 GaussDB(DWS)

实现Hive进程访问多ZooKeeper - MapReduce服务 MRS

实现Hive进程访问多ZooKeeper - MapReduce服务 MRS

订阅实时数仓Binlog - 数据仓库服务 GaussDB(DWS)

创建Hive表 - MapReduce服务 MRS

实时数仓简介 - 数据仓库服务 GaussDB(DWS)

Hive - MapReduce服务 MRS

Hive Join数据优化 - MapReduce服务 MRS

Hive ORC数据存储优化 - MapReduce服务 MRS

如何对Hive表大小数据进行监控 - MapReduce服务 MRS

如何关闭Hive客户端日志 - MapReduce服务 MRS

如何关闭Hive客户端日志 - MapReduce服务 MRS

Hive应用开发简介 - MapReduce服务 MRS

查询Hive表数据 - MapReduce服务 MRS

Hive服务状态为故障如何处理 - MapReduce服务 MRS

Hive SQL运行变慢阶段如何排查 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线