MAPREDUCE服务 MRS-Spark SQL无法查询到Parquet类型的Hive表的新插入数据:回答
回答
由于Spark存在一个机制,为了提高性能会缓存Parquet的元数据信息。当通过Hive或其他方式更新了Parquet表时,缓存的元数据信息未更新,导致Spark SQL查询不到新插入的数据。
对于存储类型为Parquet的Hive分区表,在执行插入数据操作后,如果分区信息未改变,则缓存的元数据信息未更新,导致Spark SQL查询不到新插入的数据。
解决措施:在使用Spark SQL查询之前,需执行Refresh操作更新元数据信息。
REFRESH TABLE table_name;
table_name为刷新的表名,该表必须存在,否则会出错。
执行查询语句时,即可获取到最新插入的数据。
- Hudi服务_什么是Hudi_如何使用Hudi
- MapReduce服务_什么是Hive_如何使用Hive
- 什么是Spark_如何使用Spark_Spark的功能是什么
- MapReduce服务_什么是Hue_如何使用Hue
- 免费的MySQL云数据库_数据库管理系统有哪些_MySQL查询表
- MapReduce服务_什么是ClickHouse_如何使用ClickHouse
- MapReduce服务_如何使用MapReduce服务_MRS集群客户端安装与使用
- MapReduce服务_什么是Loader_如何使用Loader
- MRS备份恢复_MapReduce备份_数据备份
- MapReduce服务_什么是存算分离_如何配置MRS集群存算分离