MAPREDUCE服务 MRS-Spark2x无法访问Spark1.5创建的DataSource表:回答
回答
- 原因分析:
这是由于Spark2x与Spark1.5存储DataSoure表信息的格式不一致导致的。Spark1.5会将schema信息分成多个part,使用path.park.0作为key进行存储,读取时再将各个part都读取出来,重新拼成完整的信息。而Spark2x直接使用相应的key获取对应的信息。这样在Spark2x中去读取Spark1.5创建的DataSource表时,就无法成功读取到key对应的信息,导致解析DataSource表信息失败。
而在处理Hive格式的表时,Spark2x与Spark1.5的存储方式一致,所以Spark2x可以直接读取Spark1.5创建的表,不存在上述问题。
- 规避措施:
Spark2x可以通过创建外表的方式来创建一张指向Spark1.5表实际数据的表,这样可以实现在Spark2x中读取Spark1.5创建的DataSource表。同时,Spark1.5更新过数据后,Spark2x中访问也能感知到变化 ,反过来一样。这样即可实现Spark2x对Spark1.5创建的DataSource表的访问。
- MapReduce服务_什么是MapReduce服务_什么是HBase
- MRS备份恢复_MapReduce备份_数据备份
- MapReduce服务_如何使用MapReduce服务_MRS集群客户端安装与使用
- 负载均衡无法访问_无法与后端连接_后端不可用-华为云
- MapReduce服务_什么是Loader_如何使用Loader
- MapReduce服务_什么是HetuEngine_如何使用HetuEngine
- MapReduce服务_什么是Hue_如何使用Hue
- MapReduce服务_什么是Kafka_如何使用Kafka
- MapReduce服务_什么是存算分离_如何配置MRS集群存算分离
- 专门建站的公司_如何创建一个自己的网站