搜索_华为云

Spark SQL无法查询到ORC类型的Hive表的新插入数据 - MapReduce服务 MRS

SQL无法查询到ORC类型的Hive表的新插入数据问题为什么通过Spark SQL无法查询到存储类型为ORC的Hive表的新插入数据？主要有以下两种场景存在这个问题：对于分区表和非分区表，在Hive客户端中执行插入数据的操作后，会出现Spark SQL无法查询到最新插入的数据的问题。对于分区表，在Spark

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > SQL和DataFrame
Spark SQL无法查询到ORC类型的Hive表的新插入数据 - MapReduce服务 MRS

SQL无法查询到ORC类型的Hive表的新插入数据问题为什么通过Spark SQL无法查询到存储类型为ORC的Hive表的新插入数据？主要有以下两种场景存在这个问题：对于分区表和非分区表，在Hive客户端中执行插入数据的操作后，会出现Spark SQL无法查询到最新插入的数据的问题。对于分区表，在Spark

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > SQL和DataFrame
MRS集群用户认证策略 - MapReduce服务 MRS

Kerberos协议中，每个用户对象即一个principal。一个完整的用户对象包含两个部分信息：用户名和域名。在运维管理或应用开发的场景中，需要在客户端认证用户身份后才能连接到集群服务端。系统操作运维与业务场景中主要使用的用户分为“人机”用户和“机机”用户。二者主要区别在于“机机”用户密码由系统随机生成。 Kerberos认证

 帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群用户 > 集群用户权限概述
集群内用户密码的过期时间如何查询和修改？ - MapReduce服务 MRS

集群内用户密码的过期时间如何查询和修改？查询密码有效期查询组件运行用户（人机用户、机机用户）密码有效期：以客户端安装用户，登录安装了客户端的节点。执行以下命令，切换到客户端目录，例如“/opt/Bigdata/client”。 cd /opt/Bigdata/client

帮助中心 > MapReduce服务 MRS > 常见问题 > 用户认证及权限类
配置过滤掉分区表中路径不存在的分区 - MapReduce服务 MRS

滤掉分区路径不存在的分区，来避免读取时报错。配置描述可以通过以下两种方式配置是否过滤掉分区表分区路径不存在的分区。在Spark Driver端的“spark-defaults.conf”配置文件中进行设置。表1 参数说明参数说明默认值 spark.sql.hive.verifyPartitionPath

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL企业级能力增强
Hadoop组件jar包位置和环境变量的位置在哪里？ - MapReduce服务 MRS

Hadoop组件jar包位置和环境变量的位置在哪里？ hadoopstreaming.jar位置在/opt/share/hadoop-streaming-*目录下。其中*由Hadoop版本决定。 jdk环境变量：/opt/client/JDK/component_env Hadoop组件的环境变量位

 帮助中心 > MapReduce服务 MRS > 常见问题 > 组件配置类
SQL和DataFrame - MapReduce服务 MRS
SQL和DataFrame - MapReduce服务 MRS

为什么在启动spark-beeline的命令中指定“--hivevar”选项无效执行复杂SQL语句时报“Code of method ... grows beyond 64 KB”的错误在Beeline/JDBCServer模式下连续运行10T的TPCDS测试套会出现内存不足的现象连上不同的JDBCS

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题
如何修改HDFS的副本数？ - MapReduce服务 MRS

如果集群详情页面没有“组件管理”页签，请先完成IAM用户同步（在集群详情页的“概览”页签，单击“IAM用户同步”右侧的“同步”进行IAM用户同步）。 MRS 3.x及后续版本，登录FusionInsight Manager。然后选择“集群 > 待操作的集群名称 > 服务 > HDFS > 配置 > 全部配置”。

帮助中心 > MapReduce服务 MRS > 常见问题 > 组件配置类
Spark应用开发规则 - MapReduce服务 MRS

stop()。图1 添加SparkContext.stop()和不添加的区别合理规划AM资源占比任务数量较多且每个任务占用的资源较少时，可能会出现集群资源足够，提交的任务成功但是无法启动，此时可以提高AM的最大资源占比。图2 修改AM最大资源百分比父主题： Spark应用开发规范

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Spark应用开发规范
如何获取MRS集群ZooKeeper的IP地址和端口？ - MapReduce服务 MRS

如何获取MRS集群ZooKeeper的IP地址和端口？ ZooKeeper的IP地址和端口可以通过MRS控制台或登录Manager界面获取。方法一：通过MRS控制台获取在MRS集群详情页的“概览”页签，单击“IAM用户同步”右侧的“同步”进行IAM用户同步。选择“组件管理 >

帮助中心 > MapReduce服务 MRS > 常见问题 > 组件管理类
MRS集群中安装的组件能否删除？ - MapReduce服务 MRS

MRS集群中安装的组件能否删除？问： MRS集群创建成功后，集群中已安装的组件能否删除？答：已经创建的MRS 3.1.0及之前版本集群中的组件不可以删除，如果不使用的话可以登录集群Manager页面在服务管理中找到对应的组件将其停止。 MRS 3.1.2-LTS.3及之后版本的自定义

 帮助中心 > MapReduce服务 MRS > 常见问题 > 组件管理类
添加Hive的Ranger访问权限策略 - MapReduce服务 MRS

year：仅显示日期字符串的年份部分，并将月份和日期默认为01/01。 Custom：可使用任何有效返回与被屏蔽的列中的数据类型相同的数据类型来自定义策略。如需添加多列的脱敏策略，可单击按钮添加。单击“Add”，在策略列表可查看策略的基本信息。用户通过Hive客户端对配置了数据脱敏策略的表执行

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Ranger（MRS 3.x） > Ranger权限策略配置示例
ClickHouse基本原理 - MapReduce服务 MRS

ClickHouse是一款开源的面向联机分析处理的列式数据库，其独立于Hadoop大数据体系，最核心的特点是压缩率和极速查询性能。同时，ClickHouse支持SQL查询，且查询性能好，特别是基于大宽表的聚合分析查询性能非常优异，比其他分析型数据库速度快一个数量级。 ClickHouse核心的功能特性介绍如下：

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > ClickHouse
Spark基本原理 - MapReduce服务 MRS
Spark基本原理 - MapReduce服务 MRS

store以及数据库，支持对于可变状态的细粒度更新，这一点要求集群需要对数据或者日志的更新进行备份来保障容错性。这样就会给数据密集型的工作流带来大量的IO开销。而对于RDD来说，它只有一套受限制的接口，仅支持粗粒度的更新，例如map，join等等。通过这种方式，Spark只需要简单的记录建立数据的转换操作的

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark
SQL和DataFrame调优 - MapReduce服务 MRS

SQL和DataFrame调优 Spark SQL join优化 INSERT...SELECT操作调优父主题： Spark应用调优

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优
建立Hive表分区提升查询效率 - MapReduce服务 MRS

Hive在做Select查询时，一般会扫描整个表内容，会消耗较多时间去扫描不关注的数据。此时，可根据业务需求及其查询维度，建立合理的表分区，从而提高查询效率。操作步骤以root用户登录已安装Hive客户端的节点。执行以下命令，进入客户端安装目录，例如“/opt/client”。 cd

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive性能调优
MRS组件版本一览表 - MapReduce服务 MRS

MRS各集群版本配套的组件及版本号信息如表1所示。 Hadoop组件包含HDFS、Yarn、Mapreduce服务，DBService、ZooKeeper、KrbServer及LdapServer等集群内部使用的组件，在创建集群时的组件列表中不呈现。 MRS组件的版本号通常与组件开源版本号保持一致。

帮助中心 > MapReduce服务 MRS > 产品介绍
Hive启用Ranger鉴权后，在Hue页面能查看到没有权限的表和库 - MapReduce服务 MRS

2个关于database的public组策略，所有用户都属于public组，默认给public组配有default数据库的创表和所有其他数据库的create权限，因此默认所有的用户都有show databases和show tables的权限，如果不想让某些用户有show databases和show

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Ranger
MRS可靠性增强 - MapReduce服务 MRS

Hadoop开源软件的基础上，在主要业务部件的可靠性、性能调优等方面进行了优化和提升。系统可靠性管理节点均实现HA Hadoop开源版本的数据、计算节点已经是按照分布式系统进行设计的，单节点故障不影响系统整体运行；而以集中模式运作的管理节点可能出现的单点故障，就成为整个系统可靠性的短板。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 产品功能
ALM-14003 丢失的HDFS块数量超过阈值 - MapReduce服务 MRS

ALM-14003 丢失的HDFS块数量超过阈值告警解释系统每30秒周期性检测丢失的块数量，并把丢失的块数量和阈值相比较。丢失的块数量指标默认提供一个阈值范围。当检测到丢失的HDFS块数量超出阈值范围时产生该告警。用户可通过“运维 > 告警 > 阈值设置 > 待操作集群的名称 > HDFS”修改阈值。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考

总条数： 5794

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark SQL无法查询到ORC类型的Hive表的新插入数据 - MapReduce服务 MRS

Spark SQL无法查询到ORC类型的Hive表的新插入数据 - MapReduce服务 MRS

MRS集群用户认证策略 - MapReduce服务 MRS

集群内用户密码的过期时间如何查询和修改？ - MapReduce服务 MRS

配置过滤掉分区表中路径不存在的分区 - MapReduce服务 MRS

Hadoop组件jar包位置和环境变量的位置在哪里？ - MapReduce服务 MRS

SQL和DataFrame - MapReduce服务 MRS

如何修改HDFS的副本数？ - MapReduce服务 MRS

Spark应用开发规则 - MapReduce服务 MRS

如何获取MRS集群ZooKeeper的IP地址和端口？ - MapReduce服务 MRS

MRS集群中安装的组件能否删除？ - MapReduce服务 MRS

添加Hive的Ranger访问权限策略 - MapReduce服务 MRS

ClickHouse基本原理 - MapReduce服务 MRS

Spark基本原理 - MapReduce服务 MRS

SQL和DataFrame调优 - MapReduce服务 MRS

建立Hive表分区提升查询效率 - MapReduce服务 MRS

MRS组件版本一览表 - MapReduce服务 MRS

Hive启用Ranger鉴权后，在Hue页面能查看到没有权限的表和库 - MapReduce服务 MRS

MRS可靠性增强 - MapReduce服务 MRS

ALM-14003 丢失的HDFS块数量超过阈值 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线