搜索_华为云

配置过滤掉分区表中路径不存在的分区 - MapReduce服务 MRS

verifyPartitionPath 配置读取Hive分区表时，是否过滤掉分区表分区路径不存在的分区。 “true”：过滤掉分区路径不存在的分区； “false”：不进行过滤。 false 在spark-submit命令提交应用时，通过“--conf”参数配置是否过滤掉分区表分区路径不存在的分区。示例： spark-submit

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL企业级能力增强
配置过滤掉分区表中路径不存在的分区 - MapReduce服务 MRS

verifyPartitionPath 配置读取HIVE分区表时，是否过滤掉分区表分区路径不存在的分区。 “true”：过滤掉分区路径不存在的分区； “false”：不进行过滤。 false 在spark-submit命令提交应用时，通过“--conf”参数配置是否过滤掉分区表分区路径不存在的分区。示例： spark-submit

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL企业级能力增强
建立Hive表分区提升查询效率 - MapReduce服务 MRS

PARTITON语句将数据加载到分区时，只能加载到静态分区。动态分区：通过查询命令，将结果插入到某个表的分区时，可以使用动态分区。动态分区通过在客户端工具执行如下命令开启： set hive.exec.dynamic.partition=true; 动态分区默认模式是“strict”

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive性能调优
SparkSQL访问Hive分区表启动Job前耗时较长如何处理？ - MapReduce服务 MRS

b=xxx 原因分析按照设定，任务应该只扫描b=xxx的分区，但是查看任务日志可以发现，实际上任务却扫描了所有的分区再来计算b=xxx的数据，因此任务计算的很慢。并且因为需要扫描所有文件，会有大量的OBS请求发送。 MRS默认开启基于分区统计信息的执行计划优化，相当于自动执行Analyze

帮助中心 > MapReduce服务 MRS > 常见问题 > 作业管理类
Spark SQL无法查询到ORC类型的Hive表的新插入数据 - MapReduce服务 MRS

Spark SQL无法查询到ORC类型的Hive表的新插入数据问题为什么通过Spark SQL无法查询到存储类型为ORC的Hive表的新插入数据？主要有以下两种场景存在这个问题：对于分区表和非分区表，在Hive客户端中执行插入数据的操作后，会出现Spark SQL无法查询到最新插入的数据的问题。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > SQL和DataFrame
Spark SQL无法查询到ORC类型的Hive表的新插入数据 - MapReduce服务 MRS

Spark SQL无法查询到ORC类型的Hive表的新插入数据问题为什么通过Spark SQL无法查询到存储类型为ORC的Hive表的新插入数据？主要有以下两种场景存在这个问题：对于分区表和非分区表，在Hive客户端中执行插入数据的操作后，会出现Spark SQL无法查询到最新插入的数据的问题。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > SQL和DataFrame
Spark SQL无法查询到Parquet类型的Hive表的新插入数据 - MapReduce服务 MRS

更新，导致Spark SQL查询不到新插入的数据。对于存储类型为Parquet的Hive分区表，在执行插入数据操作后，如果分区信息未改变，则缓存的元数据信息未更新，导致Spark SQL查询不到新插入的数据。解决措施：在使用Spark SQL查询之前，需执行Refresh操作更新元数据信息。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > SQL和DataFrame
有大量分区时执行drop partition操作失败 - MapReduce服务 MRS

toSQL(SQLText.java:339) 原因分析 drop partition的处理逻辑是将找到所有满足条件的分区，将其拼接起来，最后统一删除。由于分区数过多，拼删元数据堆栈较深，出现StackOverFlow异常。解决办法分批次删除分区。父主题：使用Hive

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hive
使用CDM服务迁移MySQL数据至MRS Hive - MapReduce服务 MRS

已参考管理驱动，上传了MySQL数据库驱动。步骤1：在MRS Hive上创建Hive分区表在MRS的Hive客户端中，执行以下SQL语句创建一张Hive分区表，表名与MySQL上的表trip_data一致，且Hive表比MySQL表多建三个字段y、ym、ymd，作为Hive的分区字段。 SQL语句如下：

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
Spark SQL无法查询到Parquet类型的Hive表的新插入数据 - MapReduce服务 MRS

更新，导致Spark SQL查询不到新插入的数据。对于存储类型为Parquet的Hive分区表，在执行插入数据操作后，如果分区信息未改变，则缓存的元数据信息未更新，导致Spark SQL查询不到新插入的数据。解决措施：在使用Spark SQL查询之前，需执行Refresh操作更新元数据信息。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > SQL和DataFrame
建表语句分区列为timestamp时，使用非标准格式的时间指定分区查询表统计失败 - MapReduce服务 MRS

建表语句分区列为timestamp时，使用非标准格式的时间指定分区查询表统计失败问题建表语句分区列为timestamp时，使用非标准格式的时间指定分区查询表统计失败以及show partitions table结果编码不对。执行desc formatted test_hiv

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark故障排除
配置Hive表分区动态覆盖 - MapReduce服务 MRS

配置Hive表分区动态覆盖配置场景在旧版本中，使用insert overwrite语法覆写分区表时，只支持对指定的分区表达式进行匹配，未指定表达式的分区将被全部删除。在spark2.3版本中，增加了对未指定表达式的分区动态匹配的支持，此种语法与Hive的动态分区匹配语法行为一致。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL企业级能力增强
建立Hive表分区提升查询效率 - MapReduce服务 MRS

PARTITON语句将数据加载到分区时，只能静态分区。动态分区：通过查询命令，将结果插入到某个表的分区时，可以使用动态分区。动态分区通过在客户端工具执行如下命令来开启： set hive.exec.dynamic.partition=true; 动态分区默认模式是strict，也就

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive性能调优
配置Hive表分区动态覆盖 - MapReduce服务 MRS

配置Hive表分区动态覆盖配置场景在旧版本中，使用insert overwrite语法覆写分区表时，只支持对指定的分区表达式进行匹配，未指定表达式的分区将被全部删除。在spark2.3版本中，增加了对未指定表达式的分区动态匹配的支持，此种语法与Hive的动态分区匹配语法行为一致。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL企业级能力增强
配置Hive表不同分区分别存储至OBS和HDFS - MapReduce服务 MRS

配置Hive表不同分区分别存储至OBS和HDFS 操作场景存算分离场景下，Hive分区表支持不同的分区分别指定不同的存储源，可以指定一个分区表中不同分区的存储源为OBS或者HDFS。本特性仅适用于MRS 3.2.0及之后版本。此章节仅说明分区表指定存储源的能力，关于Hive如

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive企业级能力增强
Hive分区数过多导致删除表失败 - MapReduce服务 MRS

Hive分区数过多导致删除表失败问题现象 Hive创建的二级分区表有两万多个分区，导致用户在执行truncate table ${TableName},drop table ${TableName}时失败。原因分析删除文件操作是单线程串行执行的，Hive分区数过多导致在元数

 帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hive
Hudi表分区设计规范 - MapReduce服务 MRS

Hudi表分区设计规范规则分区键不可以被更新： Hudi具有主键唯一性机制，但在分区表的场景下通常只能保证分区内主键唯一，因此如果分区键的值发生变更后，会导致相同主键的行记录出现多条的情况。在以日期分区的场景，可采用数据的创建时间为分区字段，切记不要采用数据更新时间做分区。当指

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Hudi数据表设计规范
ClickHouse分区设计 - MapReduce服务 MRS

ClickHouse分区设计合理设置分区键，控制分区数在一千以内，分区字段使用整型。分区part数与查询性能关系图1 分区part数与查询性能关系图分区建议建议使用toYYYYMMDD（pt_d）作为分区键，pt_d是date类型。如果业务场景需要做小时分区，使用pt_d、

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse宽表设计
向动态分区表中插入数据时，在重试的task中出现"Failed to CREATE - MapReduce服务 MRS

156 on 10.1.1.6 回答动态分区表插入数据的最后一步是读取shuffle文件的数据，再写入到表对应的分区文件中。当大面积shuffle文件损坏后，会引起大批量task失败，然后进行job重试。重试前Spark会将写表分区文件的句柄关闭，大批量task关闭句柄时HD

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > Spark Core
增加Kafka Topic分区 - MapReduce服务 MRS

增加Kafka Topic分区操作场景用户可以通过KafkaUI增加Kafka Topic分区。安全模式集群下，执行分区迁移操作的用户需属于“kafkaadmin”用户组，否则将会由于鉴权失败导致操作失败。非安全模式下，KafkaUI对任意操作不作鉴权处理。增加分区进入KafkaUI界面。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Kafka > 管理Kafka Topic

总条数： 4286

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置过滤掉分区表中路径不存在的分区 - MapReduce服务 MRS

配置过滤掉分区表中路径不存在的分区 - MapReduce服务 MRS

建立Hive表分区提升查询效率 - MapReduce服务 MRS

SparkSQL访问Hive分区表启动Job前耗时较长如何处理？ - MapReduce服务 MRS

Spark SQL无法查询到ORC类型的Hive表的新插入数据 - MapReduce服务 MRS

Spark SQL无法查询到ORC类型的Hive表的新插入数据 - MapReduce服务 MRS

Spark SQL无法查询到Parquet类型的Hive表的新插入数据 - MapReduce服务 MRS

有大量分区时执行drop partition操作失败 - MapReduce服务 MRS

使用CDM服务迁移MySQL数据至MRS Hive - MapReduce服务 MRS

Spark SQL无法查询到Parquet类型的Hive表的新插入数据 - MapReduce服务 MRS

建表语句分区列为timestamp时，使用非标准格式的时间指定分区查询表统计失败 - MapReduce服务 MRS

配置Hive表分区动态覆盖 - MapReduce服务 MRS

建立Hive表分区提升查询效率 - MapReduce服务 MRS

配置Hive表分区动态覆盖 - MapReduce服务 MRS

配置Hive表不同分区分别存储至OBS和HDFS - MapReduce服务 MRS

Hive分区数过多导致删除表失败 - MapReduce服务 MRS

Hudi表分区设计规范 - MapReduce服务 MRS

ClickHouse分区设计 - MapReduce服务 MRS

向动态分区表中插入数据时，在重试的task中出现"Failed to CREATE - MapReduce服务 MRS

增加Kafka Topic分区 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线