搜索_华为云

修复Kafka - MapReduce服务 MRS
修复Kafka - MapReduce服务 MRS

-Dfastjson.parser.safeMode=true”（注意与前参数有空格），如下所示：例如原参数值为：“-Xmx4G -Xms4G”，则修改后的参数值为：“-Xmx4G -Xms4G -Dfastjson.parser.safeMode=true”。单击“保存”，配置保存完成后。在

 帮助中心 > MapReduce服务 MRS > 服务公告 > 漏洞公告 > MRS Fastjson漏洞修复指导
Spark SQL ROLLUP和CUBE使用的注意事项 - MapReduce服务 MRS

2 2 1 1 1 1 2 2 对于以上结果的第一条为什么是(NULL,0)而不是(NULL,4)。回答在进行rollup和cube操作时，用户通常是基于维度进行分析，需要的是度量的结果，因此不会对维度进行聚合操作。例如当前有表src(d1, d2,

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > SQL和DataFrame
向动态分区表中插入数据时，在重试的task中出现"Failed to CREATE - MapReduce服务 MRS

on 10.1.1.6 回答动态分区表插入数据的最后一步是读取shuffle文件的数据，再写入到表对应的分区文件中。当大面积shuffle文件损坏后，会引起大批量task失败，然后进行job重试。重试前Spark会将写表分区文件的句柄关闭，大批量task关闭句柄时HDFS无法及

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > Spark Core
为什么有时访问没有权限的parquet表时，在上报“Missing Privileges”错误提示之前，会运行一个Job？ - MapReduce服务 MRS

SQL对用户SQL语句的执行逻辑是：首先解析出语句中包含的表，再获取表的元数据信息，然后对权限进行检查。当表是parquet表时，元数据信息包括文件的Split信息。Split信息需要调用HDFS的接口去读取，当表包含的文件数量很多时，串行读取Split信息变得缓慢，影响性能。故对此做

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > SQL和DataFrame
Hive分区修剪的谓词下推增强 - MapReduce服务 MRS

Hive分区修剪的谓词下推增强配置场景在旧版本中，对Hive表的分区修剪的谓词下推，只支持列名与整数或者字符串的比较表达式的下推，在2.3版本中，增加了对null、in、and、or表达式的下推支持。配置参数登录FusionInsight Manager系统，选择“集群 >

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark运维管理
如何在Flume配置文件中使用环境变量 - MapReduce服务 MRS

点。切换到以下目录。 cd Flume客户端安装目录/fusioninsight-flume-Flume组件版本号/conf 在该目录下的“flume-env.sh”文件中添加环境变量。格式： export 变量名=变量值示例： JAVA_OPTS="-Xms2G -Xmx4G

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume > Flume常见问题
配置parquet表的压缩格式 - MapReduce服务 MRS

配置parquet表的压缩格式配置场景当前版本对于parquet表的压缩格式分以下两种情况进行配置：对于分区表，需要通过parquet本身的配置项“parquet.compression”设置parquet表的数据压缩格式。如在建表语句中设置tblproperties："parquet

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强
增强有限内存下的稳定性 - MapReduce服务 MRS

总量几倍的数据时，通过利用磁盘来做辅助从而确保查询依然稳定执行，但依然有一些数据是必须留在内存的，如在做涉及到Join的查询时，对于当前用于Join的相同key的数据还是需要放在内存中，如果该数据量较大而内存较小依然会出现OutOfMemoryError。有限内存下的稳定性涉及到3个子功能：

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark运维管理
CarbonData常见配置参数 - MapReduce服务 MRS

该配置指定了表上并发操作过程中所要求的锁的类型。有以下几种类型锁实现方式： LOCALLOCK：基于本地文件系统的文件来创建的锁。该锁只适用于一台机器上只运行一个Spark Driver（或者JDBCServer）的情况。 HDFSLOCK：基于HDFS文件系统上的文件来创建的锁。该锁适用于集群

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本）
HBase基本原理 - MapReduce服务 MRS
HBase基本原理 - MapReduce服务 MRS

定义Column的数量和类型。HBase中表的列非常稀疏，不同行的列的个数和类型都可以不同。此外，每个CF都有独立的生存周期（TTL）。可以只对行上锁，对行的操作始终是原始的。 Column 与传统的数据库类似，HBase的表中也有列的概念，列用于表示相同类型的数据。 RegionServer数据存储

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > HBase
获取运行中Spark应用的Container日志 - MapReduce服务 MRS

获取运行中Spark应用的Container日志运行中Spark应用的Container日志分散在多个节点中，本章节用于说明如何快速获取Container日志。场景说明可以通过yarn logs命令获取运行在Yarn上的应用的日志，针对不同的场景，可以使用以下命令获取需要的日志：获取

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark运维管理
优化数据倾斜场景下的Spark SQL性能 - MapReduce服务 MRS

数据量少的Task在运行完成后，导致很多CPU空闲，造成CPU资源浪费。通过如下配置项可开启自动进行数据倾斜处理功能，通过将Hash分桶后数据量很大的、且超过数据倾斜阈值的分桶拆散，变成多个task处理一个桶的数据机制，提高CPU资源利用率，提高系统性能。未产生倾斜的数据，将采用原有方式进行分桶并运行。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
优化小文件场景下的Spark SQL性能 - MapReduce服务 MRS

在小文件场景下，您可以通过如下配置手动指定每个Task的数据量（Split Size），确保不会产生过多的Task，提高性能。当SQL逻辑中不包含Shuffle操作时，设置此配置项，不会有明显的性能提升。配置描述要启动小文件优化，在Spark客户端的“spark-defaults.conf”配置文件中进行设置。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
配置parquet表的压缩格式 - MapReduce服务 MRS

配置parquet表的压缩格式配置场景当前版本对于parquet表的压缩格式分以下两种情况进行配置：对于分区表，需要通过parquet本身的配置项“parquet.compression”设置parquet表的数据压缩格式。如在建表语句中设置tblproperties："parquet

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core企业级能力增强
增强有限内存下的稳定性 - MapReduce服务 MRS

总量几倍的数据时，通过利用磁盘来做辅助从而确保查询依然稳定执行，但依然有一些数据是必须留在内存的，如在做涉及到Join的查询时，对于当前用于Join的相同key的数据还是需要放在内存中，如果该数据量较大而内存较小依然会出现OutOfMemoryError。有限内存下的稳定性涉及到3个子功能：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark运维管理
HBase Region的多点分割 - MapReduce服务 MRS

~Z”分为四个Region。代码样例以下代码片段在com.huawei.bigdata.hbase.examples包的“HBaseExample”类的testMultiSplit方法中。 public void testMultiSplit() { LOG.info("Entering

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > HBase开发指南 > 开发HBase应用
通过JDBC访问Spark SQL的程序 - MapReduce服务 MRS

通过JDBC访问Spark SQL的程序场景说明 Java样例代码 Scala样例代码 Python样例代码父主题：开发Spark应用

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用
Java样例代码 - MapReduce服务 MRS
Java样例代码 - MapReduce服务 MRS

child"); executeSql(url, sqlList); 样例工程中的data文件需要放到HDFS上的home目录下保证data文件和创建的表的所属的用户和用户组保持一致拼接JDBC URL。 HA模式下url的host和port必须为“ha-cluster”。普通集群需要将样例代码中com

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用 > 通过JDBC访问Spark SQL的程序
配置Spark表、列和数据库的用户权限 - MapReduce服务 MRS

据库授权三个场景下的操作。操作步骤 SparkSQL表授权、列授权、数据库授权与Hive的操作相同，详情请参见Hive用户权限管理。在权限管理中，为了方便用户使用，授予数据库下表的任意权限将自动关联该数据库目录的HDFS权限。为了避免产生性能问题，取消表的任意权限，系统不会自

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark用户权限管理
场景说明 - MapReduce服务 MRS
场景说明 - MapReduce服务 MRS

用户自定义JDBCServer的客户端，使用JDBC连接来进行数据表的创建、数据加载、查询和删除。数据规划确保以HA模式启动了JDBCServer服务，并至少有一个实例对外服务。在hdfs上创建"/home/data"目录，新增包含如下内容的文件并上传到hdfs的"/home/data"目录下。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用 > 通过JDBC访问Spark SQL的程序

总条数： 3154

上一页
1
...
11
12
13
...
158
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

修复Kafka - MapReduce服务 MRS

Spark SQL ROLLUP和CUBE使用的注意事项 - MapReduce服务 MRS

向动态分区表中插入数据时，在重试的task中出现"Failed to CREATE - MapReduce服务 MRS

为什么有时访问没有权限的parquet表时，在上报“Missing Privileges”错误提示之前，会运行一个Job？ - MapReduce服务 MRS

Hive分区修剪的谓词下推增强 - MapReduce服务 MRS

如何在Flume配置文件中使用环境变量 - MapReduce服务 MRS

配置parquet表的压缩格式 - MapReduce服务 MRS

增强有限内存下的稳定性 - MapReduce服务 MRS

CarbonData常见配置参数 - MapReduce服务 MRS

HBase基本原理 - MapReduce服务 MRS

获取运行中Spark应用的Container日志 - MapReduce服务 MRS

优化数据倾斜场景下的Spark SQL性能 - MapReduce服务 MRS

优化小文件场景下的Spark SQL性能 - MapReduce服务 MRS

配置parquet表的压缩格式 - MapReduce服务 MRS

增强有限内存下的稳定性 - MapReduce服务 MRS

HBase Region的多点分割 - MapReduce服务 MRS

通过JDBC访问Spark SQL的程序 - MapReduce服务 MRS

Java样例代码 - MapReduce服务 MRS

配置Spark表、列和数据库的用户权限 - MapReduce服务 MRS

场景说明 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线