搜索_华为云

Hive分区修剪的谓词下推增强 - MapReduce服务 MRS

在旧版本中，对Hive表的分区修剪的谓词下推，只支持列名与整数或者字符串的比较表达式的下推，在2.3版本中，增加了对null、in、and、or表达式的下推支持。配置参数登录FusionInsight Manager系统，选择“集群 > 服务 > Spark2x > 配置”，单击“全部配置”，搜索以下参数。参数

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark运维管理
追加信息到HDFS指定文件 - MapReduce服务 MRS

追加信息到HDFS指定文件功能简介追加文件内容，是指在HDFS的某个指定文件后面，追加指定的内容。过程为：使用FileSystem实例的append方法获取追加写入的输出流。使用该输出流将待追加内容添加到HDFS的指定文件后面。在完成后，需关闭所申请资源。代码样例如下是代码片段，详细代码请参考com

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HDFS开发指南（普通模式） > 开发HDFS应用
Hive分区修剪的谓词下推增强 - MapReduce服务 MRS

在旧版本中，对Hive表的分区修剪的谓词下推，只支持列名与整数或者字符串的比较表达式的下推，在2.3版本中，增加了对null、in、and、or表达式的下推支持。配置参数登录FusionInsight Manager系统，选择“集群 > 待操作集群的名称 > 服务 > Spark2x > 配置”，单击“全部配置”，搜索以下参数。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark运维管理
Kafka应用开发简介 - MapReduce服务 MRS

Kafka应用开发简介 Kafka简介 Kafka是一个分布式的消息发布-订阅系统。它采用独特的设计提供了类似JMS的特性，主要用于处理活跃的流式数据。 Kafka有很多适用的场景：消息队列、行为跟踪、运维数据监控、日志收集、流处理、事件溯源、持久化日志等。 Kafka有如下几个特点：

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Kafka开发指南（普通模式）
Java样例代码 - MapReduce服务 MRS
Java样例代码 - MapReduce服务 MRS

int resultValue = hiveValue + Integer.valueOf(hbaseValue); // 设置结果到put对象 put.addColumn(Bytes.toBytes(columnFamily), Bytes.toBytes("cid")

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用 > 从Hive读取数据再写入HBase
CDL - MapReduce服务 MRS
CDL - MapReduce服务 MRS

ebalance的能力，创建任务时指定的task数量会在整个集群中的CDLConnector实例之间做均衡，保证每个实例上运行的task数量大致相同，如果某个CDLConnector实例异常或者节点宕机，该任务会在其它节点重新平衡task的数量。图1 Task的Rebalance示意图

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍
DELETE RECORDS from CARBON TABLE - MapReduce服务 MRS

TABLE 在其中执行删除操作的CarbonData表的名称。注意事项删除segment将删除相应segment的所有二级索引。如果查询的表设置了carbon.input.segments属性，则DELETE操作失败。要解决该问题，在查询前执行以下语句。语法： SET carbon

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData语法参考 > DML
Bitwise函数 - MapReduce服务 MRS
Bitwise函数 - MapReduce服务 MRS

Bitwise函数 bit_count(x, bits) → bigint 计算2的补码表示法中x中设置的位数（视为有符号位的整数）。 SELECT bit_count(9, 64); -- 2 SELECT bit_count(9, 8); -- 2 SELECT bit_count(-7

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
Repartition时有部分Partition没数据 - MapReduce服务 MRS

Repartition时有部分Partition没数据问题在repartition操作时，分块数“spark.sql.shuffle.partitions”设置为4500，repartition用到的key列中有超过4000个的不同key值。期望不同key对应的数据能分到不同的partition，

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > SQL和DataFrame
配置NameNode内存参数 - MapReduce服务 MRS

low：256M custom：根据实际数据量大小在GC_OPTS中设置内存大小。 custom GC_OPTS JVM用于gc的参数。仅当GC_PROFILE设置为custom时该配置才会生效。需确保GC_OPT参数设置正确，否则进程启动会失败。须知：请谨慎修改该项。如果配置不当，将造成服务不可用。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS
Spark从Hive读取数据再写入HBase样例程序（Java） - MapReduce服务 MRS

int resultValue = hiveValue + Integer.valueOf(hbaseValue); // 设置结果到put对象 put.addColumn(Bytes.toBytes(columnFamily), Bytes.toBytes("cid")

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark从Hive读取数据再写入HBase样例程序
配置NameNode内存参数 - MapReduce服务 MRS

low：256M custom：根据实际数据量大小在GC_OPTS中设置内存大小。 custom GC_OPTS JVM用于gc的参数。仅当GC_PROFILE设置为custom时该配置才会生效。需确保GC_OPT参数设置正确，否则进程启动会失败。须知：请谨慎修改该项。如果配置不当，将造成服务不可用。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS
配置Spark Executor堆内存参数 - MapReduce服务 MRS

当分配的内存太小或者被更高优先级的进程抢占资源时，会出现物理内存超限的情况。调整如下参数，可以防止物理内存超限。配置描述参数入口：在应用提交时通过“--conf”设置这些参数，或者在客户端的“spark-defaults.conf”配置文件中调整如下参数。表1 参数说明参数说明默认值 spark

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优
Hive是否支持向量化查询 - MapReduce服务 MRS

Hive是否支持向量化查询问题当设置向量化参数hive.vectorized.execution.enabled=true时，为什么执行hive on Tez/Mapreduce/Spark时会偶现一些空指针或类型转化异常？回答当前Hive不支持向量化执行。向量化执行有

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive常见问题
配置Spark Executor堆内存参数 - MapReduce服务 MRS

当分配的内存太小或者被更高优先级的进程抢占资源时，会出现物理内存超限的情况。调整如下参数，可以防止物理内存超限。配置描述参数入口：在应用提交时通过“--conf”设置这些参数，或者在客户端的“spark-defaults.conf”配置文件中调整如下参数。表1 参数说明参数说明默认值 spark

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
MapReduce基本原理 - MapReduce服务 MRS

MapReduce基本原理如需使用MapReduce，请确保MRS集群内已安装Hadoop服务。 MapReduce是Hadoop的核心，是Google提出的一个软件架构，用于大规模数据集（大于1TB）的并行运算。概念“Map（映射）”和“Reduce（化简）”及其主要思想，均取自于函数式编程语言及矢量编程语言。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > MapReduce
配置DBService HA模块的SSL - MapReduce服务 MRS

bservice-2.7.0/security”目录下的“root-ca.crt”和“root-ca.pem”相同。操作步骤以omm用户登录到需要配置SSL的DBService节点上。进入“$BIGDATA_HOME/FusionInsight_BASE_x.x.x/ins

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用DBService
调整HetuEngine INSERT写入优化 - MapReduce服务 MRS

果中分区列数量添加相关自定义配置，以获得最佳的性能效果。调整HetuEngine INSERT写入步骤使用HetuEngine管理员用户登录FusionInsight Manager页面，选择“集群 > 服务 > HetuEngine”，进入HetuEngine服务页面。选择“配置

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine性能调优
SparkSQL UDF功能的权限控制机制 - MapReduce服务 MRS

制是怎样的？回答目前已有的SQL语句无法满足用户场景时，用户可使用UDF功能进行自定义操作。为确保数据安全以及UDF中的恶意代码对系统造成破坏，SparkSQL的UDF功能只允许具备admin权限的用户注册，由admin用户保证自定义的函数的安全性。父主题： Spark应用开发常见问题

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > Spark应用开发常见问题
健康检查时，误将JDBCServer Kill - MapReduce服务 MRS

的session连接和健康检查命令执行，否则将导致无法建立健康检查的session连接或健康检查命令无法执行，从而认为Spark JDBCServer不健康而被Kill。即如果当前HiveServer2-Handler-Pool的线程池数为100，那么最多支持连接99个session。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > SQL和DataFrame

总条数： 5848

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hive分区修剪的谓词下推增强 - MapReduce服务 MRS

追加信息到HDFS指定文件 - MapReduce服务 MRS

Hive分区修剪的谓词下推增强 - MapReduce服务 MRS

Kafka应用开发简介 - MapReduce服务 MRS

Java样例代码 - MapReduce服务 MRS

CDL - MapReduce服务 MRS

DELETE RECORDS from CARBON TABLE - MapReduce服务 MRS

Bitwise函数 - MapReduce服务 MRS

Repartition时有部分Partition没数据 - MapReduce服务 MRS

配置NameNode内存参数 - MapReduce服务 MRS

Spark从Hive读取数据再写入HBase样例程序（Java） - MapReduce服务 MRS

配置NameNode内存参数 - MapReduce服务 MRS

配置Spark Executor堆内存参数 - MapReduce服务 MRS

Hive是否支持向量化查询 - MapReduce服务 MRS

配置Spark Executor堆内存参数 - MapReduce服务 MRS

MapReduce基本原理 - MapReduce服务 MRS

配置DBService HA模块的SSL - MapReduce服务 MRS

调整HetuEngine INSERT写入优化 - MapReduce服务 MRS

SparkSQL UDF功能的权限控制机制 - MapReduce服务 MRS

健康检查时，误将JDBCServer Kill - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线