搜索_华为云

Spark Core内存调优 - MapReduce服务 MRS

加任务的并行度，充分利用集群机器的计算能力，一般并行度设置为集群CPU总和的2-3倍。操作步骤并行度可以通过如下三种方式来设置，用户可以根据实际的内存、CPU、数据以及应用程序逻辑的情况调整并行度参数。在会产生shuffle的操作函数内设置并行度参数，优先级最高。 testRDD

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优
Spark Structured Streaming样例程序（Python） - MapReduce服务 MRS

urityKafkaWordCount。当Streaming DataFrame/Dataset中有新的可用数据时，outputMode用于配置写入Streaming接收器的数据。 #!/usr/bin/python # -*- coding: utf-8 -*- import

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Structured Streaming样例程序
Spark Structured Streaming样例程序（Python） - MapReduce服务 MRS

urityKafkaWordCount。当Streaming DataFrame/Dataset中有新的可用数据时，outputMode用于配置写入Streaming接收器的数据。 #!/usr/bin/python # -*- coding: utf-8 -*- import

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Structured Streaming样例程序
BulkLoad和Put应用场景有哪些 - MapReduce服务 MRS

因为启动MapReduce任务而占用更多的集群内存和CPU资源，也可能会生成大量很小的HFile文件频繁的触发Compaction，导致查询速度急剧下降。错误的使用put，会造成数据加载慢，当分配给RegionServer内存不足时会造成RegionServer内存溢出从而导致进程退出。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HBase开发指南（安全模式） > HBase应用开发常见问题
修改CarbonData表 - MapReduce服务 MRS

mn1') 在执行该命令后，新的导入会使用新的SORT_COLUMNS配置值。用户可以根据查询的情况来调整SORT_COLUMNS，但是不会直接影响旧的数据。所以对历史的segments的查询性能不会受到影响，因为历史的segments不是按照新的SORT_COLUMNS。不支持UNSET命令，但是可以使用set

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData数据分析
调测Hive Python样例程序 - MapReduce服务 MRS

py中的hosts数组中填写安装HiveServer的节点的业务平面IP。执行以下命令运行Python客户端： cd python-examples python pyCLI_nosec.py 在命令行终端查看样例代码中的HQL所查询出的结果。例如： [['default', '']] [{'comment':

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Hive开发指南（普通模式） > 调测Hive应用
Spark开源增强特性 - MapReduce服务 MRS

当前开源Spark在跨源查询时，只能对简单的filter进行下推，因此造成大量不必要的数据传输，影响SQL引擎性能。针对下推能力进行增强，当前对aggregate、复杂projection、复杂predicate均可以下推到数据源，尽量减少不必要数据的传输，提升查询性能。目前仅支持JDBC数据源的查询下推，支

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark
配置并导入Flink样例工程 - MapReduce服务 MRS

Files”页面，选中“lib”目录下的所有Jar包，然后单击“OK”。 Flink相关的依赖包：选择“lib”目录下的所有Jar包。或者可以根据不同样例工程，最小化选择其对应的Jar包。当样例代码使用其他MRS组件时，请去对应MRS组件的服务端安装目录查找并添加依赖包。图19

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Flink开发指南 > 准备Flink应用开发环境
如何对insert overwrite自读自写场景进行优化 - MapReduce服务 MRS

对于需要使用动态分区插入（使用历史分区更新）数据到目的表中，且和数据源表是同一张表时，由于直接在原表上执行insert overwrite可能会导致数据丢失或数据不一致的风险，建议先使用一个临时表来处理数据，再执行insert overwrite操作。操作步骤假设存在如下一张表： user_data(user_group

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive故障排除
Structured Streaming的cluster模式，在数据处理过程中终止ApplicationManager，应用失败 - MapReduce服务 MRS

cation”的值判定为false，但却配置了checkpoint目录。参数“recoverFromCheckpointLocation”的值为代码中“outputMode == OutputMode.Complete()”语句的判断结果（outputMode的默认输出方式为“append”）。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > Spark应用开发常见问题
Kudu应用开发常用概念 - MapReduce服务 MRS

server会定期向master发送心跳。 Kudu Kudu的管理工具，可以用来检查集群的健康状况、日常运维等操作。 keytab文件存放用户信息的密钥文件，应用程序采用此密钥文件在组件中进行API方式认证。 Schema 表信息，用来表示表中列的信息。父主题： Kudu应用开发概述

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Kudu开发指南（安全模式） > Kudu应用开发概述
Structured Streaming的cluster模式，在数据处理过程中终止ApplicationManager，应用失败 - MapReduce服务 MRS

cation”的值判定为false，但却配置了checkpoint目录。参数“recoverFromCheckpointLocation”的值为代码中“outputMode == OutputMode.Complete()”语句的判断结果（outputMode的默认输出方式为“append”）。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > Spark应用开发常见问题
TRUNCATE TABLE - MapReduce服务 MRS
TRUNCATE TABLE - MapReduce服务 MRS

) 描述从表或分区中移除所有行。用户可以通过partition_spec一次性删除分区表的多个分区，如果不指定就一次清除分区表的所有分区。当表属性“auto.purge”采用默认值“false”时，被删除的数据行将保存到文件系统的回收站，否则，当“auto.purge”设

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine DDL SQL语法说明
执行analyze table语句，因资源不足出现任务卡住 - MapReduce服务 MRS

statistics语句时，由于该sql语句会启动MapReduce任务。从YARN的ResourceManager Web UI页面看到，该任务由于资源不足导致任务没有被执行，表现出任务卡住的现象。图1 ResourceManager Web UI页面建议用户执行analyze table语句时加上noscan，其功能与analyze

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > SQL和DataFrame
如何处理Flink任务配置State Backend为RocksDB时报错GLIBC版本问题 - MapReduce服务 MRS

可能原因运行的系统和编译环境所在的系统版本不同，造成GLIBC的版本不兼容。定位思路使用strings /lib64/libpthread.so.0 | grep GLIBC命令查看GLIBC是否版本低于2.12。处理步骤如果GLIBC版本太低，则需要使用含有较高版本的（此处为2

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（安全模式） > Flink应用开发常见问题
BulkLoad和Put应用场景有哪些 - MapReduce服务 MRS

因为启动MapReduce任务而占用更多的集群内存和CPU资源，也可能会生成大量很小的HFile文件频繁的触发Compaction，导致查询速度急剧下降。错误的使用put，会造成数据加载慢，当分配给RegionServer内存不足时会造成RegionServer内存溢出从而导致进程退出。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HBase开发指南（普通模式） > HBase应用开发常见问题
数据恢复 - MapReduce服务 MRS
数据恢复 - MapReduce服务 MRS

<export_from> 其中，各参数的含义如下： $Sqoop_Home：目的集群上Sqoop的安装目录。 <ip>：目的集群上数据库的IP地址。 <table_name>：待恢复的表名称。 <passwd>：hive用户的密码。 <export_from>：元数据在目的集群的HDFS地址。命令

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移 > 数据迁移方案介绍
为什么提交Spark Streaming应用超过token有效期，应用失败 - MapReduce服务 MRS

Thread会根据token renew周期 * 0.75的时间比例上传更新后的Credential文件到HDFS上。 Executor进程中有1个Credential Refresh Thread会根据token renew周期 *0.8的时间比例去HDFS上获取更新后的Credential文件，用来刷

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > Spark Streaming
Structured Streaming的cluster模式，在数据处理过程中终止ApplicationManager，应用失败 - MapReduce服务 MRS

cation”的值判定为false，但却配置了checkpoint目录。参数“recoverFromCheckpointLocation”的值为代码中“outputMode == OutputMode.Complete()”语句的判断结果（outputMode的默认输出方式为“append”）。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > Spark应用开发常见问题
Kudu应用开发常用概念 - MapReduce服务 MRS

server会定期向master发送心跳。 kudu kudu的管理工具，可以用来检查集群的健康状况、日常运维等操作。 keytab文件存放用户信息的密钥文件，应用程序采用此密钥文件在组件中进行API方式认证。 Schema 表信息，用来表示表中列的信息。父主题： Kudu应用开发概述

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Kudu开发指南（普通模式） > Kudu应用开发概述

总条数： 5493

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark Core内存调优 - MapReduce服务 MRS

Spark Structured Streaming样例程序（Python） - MapReduce服务 MRS

Spark Structured Streaming样例程序（Python） - MapReduce服务 MRS

BulkLoad和Put应用场景有哪些 - MapReduce服务 MRS

修改CarbonData表 - MapReduce服务 MRS

调测Hive Python样例程序 - MapReduce服务 MRS

Spark开源增强特性 - MapReduce服务 MRS

配置并导入Flink样例工程 - MapReduce服务 MRS

如何对insert overwrite自读自写场景进行优化 - MapReduce服务 MRS

Structured Streaming的cluster模式，在数据处理过程中终止ApplicationManager，应用失败 - MapReduce服务 MRS

Kudu应用开发常用概念 - MapReduce服务 MRS

Structured Streaming的cluster模式，在数据处理过程中终止ApplicationManager，应用失败 - MapReduce服务 MRS

TRUNCATE TABLE - MapReduce服务 MRS

执行analyze table语句，因资源不足出现任务卡住 - MapReduce服务 MRS

如何处理Flink任务配置State Backend为RocksDB时报错GLIBC版本问题 - MapReduce服务 MRS

BulkLoad和Put应用场景有哪些 - MapReduce服务 MRS

数据恢复 - MapReduce服务 MRS

为什么提交Spark Streaming应用超过token有效期，应用失败 - MapReduce服务 MRS

Structured Streaming的cluster模式，在数据处理过程中终止ApplicationManager，应用失败 - MapReduce服务 MRS

Kudu应用开发常用概念 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线