搜索_华为云

HDFS客户端使用实践 - MapReduce服务 MRS

OutOfMemoryError”的错误。该问题是由于HDFS客户端运行时所需的内存超过了HDFS客户端设置的内存上限（默认为128MB）。可以通过修改“<客户端安装路径>/HDFS/component_env”中的“CLIENT_GC_OPTS”来修改HDFS客户端的内存上限。例如，需要设置该内存上限为1GB，则设置：

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS
HDFS HA方案介绍 - MapReduce服务 MRS

针对以上问题，HDFS高可用性方案通过自动或手动（可配置）的方式，在一个集群中为NameNode启动一个热替换的NameNode备份。当一台机器故障时，可以迅速地自动进行NameNode主备切换。或者当主NameNode节点需要进行维护时，通过MRS集群管理员控制，可以手动进行N

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > HDFS
Spark开源增强特性 - MapReduce服务 MRS

sum(a)>10 支持部分函数下推支持对abs()、month()、length()等数学、时间、字符串函数进行下推。并且，除了以上内置函数，用户还可以通过SET命令新增数据源支持的函数。例如：select sum(abs(a)) from table 支持aggregate之后的limit、order

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark
Driver返回码和RM WebUI上应用状态显示不一致 - MapReduce服务 MRS

er页面上标记此次Application为FAILED状态。这种情况为小概率事件且不影响Spark SQL对外展现的应用完成状态。也可以通过增大Yarn客户端连接次数和连接时长的方式减少此事件发生的概率。配置详情请参见： http://hadoop.apache.org/docs/r3

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > Spark Core
Spark2x无法访问Spark1.5创建的DataSource表 - MapReduce服务 MRS

与Spark1.5的存储方式一致，所以Spark2x可以直接读取Spark1.5创建的表，不存在上述问题。规避措施： Spark2x可以通过创建外表的方式来创建一张指向Spark1.5表实际数据的表，这样可以实现在Spark2x中读取Spark1.5创建的DataSource表。同时，Spark1

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > SQL和DataFrame
Hive应用开发流程 - MapReduce服务 MRS

elliJ IDEA工具，同时完成JDK、Maven等初始配置。准备本地应用开发环境准备连接集群配置文件应用程序开发或运行过程中，需通过集群相关配置文件信息连接MRS集群，配置文件通常包括集群组件信息文件，可从已创建好的MRS集群中获取相关内容。用于程序调测或运行的节点，

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Hive开发指南（普通模式） > Hive应用开发概述
Kudu应用开发常用概念 - MapReduce服务 MRS

server以及副本之间的关联关系。同一时间集群中只有一个acting master（leader master），如果leader master挂了，一个新的master会通过Raft算法选举出来。所有的master数据都存放在一个tablet中，这个tablet会被复制到所有的candidate master上；tablet

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Kudu开发指南（普通模式） > Kudu应用开发概述
Spark SQL样例程序（Java） - MapReduce服务 MRS

some.config.option", "some-value") .getOrCreate(); // 通过隐式转换，将RDD转换成DataFrame JavaRDD<FemaleInfo> femaleInfoJavaRDD =

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark SQL样例程序
缩容集群 - MapReduce服务 MRS
缩容集群 - MapReduce服务 MRS

1/{project_id}/cluster_infos/{cluster_id} {endpoint}信息具体请参考终端节点。 {project_id}信息请通过获取项目ID获取。 {cluster_id}信息即创建集群成功后返回结果中的“cluster_id” 或参考获取集群ID获取。 Body：

帮助中心 > MapReduce服务 MRS > API参考 > 应用示例
SparkSQL访问Hive分区表启动Job前耗时较长如何处理？ - MapReduce服务 MRS

动执行Analyze Table（默认开启的设置方法为spark.sql.statistics.fallBackToHdfs=true，可通过配置为false关闭）。开启后，SQL执行过程中会扫描表的分区统计信息，并作为执行计划中的代价估算，例如对于代价评估中识别的小表，会广播小

 帮助中心 > MapReduce服务 MRS > 常见问题 > 作业管理类
REGISTER INDEX TABLE - MapReduce服务 MRS

productdb2.productSalesTable where c = 'aaa'; //可以发现该查询命令使用了索引表系统响应通过运行该命令，索引表会被注册到主表。父主题： CarbonData语法参考

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData语法参考
使用Hive CBO功能优化查询效率 - MapReduce服务 MRS

使用Hive CBO功能优化查询效率操作场景在Hive中执行多表Join时，Hive支持开启CBO（Cost Based Optimization），系统会自动根据表的统计信息，例如数据量、文件数等，选出合适计划提高多表Join的效率。Hive需要先收集表的统计信息后才能使CBO正确的优化。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive性能调优
MapReduce应用开发流程介绍 - MapReduce服务 MRS

编译并运行程序指导用户将开发好的程序编译并提交运行。调测MapReduce应用查看程序运行结果程序运行结果会写在用户指定的路径下。用户还可以通过UI查看应用运行情况。调测MapReduce应用父主题： MapReduce开发指南（普通模式）

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > MapReduce开发指南（普通模式）
HBase应用开发流程介绍 - MapReduce服务 MRS

编译并运行程序指导用户将开发好的程序编译并提交运行。调测HBase应用查看程序运行结果程序运行结果会写在用户指定的路径下。用户还可以通过UI查看应用运行情况。父主题： HBase开发指南（安全模式）

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HBase开发指南（安全模式）
Hive Group By语句优化 - MapReduce服务 MRS

distinct完成去重计数时，处理值为空的情况会使Reduce产生很严重的数据倾斜，可以将空值单独处理，如果是计算count distinct，可以通过where子句将该值排除掉，并在最后的count distinct结果中加1。如果还有其他计算，可以先将值为空的记录单独处理，再和其他计算结果合并。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive性能调优
REGISTER INDEX TABLE - MapReduce服务 MRS

productdb2.productSalesTable where c = 'aaa'; //可以发现该查询命令使用了索引表系统响应通过运行该命令，索引表会被注册到主表。父主题： DDL

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData语法参考 > DDL
管理Storm拓扑 - MapReduce服务 MRS
管理Storm拓扑 - MapReduce服务 MRS

操作步骤访问Storm的WebUI，请参考访问Storm的WebUI。在“Topology summary”区域，单击指定的拓扑名称。通过“Topology actions”管理Storm拓扑。激活拓扑单击“Activate”，转化当前拓扑为激活状态。去激活拓扑单击“

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Storm
在Beeline/JDBCServer模式下连续运行10T的TPCDS测试套会出现内存不足的现象 - MapReduce服务 MRS

retainedJobs”和“spark.ui.retainedStages”参数。详细信息请参考常用参数中的表13。如果需要保留的Job和Stage的UI数据个数较多，可通过配置“spark.driver.memory”参数，适当增大Driver的内存。详细信息请参考常用参数中的表10。父主题： SQL和DataFrame

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > SQL和DataFrame
Spark SQL样例程序（Java） - MapReduce服务 MRS

some.config.option", "some-value") .getOrCreate(); // 通过隐式转换，将RDD转换成DataFrame JavaRDD<FemaleInfo> femaleInfoJavaRDD =

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark SQL样例程序
install编译构建HBase Jar包失败报错Could not transfer artifact如何处理 - MapReduce服务 MRS

arch64时值为“1.0.0-hw-aarch64”，os为x86_64时值为“1.0.0”。编译环境因为一些配置原因导致maven未能通过os正确解析该变量时，可采用手动修改pom.xml方式进行规避正确编译。在pom.xml中手动修改直接或间接依赖hbase-common

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HBase开发指南（安全模式） > HBase应用开发常见问题

总条数： 3859

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

HDFS客户端使用实践 - MapReduce服务 MRS

HDFS HA方案介绍 - MapReduce服务 MRS

Spark开源增强特性 - MapReduce服务 MRS

Driver返回码和RM WebUI上应用状态显示不一致 - MapReduce服务 MRS

Spark2x无法访问Spark1.5创建的DataSource表 - MapReduce服务 MRS

Hive应用开发流程 - MapReduce服务 MRS

Kudu应用开发常用概念 - MapReduce服务 MRS

Spark SQL样例程序（Java） - MapReduce服务 MRS

缩容集群 - MapReduce服务 MRS

SparkSQL访问Hive分区表启动Job前耗时较长如何处理？ - MapReduce服务 MRS

REGISTER INDEX TABLE - MapReduce服务 MRS

使用Hive CBO功能优化查询效率 - MapReduce服务 MRS

MapReduce应用开发流程介绍 - MapReduce服务 MRS

HBase应用开发流程介绍 - MapReduce服务 MRS

Hive Group By语句优化 - MapReduce服务 MRS

REGISTER INDEX TABLE - MapReduce服务 MRS

管理Storm拓扑 - MapReduce服务 MRS

在Beeline/JDBCServer模式下连续运行10T的TPCDS测试套会出现内存不足的现象 - MapReduce服务 MRS

Spark SQL样例程序（Java） - MapReduce服务 MRS

install编译构建HBase Jar包失败报错Could not transfer artifact如何处理 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线