搜索_华为云

ZooKeeper上数据错乱导致ClickHouse启动失败问题 - MapReduce服务 MRS

如果存在多磁盘的场景，需要对data1到dataN的磁盘数据都执行相同的备份操作。备份元数据信息： cd /srv/BigData/data1/clickhouse_path/metadata/库名 mv 表名.sql 备份目录例如，下面是备份default数据库下的表lineo

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用ClickHouse
导入并配置HetuEngine Python3样例工程 - MapReduce服务 MRS

/#files。将下载的setuptools压缩文件复制到客户端机器上，解压后进入setuptools项目目录，在客户端机器的命令行终端执行python3 setup.py install。以47.3.1版本为例，如下内容表示安装setuptools的47.3.1版本成功。 Finished

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HetuEngine开发指南（安全模式） > 准备HetuEngine应用开发环境
安装补丁前准备 - MapReduce服务 MRS

检查集群是否有非标修改组件配置的操作询问客户是否有做过相关操作。查看该客户档案，是否有记录相关非标操作。是，需要详细评估补丁跟非标配置的兼容性。否，检查结束。检查集群是否有安装紧急补丁登录客户集群的主备节点，进入“/home/omm”目录。查看是否存在紧急补丁的目录，例如MRSxxx或者xxxpatch。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群补丁说明 > MRS 3.1.0.0.16补丁说明
使用Spark BulkLoad工具同步数据到HBase表中 - MapReduce服务 MRS

前提条件集群安装了Spark及Hive服务。执行数据导入的用户需要同时具有Spark（对应源表的SELECT权限）、HBase权限（对应HBase NameSpace的RWXA权限）和HDFS权限（对应HFile输出目录的读写权限）。如果集群已启用Kerberos认证（安全模式

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase企业级能力增强
HMaster日志中频繁打印出FileNotFoundException信息 - MapReduce服务 MRS

在splitWAL的过程中，参数“hbase.splitlog.manager.timeout”控制splitWAL的超时时间，如果该时间内splitWAL无法完成，则会再次提交相同的任务，在一定时间内多次提交了相同的任务，当其中某次任务执行完毕时会删除这个temp文件，所以在后来的任务执行

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase故障排除
HMaster日志中频繁打印出FileNotFoundException信息 - MapReduce服务 MRS

在splitWAL的过程中，参数“hbase.splitlog.manager.timeout”控制splitWAL的超时时间，若该时间内splitWAL无法完成，则会再次提交相同的任务，在一定时间内多次提交了相同的任务，当其中某次任务执行完毕时会删除这个temp文件，所以在后来的任务执行

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase故障排除
Spark REST API接口介绍 - MapReduce服务 MRS

Spark REST API接口介绍功能简介 Spark的REST API以JSON格式展现Web UI的一些指标，提供用户一种更简单的方法去创建新的展示和监控的工具，并且支持查询正在运行的app和已经结束的app的相关信息。开源的Spark REST接口支持对Jobs、Stages

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark接口介绍
配置列统计值直方图Histogram用以增强CBO准确度 - MapReduce服务 MRS

Spark优化sql的执行，一般的优化规则都是启发式的优化规则，启发式的优化规则，仅仅根据逻辑计划本身的特点给出优化，没有考虑数据本身的特点，也就是未考虑算子本身的执行代价。Spark在2.2中引入了基于代价的优化规则（CBO）。CBO会收集表和列的统计信息，结合算子的输入数据集来估计

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark运维管理
配置列统计值直方图Histogram用以增强CBO准确度 - MapReduce服务 MRS

Spark优化sql的执行，一般的优化规则都是启发式的优化规则，启发式的优化规则，仅仅根据逻辑计划本身的特点给出优化，没有考虑数据本身的特点，也就是未考虑算子本身的执行代价。Spark在2.2中引入了基于代价的优化规则（CBO）。CBO会收集表和列的统计信息，结合算子的输入数据集来估计

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark运维管理
Spark客户端使用实践 - MapReduce服务 MRS

Core为Spark的内核模块，主要负责任务的执行，用于编写Spark应用程序；Spark SQL为执行SQL的模块。场景说明假定用户有某个周末网民网购停留时间的日志文本，基于某些业务要求，要求开发Spark应用程序实现如下要求：统计日志文件中本周末网购停留总时间超过2个小时的女性网民信息。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x
Spark客户端使用实践 - MapReduce服务 MRS

Core为Spark的内核模块，主要负责任务的执行，用于编写spark应用程序；Spark SQL为执行SQL的模块。场景说明假定用户有某个周末网民网购停留时间的日志文本，基于某些业务要求，要求开发Spark应用程序实现如下要求：统计日志文件中本周末网购停留总时间超过2个小时的女性网民信息。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本）
配置Spark Native引擎 - MapReduce服务 MRS

Native引擎是通过使用向量化的C++加速库，实现对Spark算子性能加速的一种技术方案。传统的SparkSQL是基于行式数据，通过JVM的codegen来实现查询加速的，由于JVM对生成的java代码存在各种约束，比如方法长度，参数个数等，以及行式数据对内存带宽的利用率不足，因此存在性

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强
使用Oozie调度Spark访问HBase以及Hive - MapReduce服务 MRS

Oozie的share HDFS的“/user/oozie/share/lib/spark2x”目录说明：请使用Oozie用户上传文件，执行su - oozie切换到Oozie用户上传结束后再重启oozie服务。将待使用样例工程的项目打包成jar包 jar包 HDFS的“/u

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Oozie开发指南（普通模式） > 开发Oozie应用
使用Oozie调度Spark2x访问HBase以及Hive - MapReduce服务 MRS

） jar包 Oozie的share HDFS的“/user/oozie/share/lib/spark2x”目录说明：请执行su - oozie切换到oozie用户，使用oozie用户上传文件。上传结束后再重启Oozie服务。将待使用样例工程的项目打包成jar包 jar包

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Oozie开发指南（普通模式） > 开发Oozie应用
配置HBase数据压缩格式和编码 - MapReduce服务 MRS

如果集群开启了Kerberos认证，操作的用户还需要具备对应的操作权限。即创建表时需要具备对应的namespace或更高级别的创建（C）或者管理（A）权限，修改表时需要具备已创建的表或者更高级别的创建（C）或者管理（A）权限。具体的授权操作请参考创建HBase权限角色章节。配置HBase数据压缩格式和编码

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase数据操作
配置HBase数据压缩格式和编码 - MapReduce服务 MRS

如果集群开启了Kerberos认证，操作的用户还需要具备对应的操作权限。即创建表时需要具备对应的namespace或更高级别的创建（C）或者管理（A）权限，修改表时需要具备已创建的表或者更高级别的创建（C）或者管理（A）权限。具体的授权操作请参考创建HBase权限角色章节。配置HBase数据压缩格式和编码

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase数据操作
批量升级MRS集群客户端 - MapReduce服务 MRS

升级命令（-u）可以多次执行，每次执行只升级前面升级失败的客户端，跳过升级成功的客户端。客户端批量升级工具也支持升级之前的旧客户端。执行非root用户安装的客户端升级时，请确保相应用户在目标节点客户端所在目录及父目录的读写权限，否则会升级失败。 -f参数输入的客户端包必须为全量客户端，不支持单组件或部分组件客户端包作为输入。

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群客户端
HDFS文件系统目录简介 - MapReduce服务 MRS

HDFS是Hadoop的分布式文件系统（Hadoop Distributed File System），实现大规模数据可靠的分布式读写。HDFS针对的使用场景是数据读写具有“一次写，多次读”的特征，而数据“写”操作是顺序写，也就是在文件创建时的写入或者在现有文件之后的添加操作。HDFS

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS
MRS 3.1.2-LTS补丁说明 - MapReduce服务 MRS

r/filecache/”下的log4j旧版本的包，需要重新提交相关的yarn作业，才会加载新的log4j的包。 MRS 3.1.2-LTS版本的补丁安装过程中会自动重启OMS，安装过程中将影响作业提交以及集群扩缩容等管控面集群控制功能，请选择适当的时间进行补丁安装。 MRS 3

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群补丁说明
MRS各组件样例工程汇总 - MapReduce服务 MRS

样例工程获取地址参见获取MRS应用开发样例工程，切换分支为与MRS集群相匹配的版本分支，然后下载压缩包到本地后解压，即可获取各组件对应的样例代码工程。 MRS样例代码库提供了各组件的基本功能样例工程供用户使用，当前版本各组件提供的样例工程汇总参见表1。表1 各组件样例工程汇总组件样例工程位置

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x）

总条数： 3503

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ZooKeeper上数据错乱导致ClickHouse启动失败问题 - MapReduce服务 MRS

导入并配置HetuEngine Python3样例工程 - MapReduce服务 MRS

安装补丁前准备 - MapReduce服务 MRS

使用Spark BulkLoad工具同步数据到HBase表中 - MapReduce服务 MRS

HMaster日志中频繁打印出FileNotFoundException信息 - MapReduce服务 MRS

HMaster日志中频繁打印出FileNotFoundException信息 - MapReduce服务 MRS

Spark REST API接口介绍 - MapReduce服务 MRS

配置列统计值直方图Histogram用以增强CBO准确度 - MapReduce服务 MRS

配置列统计值直方图Histogram用以增强CBO准确度 - MapReduce服务 MRS

Spark客户端使用实践 - MapReduce服务 MRS

Spark客户端使用实践 - MapReduce服务 MRS

配置Spark Native引擎 - MapReduce服务 MRS

使用Oozie调度Spark访问HBase以及Hive - MapReduce服务 MRS

使用Oozie调度Spark2x访问HBase以及Hive - MapReduce服务 MRS

配置HBase数据压缩格式和编码 - MapReduce服务 MRS

配置HBase数据压缩格式和编码 - MapReduce服务 MRS

批量升级MRS集群客户端 - MapReduce服务 MRS

HDFS文件系统目录简介 - MapReduce服务 MRS

MRS 3.1.2-LTS补丁说明 - MapReduce服务 MRS

MRS各组件样例工程汇总 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线