搜索_华为云

建立Hive表分区提升查询效率 - MapReduce服务 MRS

建立Hive表分区提升查询效率操作场景 Hive在做Select查询时，一般会扫描整个表内容，会消耗较多时间去扫描不关注的数据。此时，可根据业务需求及其查询维度，建立合理的表分区，从而提高查询效率。操作步骤以root用户登录已安装Hive客户端的节点。执行以下命令，进入客户端安装目录

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive性能调优
提升HBase Put和Scan数据性能 - MapReduce服务 MRS

操作步骤登录FusionInsight Manager界面，选择“集群 > 服务 > HBase > 配置”，配置以下相关参数以提升HBase数据读写性能调优。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase性能调优
使用Hue提交Oozie Loader作业 - MapReduce服务 MRS

使用Hue提交Oozie Loader作业操作场景该任务指导用户通过Hue界面提交Loader类型的Oozie作业。操作步骤创建工作流，请参考使用Hue创建工作流。在工作流编辑页面，选择“Loader”按钮，将其拖到操作区中。在弹出的“Loader”窗口中配置“Job

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Oozie > 使用Hue提交Oozie作业
配置Oozie节点间用户互信 - MapReduce服务 MRS

配置Oozie节点间用户互信操作场景在使用Oozie节点通过SSH作业执行外部节点的Shell，需要单向免密互信时，可以参考此示例。前提条件已经安装Oozie，而且能与外部节点（SSH连接的节点）通信。操作步骤在外部节点上确保连接SSH时使用的用户存在，且该用户“~/.

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Oozie > 使用Hue提交Oozie作业
使用Hue提交Bundle批处理作业 - MapReduce服务 MRS

使用Hue提交Bundle批处理作业操作场景当同时存在多个定时任务的情况下，用户可以通过Bundle任务进行批量管理作业。该任务指导用户通过Hue界面提交批量类型的作业。前提条件提交Bundle批处理之前需要提前配置好相关的Workflow和Coordinator作业。操作步骤

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Oozie > 使用Hue提交Oozie作业
小文件优化 - MapReduce服务 MRS
小文件优化 - MapReduce服务 MRS

小文件优化操作场景 Spark SQL表中，经常会存在很多小文件（大小远小于HDFS的块大小），每个小文件默认对应Spark中的一个Partition，即一个Task。在有很多小文件时，Spark会启动很多Task，此时当SQL逻辑中存在Shuffle操作时，会大大增加hash分桶数

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
拼接转换 - MapReduce服务 MRS
拼接转换 - MapReduce服务 MRS

拼接转换概述 “拼接转换”算子，将已有字段的值通过连接符拼接，生成新的字段。输入与输出输入：需要拼接的字段输出：拼接后的字段参数说明表1 算子参数说明参数含义类型是否必填默认值输出字段名配置拼接后的字段名。 string 是无分隔符配置拼接符，可为空

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > Loader算子帮助 > Loader转换类算子
更新域 - MapReduce服务 MRS
更新域 - MapReduce服务 MRS

更新域概述 “更新域”算子，当满足某些条件时，更新字段的值。目前支持的类型有“BIGINT”、“DECIMAL”、“DOUBLE”、“FLOAT”、“INTEGER”、“SMALLINT”、“VARCHAR”。当类型为“VARCHAR”时，运算符为“+”时，表示在字符串后追加串

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > Loader算子帮助 > Loader转换类算子
Hive输出 - MapReduce服务 MRS
Hive输出 - MapReduce服务 MRS

Hive输出概述 “Hive输出”算子，用于配置已生成的字段输出到Hive表的列。输入与输出输入：需要输出的字段输出：Hive表参数说明表1 算子参数说明参数含义类型是否必填默认值 Hive文件存储格式配置Hive表文件的存储格式（目前支持四种格式：CSV、

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > Loader算子帮助 > Loader输出类算子
表输出 - MapReduce服务 MRS
表输出 - MapReduce服务 MRS

表输出概述 “表输出”算子，用于配置输出的字段对应到关系型数据库的指定列。输入与输出输入：需要输出的字段输出：关系型数据库表参数说明表1 算子参数说明参数含义类型是否必填默认值输出分隔符配置分隔符。说明：该配置仅用于MySQL专用连接器，当数据列内容中包含默认分隔符时

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > Loader算子帮助 > Loader输出类算子
文件输出 - MapReduce服务 MRS
文件输出 - MapReduce服务 MRS

文件输出概述 “文件输出”算子，用于配置已生成的字段通过分隔符连接并输出到文件。输入与输出输入：需要输出的字段输出：文件参数说明表1 算子参数说明参数含义类型是否必填默认值输出分隔符配置分隔符。 string 是无换行符用户根据数据实际情况，填写字符串作为换行符

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > Loader算子帮助 > Loader输出类算子
HBase输出 - MapReduce服务 MRS
HBase输出 - MapReduce服务 MRS

HBase输出概述 “HBase输出”算子，用于配置已生成的字段输出到HBase表的列。输入与输出输入：需要输出的字段输出：HBase表参数说明表1 算子参数说明参数含义类型是否必填默认值 HBase表类型配置HBase表类型，可选项为normal（普通HBase

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > Loader算子帮助 > Loader输出类算子
配置Flink任务并行度 - MapReduce服务 MRS

配置Flink任务并行度操作场景并行度控制任务的数量，影响操作后数据被切分成的块数。调整并行度让任务的数量和每个任务处理的数据与机器的处理能力达到更优。查看CPU使用情况和内存占用情况，当任务和数据不是平均分布在各节点，而是集中在个别节点时，可以增大并行度使任务和数据更均匀的分布在各个节点

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink性能调优
如何配置Flume定制脚本 - MapReduce服务 MRS

登录FusionInsight Manager，选择“集群 > 待操作集群的名称 > 服务 > Flume”进入Flume服务界面，在右上角选择“更多 > 下载客户端”，选择“选择客户端类型”为“完整客户端”，下载Flume服务客户端文件。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flume > Flume常见问题
提升HBase连续Put数据场景性能 - MapReduce服务 MRS

操作步骤参数入口：在FusionInsight Manager系统中，选择“集群 > 服务 > HBase > 配置”，单击“全部配置”。在搜索框中输入参数名称，并进行修改。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase性能调优
使用LZC压缩算法存储HDFS文件 - MapReduce服务 MRS

使用LZC压缩算法存储HDFS文件配置场景文件压缩可以减少储存文件的空间，并且提高数据从磁盘读取和网络传输的速度。HDFS有Gzip和Snappy这两种默认压缩格式。本章节为HDFS新增加的压缩格式LZC（Lempel-Ziv Compression）提供配置方法。这种压缩格式增强了

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS性能调优
通过客户端hadoop jar命令提交任务后返回“GC overhead”报错 - MapReduce服务 MRS

通过客户端hadoop jar命令提交任务后返回“GC overhead”报错问题背景与现象通过客户端提交任务，客户端返回内存溢出的报错结果：原因分析从报错堆栈可以看出是任务在提交过程中分片时在读取HDFS文件阶段内存溢出了，一般是由于该任务要读取的小文件很多导致内存不足。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Yarn
访问Manager页面报错“请求VPC错误” - MapReduce服务 MRS

授权后，用户就可以基于被授予的权限对云服务进行操作。在MRS管理控制台“现有集群” 列表，单击对应集群名称，进入集群信息页面。检查安全组中是否正确配置了本地IP。

帮助中心 > MapReduce服务 MRS > 故障排除 > Web页面访问类 > 登录集群Manager常见异常问题
启用集群间拷贝功能备份集群数据 - MapReduce服务 MRS

保存配置并在概览页面选择“更多 > 重启服务”，重启Yarn服务。界面提示“操作成功。”，单击“完成”，Yarn服务启动成功。登录另外一个集群，重复以上操作。父主题： HBase运维管理

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase运维管理
配置MapReduce任务日志归档和清理机制 - MapReduce服务 MRS

配置描述进入Mapreduce服务参数“全部配置”界面，具体操作请参考修改集群服务配置参数章节。在搜索框中输入参数名称，修改并保存配置。然后在Mapreduce服务“概览”页面选择“更多 > 同步配置”。同步完成后重启Mapreduce服务。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用MapReduce

总条数： 6685

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

建立Hive表分区提升查询效率 - MapReduce服务 MRS

提升HBase Put和Scan数据性能 - MapReduce服务 MRS

使用Hue提交Oozie Loader作业 - MapReduce服务 MRS

配置Oozie节点间用户互信 - MapReduce服务 MRS

使用Hue提交Bundle批处理作业 - MapReduce服务 MRS

小文件优化 - MapReduce服务 MRS

拼接转换 - MapReduce服务 MRS

更新域 - MapReduce服务 MRS

Hive输出 - MapReduce服务 MRS

表输出 - MapReduce服务 MRS

文件输出 - MapReduce服务 MRS

HBase输出 - MapReduce服务 MRS

配置Flink任务并行度 - MapReduce服务 MRS

如何配置Flume定制脚本 - MapReduce服务 MRS

提升HBase连续Put数据场景性能 - MapReduce服务 MRS

使用LZC压缩算法存储HDFS文件 - MapReduce服务 MRS

通过客户端hadoop jar命令提交任务后返回“GC overhead”报错 - MapReduce服务 MRS

访问Manager页面报错“请求VPC错误” - MapReduce服务 MRS

启用集群间拷贝功能备份集群数据 - MapReduce服务 MRS

配置MapReduce任务日志归档和清理机制 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线