搜索_华为云

使用Hue WebUI典型场景 - MapReduce服务 MRS

使用Hue WebUI典型场景 HDFS on Hue 配置HDFS冷热数据迁移 Hive on Hue Oozie on Hue 父主题：使用Hue（MRS 3.x及之后版本）

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hue（MRS 3.x及之后版本）
使用Hudi - MapReduce服务 MRS
使用Hudi - MapReduce服务 MRS

使用Hudi Hudi表概述使用Spark Shell创建Hudi表使用spark-sql操作Hudi表使用Hudi-Cli.sh操作Hudi表 Hudi写操作 Hudi读操作 Hudi数据管理维护 Hudi SQL语法参考 Hudi Schema演进配置Hudi数据列默认值

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版）
配置HDFS冷热数据迁移 - MapReduce服务 MRS

对于在<file>标签下的文件/文件夹使用FileSystem#globStatus API，对于其他的使用GlobPattern类（被GlobFilter使用）。参照支持的API的细节。例如，对于globStatus，“/opt/hadoop/*”将匹配“/opt/hadoop”文件夹下的一切。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hue（MRS 3.x及之后版本） > 使用Hue WebUI典型场景
如何对insert overwrite自读自写场景进行优化 - MapReduce服务 MRS

如何对insert overwrite自读自写场景进行优化场景说明对于需要使用动态分区插入（使用历史分区更新）数据到目的表中，且和数据源表是同一张表时，由于直接在原表上执行insert overwrite可能会导致数据丢失或数据不一致的风险，建议先使用一个临时表来处理数据，再执行insert

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive故障排除
使用CDM服务迁移Hive数据至MRS集群 - MapReduce服务 MRS

使用CDM服务迁移Hive数据至MRS集群应用场景本章节适用于将线下IDC机房或者公有云Hive集群中的数据（支持数据量在几十TB级别或以下的数据量级）迁移到华为云MRS服务。使用华为云CDM服务“场景迁移功能”可以一键式便捷地完成Hive数据的迁移。本章节以通过华为云CDM服务

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
多副本场景下，运行在副本丢失损坏的BE节点的查询任务报错 - MapReduce服务 MRS

多副本场景下，运行在副本丢失损坏的BE节点的查询任务报错现象描述如果多个副本直接从磁盘上丢失了副本，比如mv改名，内核不会感知到该副本丢失，执行查询时如果请求运行在副本丢失的BE节点，报错：处理步骤登录安装了MySQL的节点，连接Doris数据库。调用BE的check_

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Doris > Doirs故障排除
如何对insert overwrite自读自写场景进行优化 - MapReduce服务 MRS

如何对insert overwrite自读自写场景进行优化场景说明对于需要使用动态分区插入（使用历史分区更新）数据到目的表中，且和数据源表是同一张表时，由于直接在原表上执行insert overwrite可能会导致数据丢失或数据不一致的风险，建议先使用一个临时表来处理数据，再执行insert

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive故障排除
提升HBase连续Put数据场景性能 - MapReduce服务 MRS

提升HBase连续Put数据场景性能操作场景对大批量、连续put的场景，配置下面的两个参数为“false”时能大量提升性能。 “hbase.regionserver.wal.durable.sync” “hbase.regionserver.hfile.durable.sync”

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase性能调优
提升HBase连续Put数据场景性能 - MapReduce服务 MRS

概率数据丢失的现象。对数据可靠性要求高的场景请慎重配置。操作步骤参数入口：在FusionInsight Manager系统中，选择“集群 > 服务 > HBase > 配置”，单击“全部配置”。在搜索框中输入参数名称，并进行修改。表1 提升连续Put场景性能的参数参数描述

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase性能调优
HDFS on Hue - MapReduce服务 MRS
HDFS on Hue - MapReduce服务 MRS

Hue提供了文件浏览器功能，使用户可以通过界面图形化的方式使用HDFS。 Hue界面主要用于文件、表等数据的查看与分析，禁止通过Hue界面对操作对象进行删除等高危管理操作。如需操作，建议在确认对业务没有影响后通过各组件的相应操作方法进行处理，例如使用HDFS客户端对HDFS文件进行操作，使用Hive客户端对Hive表进行操作。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hue（MRS 3.x及之后版本） > 使用Hue WebUI典型场景
优化数据倾斜场景下的Spark SQL性能 - MapReduce服务 MRS

优化数据倾斜场景下的Spark SQL性能配置场景在Spark SQL多表Join的场景下，会存在关联键严重倾斜的情况，导致Hash分桶后，部分桶中的数据远高于其它分桶。最终导致部分Task过重，跑得很慢；其它Task过轻，跑得很快。一方面，数据量大Task运行慢，使得计算性

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
使用Storm - MapReduce服务 MRS
使用Storm - MapReduce服务 MRS

使用Storm 从零开始使用Storm 使用Storm客户端使用客户端提交Storm拓扑访问Storm的WebUI 管理Storm拓扑查看Storm拓扑日志 Storm常用参数配置Storm业务用户密码策略迁移Storm业务至Flink Storm日志介绍性能调优

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版）
使用HBase BulkLoad导入数据成功，执行相同的查询时却返回不同的结果 - MapReduce服务 MRS

使用HBase BulkLoad导入数据成功，执行相同的查询时却返回不同的结果问题在使用HBase bulkload导入数据时，如果导入的数据存在相同的rowkey值，数据可以导入成功，但是执行相同的查询时可能返回不同的结果。回答正常情况下，相同rowkey值的数据加载到

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase故障排除
使用Python远程连接HDFS的端口失败 - MapReduce服务 MRS

使用Python远程连接HDFS的端口失败用户问题使用Python远程连接HDFS的端口失败，如何解决？问题现象用户使用Python远程连接HDFS的50070端口失败。原因分析 HDFS开源3.0.0以下版本的默认端口为50070，3.0.0及以上的默认端口为9870

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HDFS
优化数据倾斜场景下的Spark SQL性能 - MapReduce服务 MRS

优化数据倾斜场景下的Spark SQL性能配置场景在Spark SQL多表Join的场景下，会存在关联键严重倾斜的情况，导致Hash分桶后，部分桶中的数据远高于其他分桶。最终导致部分Task过重，运行很慢；其他Task过轻，运行很快。一方面，数据量大Task运行慢，使得计算性

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
优化小文件场景下的Spark SQL性能 - MapReduce服务 MRS

优化小文件场景下的Spark SQL性能配置场景 Spark SQL的表中，经常会存在很多小文件（大小远小于HDFS块大小），每个小文件默认对应Spark中的一个Partition，也就是一个Task。在很多小文件场景下，Spark会起很多Task。当SQL逻辑中存在Shuff

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
优化小文件场景下的Spark SQL性能 - MapReduce服务 MRS

优化小文件场景下的Spark SQL性能配置场景 Spark SQL的表中，经常会存在很多小文件（大小远小于HDFS块大小），每个小文件默认对应Spark中的一个Partition，也就是一个Task。在很多小文件场景下，Spark会起很多Task。当SQL逻辑中存在Shuff

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
Hive on Hue - MapReduce服务 MRS
Hive on Hue - MapReduce服务 MRS

HQL语句，单击右上角的，并输入名称和描述。已保存的语句可以在“保存的查询”页签查看。查看历史单击“查询历史记录”，可查看HQL运行情况，支持显示所有语句或只显示保存的语句的运行情况。历史记录存在多个结果时，可以在输入框使用关键字进行搜索。高级查询配置单击右上角的，对文件、函数、设置等信息进行配置。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hue（MRS 3.x及之后版本） > 使用Hue WebUI典型场景
Oozie on Hue - MapReduce服务 MRS
Oozie on Hue - MapReduce服务 MRS

Hue提供了Oozie作业管理器功能，使用户可以通过界面图形化的方式使用Oozie。 Hue界面主要用于文件、表等数据的查看与分析，禁止通过Hue界面对操作对象进行删除等高危管理操作。如需操作，建议在确认对业务没有影响后通过各组件的相应操作方法进行处理，例如使用HDFS客户端对HDFS文件进行操作，使用Hive客户端对Hive表进行操作。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hue（MRS 3.x及之后版本） > 使用Hue WebUI典型场景
访问Presto的WebUI - MapReduce服务 MRS

访问Presto的WebUI 用户可以通过Presto的WebUI，在图形化界面查看Presto的统计信息。Presto的WebUI界面不支持使用IE浏览器访问，建议使用Google浏览器访问。前提条件已安装Presto服务的集群。已安装集群客户端，例如安装目录为“/opt

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Presto

总条数： 6424

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Hue WebUI典型场景 - MapReduce服务 MRS

使用Hudi - MapReduce服务 MRS

配置HDFS冷热数据迁移 - MapReduce服务 MRS

如何对insert overwrite自读自写场景进行优化 - MapReduce服务 MRS

使用CDM服务迁移Hive数据至MRS集群 - MapReduce服务 MRS

多副本场景下，运行在副本丢失损坏的BE节点的查询任务报错 - MapReduce服务 MRS

如何对insert overwrite自读自写场景进行优化 - MapReduce服务 MRS

提升HBase连续Put数据场景性能 - MapReduce服务 MRS

提升HBase连续Put数据场景性能 - MapReduce服务 MRS

HDFS on Hue - MapReduce服务 MRS

优化数据倾斜场景下的Spark SQL性能 - MapReduce服务 MRS

使用Storm - MapReduce服务 MRS

使用HBase BulkLoad导入数据成功，执行相同的查询时却返回不同的结果 - MapReduce服务 MRS

使用Python远程连接HDFS的端口失败 - MapReduce服务 MRS

优化数据倾斜场景下的Spark SQL性能 - MapReduce服务 MRS

优化小文件场景下的Spark SQL性能 - MapReduce服务 MRS

优化小文件场景下的Spark SQL性能 - MapReduce服务 MRS

Hive on Hue - MapReduce服务 MRS

Oozie on Hue - MapReduce服务 MRS

访问Presto的WebUI - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线