搜索_华为云

经验总结 - MapReduce服务 MRS
经验总结 - MapReduce服务 MRS

广播map代替数组当每条记录需要查表，如果是Driver端用广播方式传递的数据，数据结构优先采用set/map而不是Iterator，因为Set/Map的查询速率接近O(1)，而Iterator是O(n)。数据倾斜当数据发生倾斜（某一部分数据量特别大），虽然没有GC（Gabage Colle

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
ALM-12205 磁盘IO写入等待时长超过阈值 - MapReduce服务 MRS

该选项的含义为告警检查阶段，“平滑次数”为连续检查多少次超过阈值，则发送告警。单击规则“操作”列的“修改”，根据实际情况更改告警阈值。等待2分钟，查看告警是否自动恢复。是，处理完毕。否，执行3。检查每个写操作平均所需时间是否达到上限。在FusionInsight Manager页面，选择“运维

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
更改NodeManager的存储目录 - MapReduce服务 MRS

操作步骤 MRS 3.x之前的版本集群执行以下操作：检查环境。登录MRS控制台，在左侧导航栏选择“现有集群”，单击集群名称。选择“组件管理”，查看Yarn的“健康状态”是否为“良好”。是，执行1.c。否，Yarn状态不健康，执行1.b。请先修复Yarn异常，任务结束。确定修改NodeManager的存储目录场景。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Yarn > Yarn运维管理
数据表报错Too many parts解决方法 - MapReduce服务 MRS

fault_cluster, system.replication_queue) group by node,type; 如果存在积压，请查看副本队列中的任务是否报错，并根据报错信息处理。执行如下SQL排查是否存在节点间表结构不一致。 select FQDN(), create_table_query

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ClickHouse > ClickHouse性能调优
创建Loader角色 - MapReduce服务 MRS

Loader > 作业分组”。选择某个作业分组。在指定作业的“权限”列，勾选“编辑”。设置Loader作业的执行权限（包括作业的启动、停止和查看历史记录权限）在“配置资源权限”的表格中选择“待操作集群的名称 > Loader > 作业分组”。选择某个作业分组。在指定作业的“权限”列，勾选“执行”。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader
ALM-14028 待补齐的块数超过阈值 - MapReduce服务 MRS

写入文件的副本数大于DataNode的节点数。处理步骤在FusionInsight Manager首页，选择“运维 > 告警 > 告警”查看是否存在告警“ALM-14003 丢失的HDFS块数量超过阈值”。是，执行2。否，执行3。按照ALM-14003 丢失的HDFS块数

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
创建Loader角色 - MapReduce服务 MRS

Loader > 作业分组”。选择某个作业分组。在指定作业的“权限”列，勾选“编辑”。设置Loader作业的执行权限（包括作业的启动、停止和查看历史记录权限）在“配置资源权限”的表格中选择“待操作集群的名称 > Loader > 作业分组”。选择某个作业分组。在指定作业的“权限”列，勾选“执行”。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > Loader用户权限管理
ClickHouse数据表分区过多调优 - MapReduce服务 MRS

fault_cluster, system.replication_queue) group by node,type; 如果存在积压，请查看副本队列中的任务是否报错，并根据报错信息处理。执行如下SQL排查是否存在节点间表结构不一致。 select FQDN(), create_table_query

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse > ClickHouse性能调优
典型场景：从HDFS/OBS导出数据到关系型数据库 - MapReduce服务 MRS

表会增加作业的执行时间。 tmp_test 单击“保存并运行”，开始保存并运行作业。查看作业完成情况进入“Loader WebUI”界面，待“状态”显示“成功”则说明作业完成。图4 查看作业父主题：数据导出

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导出
使用Loader从HDFS/OBS导出数据到关系型数据库 - MapReduce服务 MRS

表会增加作业的执行时间。 tmp_test 单击“保存并运行”，开始保存并运行作业。查看作业完成情况进入“Loader WebUI”界面，待“状态”显示“成功”则说明作业完成。图4 查看作业父主题：创建Loader数据导出作业

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 创建Loader数据导出作业
Spark任务运行失败 - MapReduce服务 MRS

大小；对于同时运行的task太多，主要看--executor-cores设置的vcore数量。问题2：需要在相应的task的日志里面查找异常原因。如果有OOM的情况，请参照问题1。父主题：使用Spark

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Spark
在Linux中调测Hive HCatalog应用 - MapReduce服务 MRS

huawei.bigdata.hive.example.HCatalogExample -libjars $LIB_JARS t1 t2 运行结果查看，运行后t2表数据如下所示。 0: jdbc:hive2://192.168.1.18:24002,192.168.1.> select *

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Hive开发指南 > 调测Hive应用
ALM-12014 设备分区丢失 - MapReduce服务 MRS

10/3.1.5.0.3及之后补丁版本集群，执行9。MRS 3.3.0之前版本集群请手动清除告警，操作结束。否，执行10。等待2分钟，查看告警是否自动恢复。是，处理完毕。否，执行10。收集故障信息。在FusionInsight Manager界面，选择“运维 > 日志

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
配置Spark Web UI ACL - MapReduce服务 MRS

UI的管理员列表和管理员组列表，由客户端的“spark.ui.view.acls”和“spark.modify.acls.groups”配置指定查看Web UI任务明细的访问者列表和组列表，由客户端的“spark.modify.acls”和“spark.ui.view.acls.groups”配置指定修改Web

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark用户权限管理
macOS使用浏览器访问MRS Manager - MapReduce服务 MRS

e浏览器访问。显示MRS Manager登录页面，此时Chrome浏览器暂时还不能登录MRS Manager页面，请继续操作后续步骤。查找证书。单击浏览器左上角，单击“证书无效”所在行的。获取证书。选中该证书拖动到电脑桌面，即可获得证书。在Mac应用中选择钥匙串访问。

帮助中心 > MapReduce服务 MRS > 故障排除 > Web页面访问类 > 登录集群Manager常见异常问题
配置列统计值直方图Histogram用以增强CBO准确度 - MapReduce服务 MRS

的统计信息，结合算子的输入数据集来估计每个算子的输出条数以及字节大小，这些就是执行一个算子的代价。 CBO会调整执行计划，来最小化端到端的查询时间，中心思路2点：尽早过滤不相关的数据。最小化每个算子的代价。 CBO优化过程分为2步：收集统计信息。根据输入的数据集估算特定算子的输出数据集。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark运维管理
配置列统计值直方图Histogram用以增强CBO准确度 - MapReduce服务 MRS

的统计信息，结合算子的输入数据集来估计每个算子的输出条数以及字节大小，这些就是执行一个算子的代价。 CBO会调整执行计划，来最小化端到端的查询时间，中心思路2点：尽早过滤不相关的数据。最小化每个算子的代价。 CBO优化过程分为2步：收集统计信息。根据输入的数据集估算特定算子的输出数据集。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark运维管理
HDFS客户端使用实践 - MapReduce服务 MRS

dfs -mkdir 文件夹名称创建文件夹 hdfs dfs -mkdir /tmp/mydir hdfs dfs -ls 文件夹名称查看文件夹 hdfs dfs -ls /tmp hdfs dfs -put 客户端节点上本地文件 HDFS指定路径上传本地文件到HDFS指定路径

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS
Spark SQL样例程序（Scala） - MapReduce服务 MRS

getOrCreate() import spark.implicits._ //通过隐式转换，将RDD转换成DataFrame，然后注册表 spark.sparkContext.textFile(args(0)).map(_.split(",")) .map(p

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark SQL样例程序
HDFS客户端使用实践 - MapReduce服务 MRS

dfs -mkdir 文件夹名称创建文件夹 hdfs dfs -mkdir /tmp/mydir hdfs dfs -ls 文件夹名称查看文件夹 hdfs dfs -ls /tmp hdfs dfs -put 客户端节点上本地文件 HDFS指定路径上传本地文件到HDFS指定路径

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS

总条数： 4062

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

经验总结 - MapReduce服务 MRS

ALM-12205 磁盘IO写入等待时长超过阈值 - MapReduce服务 MRS

更改NodeManager的存储目录 - MapReduce服务 MRS

数据表报错Too many parts解决方法 - MapReduce服务 MRS

创建Loader角色 - MapReduce服务 MRS

ALM-14028 待补齐的块数超过阈值 - MapReduce服务 MRS

创建Loader角色 - MapReduce服务 MRS

ClickHouse数据表分区过多调优 - MapReduce服务 MRS

典型场景：从HDFS/OBS导出数据到关系型数据库 - MapReduce服务 MRS

使用Loader从HDFS/OBS导出数据到关系型数据库 - MapReduce服务 MRS

Spark任务运行失败 - MapReduce服务 MRS

在Linux中调测Hive HCatalog应用 - MapReduce服务 MRS

ALM-12014 设备分区丢失 - MapReduce服务 MRS

配置Spark Web UI ACL - MapReduce服务 MRS

macOS使用浏览器访问MRS Manager - MapReduce服务 MRS

配置列统计值直方图Histogram用以增强CBO准确度 - MapReduce服务 MRS

配置列统计值直方图Histogram用以增强CBO准确度 - MapReduce服务 MRS

HDFS客户端使用实践 - MapReduce服务 MRS

Spark SQL样例程序（Scala） - MapReduce服务 MRS

HDFS客户端使用实践 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线