搜索_华为云

从零开始使用Spark - MapReduce服务 MRS

从零开始使用Spark 本章节提供从零开始使用Spark提交sparkPi作业的操作指导，sparkPi是最经典的Spark作业，它用来计算Pi（π）值。操作步骤准备sparkPi程序。开源的Spark的样例程序包含多个例子，其中包含sparkPi。可以从https://archive

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark（MRS 3.x之前版本）
配置HetuEngine智能物化视图能力 - MapReduce服务 MRS

自动刷新物化视图自动删除物化视图使用HetuEngine智能物化视图前提条件集群运行正常并至少安装一个QAS实例。 HetuEngine智能物化视图应用流程图1 HetuEngine智能物化视图应用流程表1 HetuEngine智能物化视图应用流程说明阶段说明参考章节

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 配置HetuEngine物化视图
MRS存算分离配置流程说明 - MapReduce服务 MRS

MRS支持在大数据存储容量大、计算资源需要弹性扩展的场景下，用户将数据存储在OBS服务中，使用MRS集群仅作数据计算处理的存算分离模式，从而实现按需灵活扩展资源、低成本的海量数据分析方案。大数据存算分离场景，请务必使用OBS并行文件系统（并行文件系统），使用普通对象桶会对集群性能产生较大影响。当集群已对接了OB

帮助中心 > MapReduce服务 MRS > 用户指南 > 配置MRS集群存算分离
集群在线扩缩容 - MapReduce服务 MRS

集群在线扩缩容大数据集群的处理能力通常可以通过增加集群的节点数来横向扩展，当集群规模不符合业务要求时，用户可以通过该功能进行集群节点规模的调整，进行扩容或者缩容；在缩容节点时，MRS会智能地选择负载最少或者迁移数据量最小节点，并且在缩容过程中，缩容节点不再接收新的任务，正在执行

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 产品功能 > 集群管理
使用Hudi - MapReduce服务 MRS
使用Hudi - MapReduce服务 MRS

使用Hudi Hudi表概述使用Spark Shell创建Hudi表使用spark-sql操作Hudi表使用Hudi-Cli.sh操作Hudi表 Hudi写操作 Hudi读操作 Hudi数据管理维护 Hudi SQL语法参考 Hudi Schema演进配置Hudi数据列默认值

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版）
使用External Shuffle Service提升性能 - MapReduce服务 MRS

使用External Shuffle Service提升性能操作场景 Spark系统在运行含shuffle过程的应用时，Executor进程除了运行task，还要负责写shuffle数据，给其他Executor提供shuffle数据。当Executor进程任务过重，导致GC而不

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > Spark Core调优
使用Presto客户端执行查询语句 - MapReduce服务 MRS

请直接从步骤4开始执行。根据业务情况，准备好客户端，并登录安装客户端的节点。例如在Master2节点更新客户端，则登录该节点使用客户端，具体参见使用MRS客户端。执行以下命令切换用户。 sudo su - omm 执行以下命令，切换到客户端目录，例如“/opt/client”。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Presto
使用Impala - MapReduce服务 MRS
使用Impala - MapReduce服务 MRS

使用Impala Impala客户端使用实践访问Impala WebUI界面使用Impala操作Kudu表 Impala对接外部LDAP Impala启用并配置动态资源池使用Impala查询管理界面 Impala常见配置参数 Impala常见问题

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版）
使用OpenTSDB - MapReduce服务 MRS
使用OpenTSDB - MapReduce服务 MRS

使用OpenTSDB 使用MRS客户端操作OpenTSDB指标数据使用curl命令操作OpenTSDB

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版）
使用Kafka - MapReduce服务 MRS
使用Kafka - MapReduce服务 MRS

使用Kafka Kafka数据消费概述 Kafka用户权限管理 Kafka客户端使用实践快速使用Kafka生产消费数据创建Kafka Topic 在Kafka Topic中接入消息管理Kafka Topic Kafka企业级能力增强 Kafka性能调优 Kafka运维管理 Kafka常见问题

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版）
使用Flink - MapReduce服务 MRS
使用Flink - MapReduce服务 MRS

使用Flink Flink作业引擎概述 Flink用户权限管理 Flink客户端使用实践创建FlinkServer作业前准备创建FlinkServer作业管理FlinkServer作业 Flink运维管理 Flink性能调优 Flink客户端常见命令说明 Flink常见问题

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版）
使用Tez - MapReduce服务 MRS
使用Tez - MapReduce服务 MRS

使用Tez 访问Tez WebUI查看任务执行结果 Tez常用配置参数 Tez日志介绍 Tez常见问题

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版）
使用Storm - MapReduce服务 MRS
使用Storm - MapReduce服务 MRS

使用Storm 从零开始使用Storm 使用Storm客户端使用客户端提交Storm拓扑访问Storm的WebUI 管理Storm拓扑查看Storm拓扑日志 Storm常用参数配置Storm业务用户密码策略迁移Storm业务至Flink Storm日志介绍性能调优

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版）
使用Loader导入数据 - MapReduce服务 MRS

过滤器类型选择文件过滤的条件。“WILCARD”表示使用通配符过滤，“REGEX”表示使用正则表达式匹配。与“路径过滤器”和“文件过滤器”配合使用。不选择值时默认为通配符过滤。路径过滤器与“过滤器类型”配合使用，配置通配符或正则表达式对源文件的输入路径包含的目录进行过滤

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导入
快速使用Flume采集节点日志 - MapReduce服务 MRS

快速使用Flume采集节点日志操作场景 Flume支持将采集的日志信息导入到Kafka。前提条件已创建开启Kerberos认证的包含Flume、Kafka等组件的流式集群。可参考购买自定义集群。已配置网络，使日志生成节点与流集群互通。使用Flume客户端（MRS 3.x之前版本）

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume
使用Tableau访问MRS HetuEngine - MapReduce服务 MRS

使用Tableau访问MRS HetuEngine 应用场景 Tableau是一款商业智能工具软件，将可信的数据转化为可行的见解。借助直观的人工智能分析平台，帮助人们查看和理解数据并根据数据采取行动，让每一次决策都更加明智。本章节以Tableau Desktop 2022.2版

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 生态组件对接
使用ZooKeeper客户端 - MapReduce服务 MRS

使用ZooKeeper客户端 Zookeeper是一个开源的，高可靠的，分布式一致性协调服务。Zookeeper设计目标是用来解决那些复杂，易出错的分布式系统难以保证数据一致性的。不必开发专门的协同应用，十分适合高可用服务保持数据一致性。背景信息在使用客户端前，除主管理节点以

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ZooKeeper
快速使用Flume采集节点日志 - MapReduce服务 MRS

快速使用Flume采集节点日志 Flume支持将采集的日志信息导入到Kafka。前提条件已创建开启Kerberos认证的包含Flume、Kafka等组件的流式集群。可参考购买自定义集群。已配置网络，使日志生成节点与流集群互通。使用Flume客户端普通集群不需要执行2-6。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flume
Flink客户端使用实践 - MapReduce服务 MRS

Flink客户端使用实践本节提供使用Flink运行wordcount作业的操作指导。使用Flink客户端前提条件 MRS集群中已安装Flink组件。集群正常运行，已安装集群客户端，例如安装目录为“/opt/hadoopclient”。以下操作的客户端目录只是举例，请根据实际安装目录修改。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink
cache table使用指导 - MapReduce服务 MRS

cache table使用指导问题 cache table的作用是什么？cache table时需要注意哪些方面？回答 Spark SQL可以将表cache到内存中，并且使用压缩存储来尽量减少内存压力。通过将表cache，查询可以直接从内存中读取数据，从而减少读取磁盘带来的内存开销。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > SQL和DataFrame

总条数： 5775

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

从零开始使用Spark - MapReduce服务 MRS

配置HetuEngine智能物化视图能力 - MapReduce服务 MRS

MRS存算分离配置流程说明 - MapReduce服务 MRS

集群在线扩缩容 - MapReduce服务 MRS

使用Hudi - MapReduce服务 MRS

使用External Shuffle Service提升性能 - MapReduce服务 MRS

使用Presto客户端执行查询语句 - MapReduce服务 MRS

使用Impala - MapReduce服务 MRS

使用OpenTSDB - MapReduce服务 MRS

使用Kafka - MapReduce服务 MRS

使用Flink - MapReduce服务 MRS

使用Tez - MapReduce服务 MRS

使用Storm - MapReduce服务 MRS

使用Loader导入数据 - MapReduce服务 MRS

快速使用Flume采集节点日志 - MapReduce服务 MRS

使用Tableau访问MRS HetuEngine - MapReduce服务 MRS

使用ZooKeeper客户端 - MapReduce服务 MRS

快速使用Flume采集节点日志 - MapReduce服务 MRS

Flink客户端使用实践 - MapReduce服务 MRS

cache table使用指导 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线