搜索_华为云

从零开始使用Spark - MapReduce服务 MRS

从零开始使用Spark 本章节提供从零开始使用Spark提交sparkPi作业的操作指导，sparkPi是最经典的Spark作业，它用来计算Pi（π）值。操作步骤准备sparkPi程序。开源的Spark的样例程序包含多个例子，其中包含sparkPi。可以从https://archive

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark（MRS 3.x之前版本）
配置HetuEngine智能物化视图能力 - MapReduce服务 MRS

自动刷新物化视图自动删除物化视图使用HetuEngine智能物化视图前提条件集群运行正常并至少安装一个QAS实例。 HetuEngine智能物化视图应用流程图1 HetuEngine智能物化视图应用流程表1 HetuEngine智能物化视图应用流程说明阶段说明参考章节

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 配置HetuEngine物化视图
集群在线扩缩容 - MapReduce服务 MRS

集群在线扩缩容大数据集群的处理能力通常可以通过增加集群的节点数来横向扩展，当集群规模不符合业务要求时，用户可以通过该功能进行集群节点规模的调整，进行扩容或者缩容；在缩容节点时，MRS会智能地选择负载最少或者迁移数据量最小节点，并且在缩容过程中，缩容节点不再接收新的任务，正在执行

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 产品功能 > 集群管理
使用Spark - MapReduce服务 MRS
使用Spark - MapReduce服务 MRS

使用Spark 运行Spark应用时修改split值报错提交Spark任务时提示参数格式错误磁盘容量不足导致Spark、Hive和Yarn服务不可用引入jar包不正确导致Spark任务无法运行 Spark任务由于内存不够或提交作业时未添加Jar包，作业卡住提交Spark任

 帮助中心 > MapReduce服务 MRS > 故障排除
使用Hudi - MapReduce服务 MRS
使用Hudi - MapReduce服务 MRS

使用Hudi Hudi表概述使用Spark Shell创建Hudi表使用spark-sql操作Hudi表使用Hudi-Cli.sh操作Hudi表 Hudi写操作 Hudi读操作 Hudi数据管理维护 Hudi SQL语法参考 Hudi Schema演进配置Hudi数据列默认值

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版）
MRS存算分离配置流程说明 - MapReduce服务 MRS

MRS支持在大数据存储容量大、计算资源需要弹性扩展的场景下，用户将数据存储在OBS服务中，使用MRS集群仅作数据计算处理的存算分离模式，从而实现按需灵活扩展资源、低成本的海量数据分析方案。大数据存算分离场景，请务必使用OBS并行文件系统（并行文件系统），使用普通对象桶会对集群性能产生较大影响。当集群已对接了OB

帮助中心 > MapReduce服务 MRS > 用户指南 > 配置MRS集群存算分离
使用External Shuffle Service提升性能 - MapReduce服务 MRS

使用External Shuffle Service提升性能操作场景 Spark系统在运行含shuffle过程的应用时，Executor进程除了运行task，还要负责写shuffle数据，给其他Executor提供shuffle数据。当Executor进程任务过重，导致GC而不

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > Spark Core调优
使用Storm - MapReduce服务 MRS
使用Storm - MapReduce服务 MRS

使用Storm 从零开始使用Storm 使用Storm客户端使用客户端提交Storm拓扑访问Storm的WebUI 管理Storm拓扑查看Storm拓扑日志 Storm常用参数配置Storm业务用户密码策略迁移Storm业务至Flink Storm日志介绍性能调优

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版）
使用Presto客户端执行查询语句 - MapReduce服务 MRS

请直接从步骤4开始执行。根据业务情况，准备好客户端，并登录安装客户端的节点。例如在Master2节点更新客户端，则登录该节点使用客户端，具体参见使用MRS客户端。执行以下命令切换用户。 sudo su - omm 执行以下命令，切换到客户端目录，例如“/opt/client”。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Presto
快速使用Flume采集节点日志 - MapReduce服务 MRS

快速使用Flume采集节点日志操作场景 Flume支持将采集的日志信息导入到Kafka。前提条件已创建开启Kerberos认证的包含Flume、Kafka等组件的流式集群。可参考购买自定义集群。已配置网络，使日志生成节点与流集群互通。使用Flume客户端（MRS 3.x之前版本）

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume
开源sqoop-shell工具使用指导 - MapReduce服务 MRS

sqoop2-shell有两种获取登录认证信息的方式，第一种通过配置文件获取，具体配置项请参考使用sqoop-shell工具导入数据到HDFS、使用sqoop-shell工具导入数据到HBase；第二种方式则使用参数直接提供认证信息，这个方式有两种模式：密码模式和Kerberos认证模式。进入交互模式命令

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 客户端工具说明
使用Tableau访问MRS HetuEngine - MapReduce服务 MRS

使用Tableau访问MRS HetuEngine 应用场景 Tableau是一款商业智能工具软件，将可信的数据转化为可行的见解。借助直观的人工智能分析平台，帮助人们查看和理解数据并根据数据采取行动，让每一次决策都更加明智。本章节以Tableau Desktop 2022.2版

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 生态组件对接
使用Hudi - MapReduce服务 MRS
使用Hudi - MapReduce服务 MRS

使用Hudi Hudi表概述使用Spark Shell创建Hudi表使用Hudi-Cli.sh操作Hudi表 Hudi写操作 Hudi读操作数据管理维护 Hudi常见配置参数 Hudi性能调优 Hudi常见问题

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版）
使用Loader导入数据 - MapReduce服务 MRS

过滤器类型选择文件过滤的条件。“WILCARD”表示使用通配符过滤，“REGEX”表示使用正则表达式匹配。与“路径过滤器”和“文件过滤器”配合使用。不选择值时默认为通配符过滤。路径过滤器与“过滤器类型”配合使用，配置通配符或正则表达式对源文件的输入路径包含的目录进行过滤

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导入
使用ZooKeeper客户端 - MapReduce服务 MRS

使用ZooKeeper客户端 Zookeeper是一个开源的，高可靠的，分布式一致性协调服务。Zookeeper设计目标是用来解决那些复杂，易出错的分布式系统难以保证数据一致性的。不必开发专门的协同应用，十分适合高可用服务保持数据一致性。背景信息在使用客户端前，除主管理节点以

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ZooKeeper
快速使用Flume采集节点日志 - MapReduce服务 MRS

快速使用Flume采集节点日志 Flume支持将采集的日志信息导入到Kafka。前提条件已创建开启Kerberos认证的包含Flume、Kafka等组件的流式集群。可参考购买自定义集群。已配置网络，使日志生成节点与流集群互通。使用Flume客户端普通集群不需要执行2-6。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flume
使用Storm - MapReduce服务 MRS
使用Storm - MapReduce服务 MRS

提交Storm拓扑后Worker运行异常，日志提示Failed to bind to XXX 使用jstack命令查看进程堆栈提示“well-known file is not secure” 使用Storm-JDBC插件开发Oracle写入Bolt时发现数据无法写入 Storm业务拓扑配置GC参数不生效 Storm

帮助中心 > MapReduce服务 MRS > 故障排除
使用HBase - MapReduce服务 MRS
使用HBase - MapReduce服务 MRS

使用HBase 创建HBase权限角色 HBase客户端使用实践快速使用HBase进行离线数据分析使用BulkLoad工具向HBase迁移数据 HBase数据操作 HBase企业级能力增强 HBase性能调优 HBase运维管理 HBase常见问题 HBase故障排除

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版）
Flink客户端使用实践 - MapReduce服务 MRS

Flink客户端使用实践本节提供使用Flink运行wordcount作业的操作指导。使用Flink客户端前提条件 MRS集群中已安装Flink组件。集群正常运行，已安装集群客户端，例如安装目录为“/opt/hadoopclient”。以下操作的客户端目录只是举例，请根据实际安装目录修改。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink
cache table使用指导 - MapReduce服务 MRS

cache table使用指导问题 cache table的作用是什么？cache table时需要注意哪些方面？回答 Spark SQL可以将表cache到内存中，并且使用压缩存储来尽量减少内存压力。通过将表cache，查询可以直接从内存中读取数据，从而减少读取磁盘带来的内存开销。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > SQL和DataFrame

总条数： 5678

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

从零开始使用Spark - MapReduce服务 MRS

配置HetuEngine智能物化视图能力 - MapReduce服务 MRS

集群在线扩缩容 - MapReduce服务 MRS

使用Spark - MapReduce服务 MRS

使用Hudi - MapReduce服务 MRS

MRS存算分离配置流程说明 - MapReduce服务 MRS

使用External Shuffle Service提升性能 - MapReduce服务 MRS

使用Storm - MapReduce服务 MRS

使用Presto客户端执行查询语句 - MapReduce服务 MRS

快速使用Flume采集节点日志 - MapReduce服务 MRS

开源sqoop-shell工具使用指导 - MapReduce服务 MRS

使用Tableau访问MRS HetuEngine - MapReduce服务 MRS

使用Hudi - MapReduce服务 MRS

使用Loader导入数据 - MapReduce服务 MRS

使用ZooKeeper客户端 - MapReduce服务 MRS

快速使用Flume采集节点日志 - MapReduce服务 MRS

使用Storm - MapReduce服务 MRS

使用HBase - MapReduce服务 MRS

Flink客户端使用实践 - MapReduce服务 MRS

cache table使用指导 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线