搜索_华为云

使用Hudi - MapReduce服务 MRS
使用Hudi - MapReduce服务 MRS

使用Hudi Hudi表概述使用Spark Shell创建Hudi表使用spark-sql操作Hudi表使用Hudi-Cli.sh操作Hudi表 Hudi写操作 Hudi读操作 Hudi数据管理维护 Hudi SQL语法参考 Hudi Schema演进配置Hudi数据列默认值

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版）
引入jar包不正确导致Spark任务无法运行 - MapReduce服务 MRS

引入jar包不正确导致Spark任务无法运行问题现象执行Spark任务，任务无法运行。原因分析执行Spark任务时，引入的jar包不正确，导致Spark任务运行失败。处理步骤登录任意Master节点。执行cd /opt/Bigdata/MRS_*/install/F

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Spark
使用Storm - MapReduce服务 MRS
使用Storm - MapReduce服务 MRS

使用Storm 从零开始使用Storm 使用Storm客户端使用客户端提交Storm拓扑访问Storm的WebUI 管理Storm拓扑查看Storm拓扑日志 Storm常用参数配置Storm业务用户密码策略迁移Storm业务至Flink Storm日志介绍性能调优

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版）
使用Sqoop - MapReduce服务 MRS
使用Sqoop - MapReduce服务 MRS

使用Sqoop Sqoop如何连接MySQL Sqoop读取MySQL数据到HBase时报HBaseAdmin.<init>方法找不到异常通过Hue创建Sqoop任务将数据从HBase导入HDFS时报错通过Sqoop从Hive导出数据到MySQL 8.0时报数据格式错误通过sqoop

帮助中心 > MapReduce服务 MRS > 故障排除
使用Loader导入数据 - MapReduce服务 MRS

过滤器类型选择文件过滤的条件。“WILCARD”表示使用通配符过滤，“REGEX”表示使用正则表达式匹配。与“路径过滤器”和“文件过滤器”配合使用。不选择值时默认为通配符过滤。路径过滤器与“过滤器类型”配合使用，配置通配符或正则表达式对源文件的输入路径包含的目录进行过滤

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导入
同步Kafka数据至ClickHouse - MapReduce服务 MRS

已创建ClickHouse集群，并且ClickHouse集群和Kafka集群在同一VPC下，网络可以互通，并安装ClickHouse客户端。约束限制当前ClickHouse不支持和开启安全模式的Kafka集群进行对接。 Kafka引擎表使用语法说明语法 CREATE TABLE [IF NOT EXISTS]

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ClickHouse > ClickHouse数据导入
使用Spark - MapReduce服务 MRS
使用Spark - MapReduce服务 MRS

使用Spark 运行Spark应用时修改split值报错提交Spark任务时提示参数格式错误磁盘容量不足导致Spark、Hive和Yarn服务不可用引入jar包不正确导致Spark任务无法运行 Spark任务由于内存不够或提交作业时未添加Jar包，作业卡住提交Spark任

 帮助中心 > MapReduce服务 MRS > 故障排除
cache table使用指导 - MapReduce服务 MRS

cache table使用指导问题 cache table的作用是什么？cache table时需要注意哪些方面？回答 Spark SQL可以将表cache到内存中，并且使用压缩存储来尽量减少内存压力。通过将表cache，查询可以直接从内存中读取数据，从而减少读取磁盘带来的内存开销。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > SQL和DataFrame
从零开始使用Spark - MapReduce服务 MRS

从零开始使用Spark 本章节提供从零开始使用Spark提交sparkPi作业的操作指导，sparkPi是最经典的Spark作业，它用来计算Pi（π）值。操作步骤准备sparkPi程序。开源的Spark的样例程序包含多个例子，其中包含sparkPi。可以从https://archive

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark（MRS 3.x之前版本）
快速使用Flume采集节点日志 - MapReduce服务 MRS

户身份保存，例如root用户。参数配置并保存后，Flume客户端将自动加载“properties.properties”中配置的内容。当spoolDir生成新的日志文件，文件内容将发送到Kafka生产者，并支持Kafka消费者消费。使用Flume客户端（MRS 3.x及之后版本）

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume
使用Spark小文件合并工具说明 - MapReduce服务 MRS

使用Spark小文件合并工具说明工具介绍在Hadoop大规模生产集群中，由于HDFS的元数据都保存在NameNode的内存中，集群规模受制于NameNode单点的内存限制。如果HDFS中有大量的小文件，会消耗NameNode大量内存，还会大幅降低读写性能，延长作业运行时间。因

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core企业级能力增强
使用Phoenix创建HBase表后，向索引表中加载数据报错 - MapReduce服务 MRS

使用Phoenix创建HBase表后，向索引表中加载数据报错问题背景与现象使用Phoenix创建HBase表后，使用命令向索引表中加载数据报错： MRS 2.x及之前版本：Mutable secondary indexes must have the hbase.regionserver

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HBase
创建IAM用户并授权使用MRS - MapReduce服务 MRS

见权限策略。示例流程图1 给用户授权MRS权限流程创建用户组并授权在IAM控制台创建用户组，并授予MRS服务对应权限。创建用户并加入用户组在IAM控制台创建用户，并将其加入1中创建的用户组。用户登录并验证权限新创建的用户登录控制台，切换至授权区域，验证权限：在“

帮助中心 > MapReduce服务 MRS > 用户指南 > 准备工作
从零开始使用CarbonData - MapReduce服务 MRS

从零开始使用CarbonData MRS 3.x之前版本参考本章节，MRS 3.x及后续版本请参考使用CarbonData（MRS 3.x及之后版本）。本章节介绍使用Spark CarbonData的基本流程，所有任务场景基于spark-beeline环境。CarbonData快速入门包含以下任务：

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x之前版本）
Flink客户端使用实践 - MapReduce服务 MRS

Flink客户端使用实践本节提供使用Flink运行wordcount作业的操作指导。使用Flink客户端前提条件 MRS集群中已安装Flink组件。集群正常运行，已安装集群客户端，例如安装目录为“/opt/hadoopclient”。以下操作的客户端目录只是举例，请根据实际安装目录修改。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink
快速使用Flume采集节点日志 - MapReduce服务 MRS

保存，例如root用户。参数配置并保存后，Flume客户端将自动加载“properties.properties”中配置的内容。当spoolDir生成新的日志文件，文件内容将发送到Kafka生产者，并支持Kafka消费者消费。父主题：使用Flume

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flume
开源sqoop-shell工具使用指导 - MapReduce服务 MRS

sqoop2-shell有两种获取登录认证信息的方式，第一种通过配置文件获取，具体配置项请参考使用sqoop-shell工具导入数据到HDFS、使用sqoop-shell工具导入数据到HBase；第二种方式则使用参数直接提供认证信息，这个方式有两种模式：密码模式和Kerberos认证模式。进入交互模式命令

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 客户端工具说明
使用BulkLoad工具向HBase中批量导入数据 - MapReduce服务 MRS

使用BulkLoad工具向HBase中批量导入数据应用场景经常面临向HBase中导入大量数据的情景，向HBase中批量加载数据的方式有很多种，最直接方式是调用HBase的API使用put方法插入数据；另外一种是用MapReduce的方式从HDFS上加载数据。但是这两种方式效率

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
使用Presto客户端执行查询语句 - MapReduce服务 MRS

步骤2-3仅启用Kerberos认证的集群执行，普通集群请直接从步骤4开始执行。根据业务情况，准备好客户端，并登录安装客户端的节点。例如在Master2节点更新客户端，则登录该节点使用客户端，具体参见使用MRS客户端。执行以下命令切换用户。 sudo su - omm 执行以下命令，切换到客户

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Presto
使用HBase - MapReduce服务 MRS
使用HBase - MapReduce服务 MRS

使用HBase 创建HBase权限角色 HBase客户端使用实践快速使用HBase进行离线数据分析使用BulkLoad工具向HBase迁移数据 HBase数据操作 HBase企业级能力增强 HBase性能调优 HBase运维管理 HBase常见问题 HBase故障排除

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版）

总条数： 5906

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Hudi - MapReduce服务 MRS

引入jar包不正确导致Spark任务无法运行 - MapReduce服务 MRS

使用Storm - MapReduce服务 MRS

使用Sqoop - MapReduce服务 MRS

使用Loader导入数据 - MapReduce服务 MRS

同步Kafka数据至ClickHouse - MapReduce服务 MRS

使用Spark - MapReduce服务 MRS

cache table使用指导 - MapReduce服务 MRS

从零开始使用Spark - MapReduce服务 MRS

快速使用Flume采集节点日志 - MapReduce服务 MRS

使用Spark小文件合并工具说明 - MapReduce服务 MRS

使用Phoenix创建HBase表后，向索引表中加载数据报错 - MapReduce服务 MRS

创建IAM用户并授权使用MRS - MapReduce服务 MRS

从零开始使用CarbonData - MapReduce服务 MRS

Flink客户端使用实践 - MapReduce服务 MRS

快速使用Flume采集节点日志 - MapReduce服务 MRS

开源sqoop-shell工具使用指导 - MapReduce服务 MRS

使用BulkLoad工具向HBase中批量导入数据 - MapReduce服务 MRS

使用Presto客户端执行查询语句 - MapReduce服务 MRS

使用HBase - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线