搜索_华为云

Spark Streaming对接Kafka0-10样例程序开发思路 - MapReduce服务 MRS

用程序结果备份到HDFS的路径，<brokers>指获取元数据的Kafka地址，<topic>指读取Kafka上的topic名称，<batchTime>指Streaming分批的处理间隔。由于Spark Streaming Kafka的依赖包在客户端的存放路径与其他依赖包不同，

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Streaming对接Kafka0-10样例程序
Flink与其他组件的关系 - MapReduce服务 MRS

Flink与其他组件的关系 Flink与Yarn的关系 Flink支持基于Yarn管理的集群模式，在该模式下，Flink作为Yarn上的一个应用，提交到Yarn上执行。 Flink基于Yarn的集群部署如图1所示。图1 Flink基于Yarn的集群部署 Flink Yarn C

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Flink
在Hive中drop表后如何完全释放磁盘空间 - MapReduce服务 MRS

在Hive命令行执行drop表的操作后，通过命令hdfs dfsadmin -report查看磁盘空间，发现表没有删除。原因分析在Hive命令行执行drop表只删除了外部表的表结构，并没有删除该表存储在HDFS上的表数据。处理步骤使用root用户登录安装客户端的节点，并认证用户。 cd

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hive
创建Ranger集群 - MapReduce服务 MRS

启Kerberos认证的安全集群不支持Ranger组件。图1 选择Ranger组件选择是否开启“使用外部数据源存储元数据”功能。开启：使用外置的MySQL数据库存储Ranger组件的User/Group/Policy等数据。关闭：Ranger组件的User/Group/P

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Ranger（MRS 1.9.2）
操作Avro格式数据 - MapReduce服务 MRS

创建RDD。以数据源的方式操作HBase，将上面生成的RDD写入HBase表中。读取HBase表中的数据，并且对其进行简单的操作。打包项目通过IDEA自带的Maven工具，打包项目，生成jar包。具体操作请参考在Linux环境中编包并运行Spark程序。将打包生成的jar包上传到

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
从零开始使用Kudu - MapReduce服务 MRS

Kudu是专为Apache Hadoop平台开发的列式存储管理器。Kudu具有Hadoop生态系统应用程序的共同技术特性：可水平扩展，并支持高可用性操作。前提条件已安装集群客户端，例如安装目录为“/opt/hadoopclient”，以下操作的客户端目录只是举例，请根据实际安装目录修改。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Kudu
操作Avro格式数据 - MapReduce服务 MRS

创建RDD。以数据源的方式操作HBase，将上面生成的RDD写入HBase表中。读取HBase表中的数据，并且对其进行简单的操作。打包项目通过IDEA自带的Maven工具，打包项目，生成jar包。具体操作请参考在Linux环境中调测Spark应用。将打包生成的jar包上传到S

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
没有/tmp目录权限导致执行访问OBS的作业报错 - MapReduce服务 MRS

没有/tmp目录权限导致执行访问OBS的作业报错问题现象在使用MRS多用户访问OBS的场景中，执行Spark、Hive、Presto等作业时，出现“/tmp”目录没有权限的报错。问题原因作业执行过程中有临时目录，提交作业的用户对临时目录没有操作权限。解决方法在集群“概

 帮助中心 > MapReduce服务 MRS > 故障排除 > 存算分离类
操作Avro格式数据 - MapReduce服务 MRS

keytab和krb5.conf文件为安全模式下的认证文件，需要在FusionInsight Manager中下载principal用户的认证凭证，样例代码中使用的用户为：super，需要修改为准备好的开发用户。打包项目通过IDEA自带的Maven工具，打包项目，生成jar包。具体

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark读取HBase表样例程序
INSERT...SELECT操作调优 - MapReduce服务 MRS

SELECT操作可以进行一定的调优操作。查询的数据是大量的小文件。查询的数据是较多的大文件。在beeline/thriftserver模式下使用非spark用户操作。操作步骤可对INSERT...SELECT操作做如下的调优操作。如果建的是Hive表，将存储类型设为Parquet，从而减少执行INSERT

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > SQL和DataFrame调优
配置Flink对接Kafka安全认证 - MapReduce服务 MRS

ZooKeeper”，在“配置”页签查看“clientPort”的值。服务端topic权限配置。将Kafka的Broker配置参数“allow.everyone.if.no.acl.found”的值修改为“true”。安全认证。安全认证的方式有三种：Kerberos认证、SSL加密认证和

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flink > Flink用户权限管理
配置DataNode预留磁盘百分比 - MapReduce服务 MRS

较大容量的磁盘可以运行更多的任务，因此将有更多的中间数据存储在Yarn本地目录。目前DataNode支持通过配置“dfs.datanode.du.reserved”来配置预留磁盘空间大小。配置较小的数值不能满足更大的磁盘要求。但对于更小的磁盘配置更大的数值将浪费大量的空间。为

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS企业级能力增强
Spark INSERT SELECT语句调优 - MapReduce服务 MRS

SELECT操作可以进行一定的调优操作。查询的数据是大量的小文件。查询的数据是较多的大文件。在Beeline/JDBCServer模式下使用非Spark用户操作。操作步骤可对INSERT...SELECT操作做如下的调优操作。如果建的是Hive表，将存储类型设为Parquet，从而减少执行INSERT

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
Spark INSERT SELECT语句调优 - MapReduce服务 MRS

SELECT操作可以进行一定的调优操作。查询的数据是大量的小文件。查询的数据是较多的大文件。在Beeline/JDBCServer模式下使用非Spark用户操作。操作步骤可对INSERT...SELECT操作做如下的调优操作。如果建的是Hive表，将存储类型设为Parquet，从而减少执行INSERT

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
使用Spark Shell创建Hudi表 - MapReduce服务 MRS

使用Spark数据源，通过代码段展示如何插入和更新Hudi的默认存储类型数据集COW表，以及每次写操作之后如何读取快照和增量数据。前提条件已下载并安装Hudi客户端，目前Hudi集成在MRS集群的Spark/Spark2x服务中，用户从Manager页面下载包含Spark/Spark2x服务的客户端即可，例如客户

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi
Hudi - MapReduce服务 MRS
Hudi - MapReduce服务 MRS

写时复制表也简称cow表，使用parquet文件存储数据，内部的更新操作需要通过重写原始parquet文件完成。优点：读取时，只读取对应分区的一个数据文件即可，较为高效。缺点：数据写入的时候，需要复制一个先前的副本再在其基础上生成新的数据文件，这个过程比较耗时。且由于耗时，读请求读取到的数据相对就会滞后。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍
手动备份Doris数据 - MapReduce服务 MRS

Doris数据备份支持最小分区（Partition）级别的操作，当表的数据量很大时，建议按分区分别执行，以降低失败重试的代价。因为备份恢复操作，操作的都是实际的数据文件，所以当一个表的分片过多，或者一个分片有过多的小版本时，可能即使总数据量很小，依然需要备份很长时间。当通过SHOW BACKUP或者SHOW

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Doris > Doris运维管理
Hive应用开发简介 - MapReduce服务 MRS

Hive应用开发简介 Hive简介 Hive是一个开源的，建立在Hadoop上的数据仓库框架，提供类似SQL的HiveQL语言操作结构化数据，其基本原理是将HiveQL语言自动转换成MapReduce任务或Spark任务，从而完成对Hadoop集群中存储的海量数据进行查询和分析。 Hive主要特点如下：

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Hive开发指南 > Hive应用开发概述
操作Avro格式数据 - MapReduce服务 MRS

keytab和krb5.conf文件为安全模式下的认证文件，需要在FusionInsight Manager中下载principal用户的认证凭证，样例代码中使用的用户为：super，需要修改为准备好的开发用户。打包项目通过IDEA自带的Maven工具，打包项目，生成jar包。具体

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark读取HBase表样例程序
spark-shell执行SQL跨文件系统load数据到Hive表失败 - MapReduce服务 MRS

使用spark-shell命令执行SQL或者spark-submit提交的Spark任务里面有SQL的load命令，并且原数据和目标表存储位置不是同一套文件系统，上述两种方式MapReduce任务启动时会报错。原因分析当使用load导入数据到Hive表的时候，属于需要跨文件系统的情况（例如原数据在HDFS上，而H

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Spark

总条数： 2202

上一页
1
...
18
19
20
...
111
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark Streaming对接Kafka0-10样例程序开发思路 - MapReduce服务 MRS

Flink与其他组件的关系 - MapReduce服务 MRS

在Hive中drop表后如何完全释放磁盘空间 - MapReduce服务 MRS

创建Ranger集群 - MapReduce服务 MRS

操作Avro格式数据 - MapReduce服务 MRS

从零开始使用Kudu - MapReduce服务 MRS

操作Avro格式数据 - MapReduce服务 MRS

没有/tmp目录权限导致执行访问OBS的作业报错 - MapReduce服务 MRS

操作Avro格式数据 - MapReduce服务 MRS

INSERT...SELECT操作调优 - MapReduce服务 MRS

配置Flink对接Kafka安全认证 - MapReduce服务 MRS

配置DataNode预留磁盘百分比 - MapReduce服务 MRS

Spark INSERT SELECT语句调优 - MapReduce服务 MRS

Spark INSERT SELECT语句调优 - MapReduce服务 MRS

使用Spark Shell创建Hudi表 - MapReduce服务 MRS

Hudi - MapReduce服务 MRS

手动备份Doris数据 - MapReduce服务 MRS

Hive应用开发简介 - MapReduce服务 MRS

操作Avro格式数据 - MapReduce服务 MRS

spark-shell执行SQL跨文件系统load数据到Hive表失败 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线