搜索_华为云

Hudi Clustering操作说明 - MapReduce服务 MRS

i表。为了能够在文件大小和入湖速度之间进行权衡，Hudi提供了一个hoodie.parquet.small.file.limit配置来设置最小文件大小。用户可以将该配置设置为“0”，以强制新数据写入新的文件组，或设置为更高的值以确保新数据被“填充”到现有小的文件组中，直到达到指定大小为止，但其会增加摄取延迟。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi数据管理维护
Hudi Clustering操作说明 - MapReduce服务 MRS

i表。为了能够在文件大小和入湖速度之间进行权衡，Hudi提供了一个hoodie.parquet.small.file.limit配置来设置最小文件大小。用户可以将该配置设置为“0”，以强制新数据写入新的文件组，或设置为更高的值以确保新数据被“填充”到现有小的文件组中，直到达到指定大小为止，但其会增加摄取延迟。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi > 数据管理维护
使用二次开发程序产生Unable to read HiveServer2异常如何处理 - MapReduce服务 MRS

回答问题原因使用的krb5.conf、user.keytab文件不是最新的，或者文件与示例代码里填写登录用户不匹配。使用客户端环境的时间与连接的集群时间差大于5分钟。解决措施检查代码下载最新的用户的认证凭据文件。查看集群环境和客户端环境的时间是否相差在5分钟之内，若超过5分钟，请修改客户端环境时间。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Hive开发指南（安全模式） > Hive应用开发常见问题
加载Hive数据 - MapReduce服务 MRS
加载Hive数据 - MapReduce服务 MRS

中的一个，需要注意当前连接的“HiveServer”的本地文件系统中是否存在需要加载的文件。在无法确定当前连接的是哪一个“HiveServer”的情况下建议在所有的“HiveServer”对应路径下放置相应文件，并注意文件的权限是否正确。父主题：开发Hive应用

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Hive开发指南 > 开发Hive应用
HBase访问多ZooKeeper场景安全认证 - MapReduce服务 MRS

ZooKeeper和客户应用访问第三方ZooKeeper。前提条件已获取样例工程运行所需的配置文件及认证文件，详细操作请参见准备连接HBase集群配置文件。配置样例代码以下为“src/main/resources”目录下提供的与认证相关的配置文件。 zoo.cfg # The configuration in

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HBase开发指南（安全模式） > 准备HBase应用开发环境 > 配置HBase应用安全认证
空值转换 - MapReduce服务 MRS
空值转换 - MapReduce服务 MRS

配置替换空值的指定值。 string 是无数据处理规则字段原值为null时，替换成指定的值。样例通过“CSV文件输入”算子，生成两个字段A和B。源文件如下图：配置“空值转换”算子，如下图：转换后，将A和B的值输出后的结果如下：父主题： Loader转换类算子

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > Loader算子帮助 > Loader转换类算子
查看Flume客户端日志 - MapReduce服务 MRS

安装Flume客户端。进入Flume客户端日志目录，默认为“/var/log/Bigdata”。执行如下命令查看日志文件列表。 ls -lR flume-client-* 日志文件示例如下： flume-client-1/flume: total 7672 -rw-------. 1 root

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume > Flume运维管理
查看Flume客户端日志 - MapReduce服务 MRS

安装Flume客户端。进入Flume客户端日志目录，默认为“/var/log/Bigdata”。执行如下命令查看日志文件列表。 ls -lR flume-client-* 日志文件示例如下： flume-client-1/flume: total 7672 -rw-------. 1 root

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flume > Flume运维管理
Hive应用开发简介 - MapReduce服务 MRS

安全及访问服务的可控制，在开源社区的Hive-3.1.0版本基础上，Hive新增如下特性：基于Kerberos技术的安全认证机制。数据文件加密机制。完善的权限管理。开源社区的Hive特性，请参见https://cwiki.apache.org/confluence/dis

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Hive开发指南（安全模式） > Hive应用开发概述
元数据管理 - MapReduce服务 MRS
元数据管理 - MapReduce服务 MRS

LakeFormation实例，元数据将存储于关联的数据库或LakeFormation实例中，不会随当前集群的删除而删除，多个MRS集群可共享同一份元数据。 Hive组件可选元数据存储方式功能在MRS 1.9.x及之后版本支持。父主题：产品功能

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 产品功能
使用二次开发程序产生Unable to read HiveServer2异常如何处理 - MapReduce服务 MRS

回答问题原因使用的krb5.conf、user.keytab文件不是最新的，或者文件与示例代码里填写登录用户不匹配。使用客户端环境的时间与连接的集群时间差大于5分钟。解决措施检查代码下载最新的用户的认证凭据文件。查看集群环境和客户端环境的时间是否相差在5分钟之内，若超过5分钟，请修改客户端环境时间。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Hive开发指南（安全模式） > Hive应用开发常见问题
INSERT...SELECT操作调优 - MapReduce服务 MRS

SELECT操作调优操作场景在以下几种情况下，执行INSERT...SELECT操作可以进行一定的调优操作。查询的数据是大量的小文件。查询的数据是较多的大文件。在beeline/thriftserver模式下使用非spark用户操作。操作步骤可对INSERT...SELECT操作做如下的调优操作。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > SQL和DataFrame调优
Spark Streaming性能调优 - MapReduce服务 MRS

每个分组会单独创建一个文件记录日志，从而避免应用长期运行时形成单个过大日志造成JobHistory无法读取的问题，设置为“0”时表示不分组。大部分Spark Streaming任务属于小型job，而且产生速度较快，会导致频繁的分组，产生大量日志小文件消耗磁盘I/O。建议增大此值，例如改为“1000”或更大值。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x
通过Hue管理Oozie作业 - MapReduce服务 MRS

形化的方式使用Oozie。 Hue界面主要用于文件、表等数据的查看与分析，禁止通过Hue界面对操作对象进行删除等高危管理操作。如需操作，建议在确认对业务没有影响后通过各组件的相应操作方法进行处理，例如使用HDFS客户端对HDFS文件进行操作，使用Hive客户端对Hive表进行操作。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hue > 创建Hue操作任务
Spark Streaming性能调优 - MapReduce服务 MRS

每个分组会单独创建一个文件记录日志，从而避免应用长期运行时形成单个过大日志造成JobHistory无法读取的问题，设置为“0”时表示不分组。大部分Spark Streaming任务属于小型job，而且产生速度较快，会导致频繁的分组，产生大量日志小文件消耗磁盘I/O。建议增大此值，例如改为“1000”或更大值。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本）
Storm常用参数 - MapReduce服务 MRS
Storm常用参数 - MapReduce服务 MRS

supervisor启动worker时使用的jvm选项。需要根据业务中对内存等的使用来进行设置，例如是简单业务处理，建议1G，即“-Xmx1G”；如果有窗口缓存，根据窗口大小计算：每条记录大小*周期*2。 -Xms1G -Xmx1G -XX:+UseG1GC -XX:+PrintGCDetails

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Storm
导入并配置HBase样例工程 - MapReduce服务 MRS

若需要在本地Windows调测HBase样例代码，需参考表1放置各样例项目所需的配置文件、认证文件：表1 放置各样例项目所需的配置文件/认证文件样例工程位置需放置的配置/认证文件 hbase-examples/hbase-example（单集群场景）需将以下文件放置在样例工程的“../src/main/resources/conf”目录下：

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HBase开发指南（安全模式） > 准备HBase应用开发环境
提升HBase BulkLoad工具批量加载效率 - MapReduce服务 MRS

BulkLoad工具批量加载效率操作场景批量加载功能采用了MapReduce jobs直接生成符合HBase内部数据格式的文件，然后把生成的StoreFiles文件加载到正在运行的集群。使用批量加载相比直接使用HBase的API会节约更多的CPU和网络资源。 ImportTSV是一个HBase的表数据加载工具。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase性能调优
MapReduce访问多组件样例程序开发思路 - MapReduce服务 MRS

获取Map输出中的最后一条数据。将数据输出到HBase。将数据保存到HDFS。数据规划创建HDFS数据文件。在Linux系统上新建文本文件，将log1.txt中的内容复制保存到data.txt。在HDFS上创建一个文件夹“/tmp/examples/multi-components/mapreduce/input/”，并上传data

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > MapReduce开发指南（普通模式） > 开发MapReduce应用 > MapReduce访问多组件样例程序
Java样例代码 - MapReduce服务 MRS
Java样例代码 - MapReduce服务 MRS

add("DROP TABLE child"); executeSql(url, sqlList); 样例工程中的data文件需要放到HDFS上的home目录下保证data文件和创建的表的所属的用户和用户组保持一致拼接JDBC URL。 HA模式下url的host和port必须为“ha-cluster”。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用 > 通过JDBC访问Spark SQL的程序

总条数： 4051

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi Clustering操作说明 - MapReduce服务 MRS

Hudi Clustering操作说明 - MapReduce服务 MRS

使用二次开发程序产生Unable to read HiveServer2异常如何处理 - MapReduce服务 MRS

加载Hive数据 - MapReduce服务 MRS

HBase访问多ZooKeeper场景安全认证 - MapReduce服务 MRS

空值转换 - MapReduce服务 MRS

查看Flume客户端日志 - MapReduce服务 MRS

查看Flume客户端日志 - MapReduce服务 MRS

Hive应用开发简介 - MapReduce服务 MRS

元数据管理 - MapReduce服务 MRS

使用二次开发程序产生Unable to read HiveServer2异常如何处理 - MapReduce服务 MRS

INSERT...SELECT操作调优 - MapReduce服务 MRS

Spark Streaming性能调优 - MapReduce服务 MRS

通过Hue管理Oozie作业 - MapReduce服务 MRS

Spark Streaming性能调优 - MapReduce服务 MRS

Storm常用参数 - MapReduce服务 MRS

导入并配置HBase样例工程 - MapReduce服务 MRS

提升HBase BulkLoad工具批量加载效率 - MapReduce服务 MRS

MapReduce访问多组件样例程序开发思路 - MapReduce服务 MRS

Java样例代码 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线