搜索_华为云

使用Spark执行Hudi样例程序开发思路 - MapReduce服务 MRS

使用Spark执行Hudi样例程序开发思路场景说明本章节介绍如何使用Spark操作Hudi执行插入数据、查询数据、更新数据、增量查询、特定时间点查询、删除数据等操作。详细代码请参考样例代码。打包项目通过IDEA自带的Maven工具，打包项目，生成jar包。具体操作请参考在Linux环境中调测Spark应用。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > 使用Spark执行Hudi样例程序
使用BulkLoad工具批量更新HBase数据 - MapReduce服务 MRS

使用BulkLoad工具批量更新HBase数据操作场景 HBase BulkLoad工具支持根据RowKey的命名规则、RowKey的范围、字段名以及字段值进行批量更新数据。使用BulkLoad工具批量更新HBase数据执行如下命令更新从“row_start”到“row_s

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase企业级能力增强 > 增强HBase BulkLoad工具数据迁移能力
Hive支持ZSTD压缩格式 - MapReduce服务 MRS

Hive支持ZSTD压缩格式 ZSTD（全称为Zstandard）是一种开源的无损数据压缩算法，其压缩性能和压缩比均优于当前Hadoop支持的其他压缩格式，本特性使得Hive支持ZSTD压缩格式的表。Hive支持基于ZSTD压缩的存储格式有常见的ORC、RCFile、TextFi

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive数据存储及加密配置
配置仅Hive管理员用户能创建库和在default库建表 - MapReduce服务 MRS

配置仅Hive管理员用户能创建库和在default库建表操作场景 Hive支持配置仅有Hive管理员可以创建库和在default库中建表，其他用户需通过Hive管理员授权才可使用库。开启本功能之后，会限制普通用户新建库和在default库新建表。请充分考虑实际应用场景，再决定是否做出调整。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive企业级能力增强
查询Impala数据 - MapReduce服务 MRS

查询Impala数据功能简介本小节介绍了如何使用Impala SQL对数据进行查询分析。从本节中可以掌握如下查询分析方法。 SELECT查询的常用特性，如JOIN等。加载数据进指定分区。如何使用Impala自带函数。如何使用自定义函数进行查询分析，如何创建、定义自定义函数请见开发Impala用户自定义函数。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Impala开发指南（安全模式） > 开发Impala应用
Spark SQL性能调优 - MapReduce服务 MRS

Spark SQL性能调优 Spark SQL join优化优化数据倾斜场景下的Spark SQL性能优化小文件场景下的Spark SQL性能 Spark INSERT SELECT语句调优配置多并发客户端连接JDBCServer 配置SparkSQL的分块个数 Spark动态分区插入场景内存优化

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x
Web页面访问类 - MapReduce服务 MRS

Web页面访问类如何修改开源组件Web页面会话超时时间？ MRS租户管理中的动态资源计划页面无法刷新怎么办？ Kafka Topic监控页签在Manager页面不显示如何处理？访问HDFS、Hue、Yarn、Flink、HetuEngine等组件的WebUI界面报错或部分页面不可用如何处理？

帮助中心 > MapReduce服务 MRS > 常见问题
CarbonData性能调优常见配置参数 - MapReduce服务 MRS

CarbonData性能调优常见配置参数操作场景 CarbonData的性能与配置参数相关，本章节提供了能够提升性能的相关配置介绍。操作步骤用于CarbonData查询的配置介绍，详情请参见表1和表2。表1 Shuffle过程中，启动Task的个数参数 spark.sql

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData性能调优
配置使用分布式缓存执行MapReduce任务 - MapReduce服务 MRS

配置使用分布式缓存执行MapReduce任务配置场景本章节操作适用于MRS 3.x及之后版本。分布式缓存在两种情况下非常有用。滚动升级在升级过程中，应用程序必须保持文字内容（jar文件或配置文件）不变。而这些内容并非基于当前版本的Yarn，而是要基于其提交时的版本。一般

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Mapreduce
恢复MRS集群组件数据 - MapReduce服务 MRS

恢复MRS集群组件数据恢复Manager数据（MRS 2.x及之前版本）恢复Manager数据（MRS 3.x及之后版本）恢复CDL业务数据恢复ClickHouse元数据恢复ClickHouse业务数据恢复DBService元数据恢复Flink元数据恢复HBase元数据

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 备份恢复MRS集群数据
调测IoTDB应用 - MapReduce服务 MRS
调测IoTDB应用 - MapReduce服务 MRS

调测IoTDB应用在本地Windows环境中调测IoTDB应用在Linux环境中调测JDBC或Session应用在Flink WebUI和Linux环境中调测Flink应用在Linux环境中调测Kafka应用在IoTDBServer节点调测UDF应用父主题： IoTDB开发指南（安全模式）

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > IoTDB开发指南（安全模式）
调测Kafka应用 - MapReduce服务 MRS
调测Kafka应用 - MapReduce服务 MRS

调测Kafka应用调测Kafka Producer样例程序调测Kafka Consumer样例程序调测Kafka High level Streams样例程序调测Kafka Low level Streams样例程序调测Kafka Token认证机制样例程序父主题： Kafka开发指南（安全模式）

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Kafka开发指南（安全模式）
合并CarbonData表Segments - MapReduce服务 MRS

合并CarbonData表Segments 操作场景频繁的数据获取导致在存储目录中产生许多零碎的CarbonData文件。由于数据排序只在每次加载时进行，所以，索引也只在每次加载时执行。这意味着，对于每次加载都会产生一个索引，随着数据加载数量的增加，索引的数量也随之增加。由于每

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData数据分析
合并CarbonData表Segments - MapReduce服务 MRS

合并CarbonData表Segments 操作场景频繁的数据获取导致在存储目录中产生许多零碎的CarbonData文件。由于数据排序只在每次加载时进行，所以，索引也只在每次加载时执行。这意味着，对于每次加载都会产生一个索引，随着数据加载数量的增加，索引的数量也随之增加。由于每

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData数据分析
Flink流式读Hudi表规则 - MapReduce服务 MRS

Flink流式读Hudi表规则 Flink流式读Hudi表参数规范如下所示。表1 Flink流式读Hudi表参数规范参数名称是否必填参数描述示例 Connector 必填读取表类型。 hudi Path 必填表存储的路径。根据实际情况填写 table.type 必填

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink on Hudi开发规范 > Flink流式读Hudi表规范
回滚补丁后操作 - MapReduce服务 MRS

回滚补丁后操作回退HDFS上的组件包登录集群主节点并执行以下命令： su - omm cd /opt/Bigdata/patches/{MRS补丁版本号}/client/ source /opt/Bigdata/client/bigdata_env 所有涉及{MRS补丁版本号

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群补丁说明 > MRS 3.2.0-LTS.1.9补丁说明 > 回滚补丁
安装补丁前准备 - MapReduce服务 MRS

安装补丁前准备安装补丁前需要手动进行以下相关检查。检查所有节点管理平面网络是否互通登录FusionInsight Manager界面，选择“运维 > 告警 > 告警”。查看当前集群是否存在“ALM-12089 节点间网络互通异常”或“节点故障”等告警。是，节点间网络不互通，请联系运维人员修复。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群补丁说明 > MRS 3.2.0-LTS.1.8补丁说明
配置Spark Executor退出时执行自定义代码 - MapReduce服务 MRS

配置Spark Executor退出时执行自定义代码本章节仅适用于MRS 3.2.0及之后版本。配置场景通过配置如下参数可以实现Executor退出时执行自定义代码。配置参数在Spark客户端的“spark-defaults.conf”配置文件中进行设置。参数说明默认值

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强
准备本地应用开发环境 - MapReduce服务 MRS

准备本地应用开发环境选择Windows开发环境下，安装Eclipse，安装JDK。 JDK使用1.8版本，Eclipse使用4.3.2及以上版本。若使用IBM JDK，请确保Eclipse中的JDK配置为IBM JDK。若使用Oracle JDK，请确保Eclipse中的JDK配置为Oracle

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Hive开发指南 > 准备Hive应用开发环境
配置仅Hive管理员用户能创建库和在default库建表 - MapReduce服务 MRS

配置仅Hive管理员用户能创建库和在default库建表操作场景此功能在MRS 3.x之前版本适用于Hive，Spark。在MRS3.x及后续版本适用于Hive，Spark2x。开启此功能后，仅有Hive管理员可以创建库和在default库中建表，其他用户需通过Hive管理员授权才可使用库。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive企业级能力增强

总条数： 5298

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Spark执行Hudi样例程序开发思路 - MapReduce服务 MRS

使用BulkLoad工具批量更新HBase数据 - MapReduce服务 MRS

Hive支持ZSTD压缩格式 - MapReduce服务 MRS

配置仅Hive管理员用户能创建库和在default库建表 - MapReduce服务 MRS

查询Impala数据 - MapReduce服务 MRS

Spark SQL性能调优 - MapReduce服务 MRS

Web页面访问类 - MapReduce服务 MRS

CarbonData性能调优常见配置参数 - MapReduce服务 MRS

配置使用分布式缓存执行MapReduce任务 - MapReduce服务 MRS

恢复MRS集群组件数据 - MapReduce服务 MRS

调测IoTDB应用 - MapReduce服务 MRS

调测Kafka应用 - MapReduce服务 MRS

合并CarbonData表Segments - MapReduce服务 MRS

合并CarbonData表Segments - MapReduce服务 MRS

Flink流式读Hudi表规则 - MapReduce服务 MRS

回滚补丁后操作 - MapReduce服务 MRS

安装补丁前准备 - MapReduce服务 MRS

配置Spark Executor退出时执行自定义代码 - MapReduce服务 MRS

准备本地应用开发环境 - MapReduce服务 MRS

配置仅Hive管理员用户能创建库和在default库建表 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线