搜索_华为云

流式写入Hudi表 - MapReduce服务 MRS

本章节仅适用于MRS 3.3.1-LTS及之前版本。 HoodieDeltaStreamer流式写入 Hudi自带HoodieDeltaStreamer工具支持流式写入，也可以使用SparkStreaming以微批的方式写入。HoodieDeltaStreamer提供以下功能：支持Kafka，DFS多种数据源接入

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi写操作
使用Loader从HDFS导出数据到MOTService - MapReduce服务 MRS

段对表进行更新操作，MOTService外部表不支持Upsert语句，您可以使用Loader将文件从HDFS导出到MOTService从而批量更新数据。前提条件获取关系型数据库使用的用户和密码。输入的数据需为CSV格式文件。在FusionInsight Manager中创

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 创建Loader数据导出作业
Hudi数据表Compaction规范 - MapReduce服务 MRS

quet文件，大幅提升读取性能。规则有数据持续写入的表，24小时内至少执行一次compaction。对于MOR表，不管是流式写入还是批量写入，需要保证每天至少完成1次Compaction操作。如果长时间不做compaction，Hudi表的log将会越来越大，这必将会出现以下问题：

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Hudi数据表管理操作规范
客户端提示访问ZooKeeper失败 - MapReduce服务 MRS

keytabpath/user.keytab查看。如果集群有做过切换域名操作，需要保证url中使用的principal字段是新域名。如默认为hive/hadoop.hadoop.com@HADOOP.COM，当集群有切换域名的操作时，该字段需要进行相关修改。如域名为abc.com时，则此处应填写hive/hadoop

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hive
创建FlinkServer作业写入数据至HDFS文件系统 - MapReduce服务 MRS

no.acl.found”配置，修改参数值为true，保存配置即可。系统域名：可登录FusionInsight Manager，选择“系统 > 权限 > 域和互信”，查看“本端域”参数，即为当前系统域名。查看作业管理界面，作业状态为“运行中”。参考管理Kafka Topic

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > 创建FlinkServer作业
Spark Structured Streaming对接Kafka样例程序开发思路 - MapReduce服务 MRS

）。 <kafkaService>指kerberos服务名称（如kafka）。 <kafkaDomain>指kerberos域名（如hadoop.<系统域名>）。由于Spark Structured Streaming Kafka的依赖包在客户端的存放路径与其他依赖包不同，如其

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Structured Streaming对接Kafka样例程序
Spark Structured Streaming对接Kafka样例程序开发思路 - MapReduce服务 MRS

XT），<kafkaService>指kerberos服务名称（如kafka），<kafkaDomain>指kerberos域名（如hadoop.<系统域名>）。由于Spark Structured Streaming Kafka的依赖包在客户端的存放路径与其他依赖包不同，如其

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Structured Streaming对接Kafka样例程序
使用Hive加载HDFS数据并分析图书评分情况 - MapReduce服务 MRS

例如最终显示内容如下： ... INFO : 2021-10-14 19:53:42,427 Stage-2 map = 0%, reduce = 0% INFO : 2021-10-14 19:53:49,572 Stage-2 map = 100%, reduce = 0%

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
Linux下打包Storm业务 - MapReduce服务 MRS

打包业务的目的，是将IntelliJ IDEA代码生成的jar包与工程依赖的jar包，合并导出可提交的source.jar。打包需使用storm-jartool工具，可在Windows或Linux上进行。前提条件已安装Storm客户端。已执行打包Storm样例工程应用。当客户端所在主机不是集群

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Storm开发指南（安全模式） > 调测Storm应用 > 打包Storm业务
HetuEngine交互查询引擎概述 - MapReduce服务 MRS

依赖于具体的Connector，以及Connector相关的底层数据源或存储系统。数据源集群域名与HetuEngine集群域名不能相同，HetuEngine也不支持同时对接两个相同域名的数据源（Hive，Hbase，Hudi数据源）。数据源集群与HetuEngine集群节点业务平面网络互通。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine
配置MapReduce任务日志归档和清理机制 - MapReduce服务 MRS

ster产生，详细记录了作业启动时间、运行时间，每个任务启动时间、运行时间、Counter值等信息。此日志内容被HistoryServer解析以后用于查看作业执行的详细信息。任务日志记录了每个运行在Container中的任务输出的日志信息。默认情况下，任务日志只会存放在各Nod

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用MapReduce
配置MapReduce任务日志归档和清理机制 - MapReduce服务 MRS

ster产生，详细记录了作业启动时间、运行时间，每个任务启动时间、运行时间、Counter值等信息。此日志内容被HistoryServer解析以后用于查看作业执行的详细信息。任务日志记录了每个运行在Container中的任务输出的日志信息。默认情况下，任务日志只会存放在各Nod

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Mapreduce
向动态分区表中插入数据时，在重试的task中出现"Failed to CREATE - MapReduce服务 MRS

动态分区表插入数据的最后一步是读取shuffle文件的数据，再写入到表对应的分区文件中。当大面积shuffle文件损坏后，会引起大批量task失败，然后进行job重试。重试前Spark会将写表分区文件的句柄关闭，大批量task关闭句柄时HDFS无法及时处理。在task进行下一次重试时，句柄在NameNode端未被及时释放，即会发生"Failed

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > Spark Core
Apache Log4j2 远程代码执行漏洞（CVE-2021-44228）修复指导 - MapReduce服务 MRS

gz”上传至主OMS节点的“/home/omm”目录下。具体可参考如何上传本地文件到集群内节点？。使用root用户登录主OMS节点，修改补丁工具相应权限，切到omm用户下，并解压补丁工具至当前目录。 chown omm:wheel -R /home/omm/MRS_Log4j_Patch.tar.gz su

帮助中心 > MapReduce服务 MRS > 服务公告 > 漏洞公告
Spark REST API接口介绍 - MapReduce服务 MRS

API接口介绍功能简介 Spark的REST API以JSON格式展现Web UI的一些指标，提供用户一种更简单的方法去创建新的展示和监控的工具，并且支持查询正在运行的app和已经结束的app的相关信息。开源的Spark REST接口支持对Jobs、Stages、Storage、E

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
Spark REST API接口介绍 - MapReduce服务 MRS

API接口介绍功能简介 Spark的REST API以JSON格式展现Web UI的一些指标，提供用户一种更简单的方法去创建新的展示和监控的工具，并且支持查询正在运行的app和已经结束的app的相关信息。开源的Spark REST接口支持对Jobs、Stages、Storage、E

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > Spark应用开发常见问题 > Spark常用API介绍
配置Spark读取HBase表数据 - MapReduce服务 MRS

配置Spark读取HBase表数据操作场景 Spark on HBase为用户提供了在Spark SQL中查询HBase表，通过Beeline工具为HBase表进行存数据等操作。通过HBase接口可实现创建表、读取表、往表中插入数据等操作。 Spark On HBase 登录Manager界面，选择“集群

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x
基于binlog的MySQL数据同步到MRS集群中 - MapReduce服务 MRS

基于binlog的MySQL数据同步到MRS集群中本章节为您介绍使用Maxwell同步工具将线下基于binlog的数据迁移到MRS Kafka集群中的指导。 Maxwell是一个开源程序（https://maxwells-daemon.io），通过读取MySQL的binlog日

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Kafka > Kafka常见问题
向动态分区表中插入数据时，在重试的task中出现"Failed to CREATE - MapReduce服务 MRS

动态分区表插入数据的最后一步是读取shuffle文件的数据，再写入到表对应的分区文件中。当大面积shuffle文件损坏后，会引起大批量task失败，然后进行job重试。重试前Spark会将写表分区文件的句柄关闭，大批量task关闭句柄时HDFS无法及时处理。在task进行下一次重试时，句柄在NameNode端未被及时释放，即会发生"Failed

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > Spark Core
调用SpringBoot接口访问HBase/Phoenix应用安全认证 - MapReduce服务 MRS

zookeeper.server.principal 为ZooKeeper服务端Principal，格式为“zookeeper/hadoop.系统域名”，其中系统域名的值可通过登录Manager界面，选择“系统 > 权限 > 域和互信”，查看“本端域”参数获取。父主题：配置HBase应用安全认证

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HBase开发指南（安全模式） > 准备HBase应用开发环境 > 配置HBase应用安全认证

总条数： 1231

上一页
1
...
14
15
16
...
62
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

流式写入Hudi表 - MapReduce服务 MRS

使用Loader从HDFS导出数据到MOTService - MapReduce服务 MRS

Hudi数据表Compaction规范 - MapReduce服务 MRS

客户端提示访问ZooKeeper失败 - MapReduce服务 MRS

创建FlinkServer作业写入数据至HDFS文件系统 - MapReduce服务 MRS

Spark Structured Streaming对接Kafka样例程序开发思路 - MapReduce服务 MRS

Spark Structured Streaming对接Kafka样例程序开发思路 - MapReduce服务 MRS

使用Hive加载HDFS数据并分析图书评分情况 - MapReduce服务 MRS

Linux下打包Storm业务 - MapReduce服务 MRS

HetuEngine交互查询引擎概述 - MapReduce服务 MRS

配置MapReduce任务日志归档和清理机制 - MapReduce服务 MRS

配置MapReduce任务日志归档和清理机制 - MapReduce服务 MRS

向动态分区表中插入数据时，在重试的task中出现"Failed to CREATE - MapReduce服务 MRS

Apache Log4j2 远程代码执行漏洞（CVE-2021-44228）修复指导 - MapReduce服务 MRS

Spark REST API接口介绍 - MapReduce服务 MRS

Spark REST API接口介绍 - MapReduce服务 MRS

配置Spark读取HBase表数据 - MapReduce服务 MRS

基于binlog的MySQL数据同步到MRS集群中 - MapReduce服务 MRS

向动态分区表中插入数据时，在重试的task中出现"Failed to CREATE - MapReduce服务 MRS

调用SpringBoot接口访问HBase/Phoenix应用安全认证 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线