检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
使用BulkLoad工具向HBase迁移数据 HBase的数据都是存储在HDFS中的,数据导入即是加载存放在HDFS中的数据到HBase表中。Apache HBase提供了“Import”和“ImportTsv”工具用于批量导入HBase数据。
父主题: 增强HBase BulkLoad工具数据迁移能力
提升HBase BulkLoad工具批量加载效率 操作场景 HBase BulkLoad批量加载功能采用了MapReduce jobs直接生成符合HBase内部数据格式的文件,然后把生成的StoreFiles文件加载到正在运行的集群。
增强HBase BulkLoad工具数据迁移能力 使用BulkLoad工具批量导入HBase数据 使用BulkLoad工具批量更新HBase数据 使用BulkLoad工具批量删除HBase数据 使用BulkLoad工具查询HBase表的行统计数 BulkLoad工具配置文件说明 父主题
ImportTsv工具执行失败报“Permission denied”异常 问题 当使用与Region Server相同的Linux用户(例如omm用户)但不同的kerberos用户(例如admin用户)时,为什么ImportTsv工具执行失败报“Permission denied
解决办法 登录DBService主节点(绑定有DBService浮动IP的master节点)。
使用Spark小文件合并工具说明 本章节仅适用于MRS 3.3.0及之后版本。 配置场景 小文件自动合并特性开启后,Spark将数据先写入临时目录,再去检测每个分区的平均文件大小是否小于16MB(默认值)。
使用Flume客户端加密工具 安装Flume客户端后,配置文件的部分参数可能需要填写加密的字符,Flume客户端中提供了加密工具。 安装Flume客户端。 登录安装Flume客户端的节点,并切换到客户端安装目录。例如“/opt/FlumeClient”。
使用Flume客户端加密工具 安装Flume客户端后,配置文件的部分参数可能需要填写加密的字符,Flume客户端中提供了加密工具。 安装Flume客户端。 登录安装Flume客户端的节点,并切换到客户端安装目录。例如“/opt/FlumeClient”。
图2 导入数据 步骤3:创建HBase表 登录集群的FusionInsight Manager页面(如果没有弹性IP,需提前购买弹性IP),新建一个用户hbasetest,绑定用户组supergroup,绑定角色System_administrator。
ImportTsv工具执行失败报“Permission denied”异常 问题 当使用与Region Server相同的Linux用户(例如omm用户)但不同的kerberos用户(例如admin用户)时,为什么ImportTsv工具执行失败报“Permission denied
父主题: 增强HBase BulkLoad工具数据迁移能力
com.huawei.bigdata.flink.examples.TestPipeline_NettySink。 com.huawei.bigdata.flink.examples.TestPipeline_NettySource1。
com.huawei.bigdata.flink.examples.TestPipelineNettySink。 com.huawei.bigdata.flink.examples.TestPipelineNettySource1。
com.huawei.bigdata.flink.examples.TestPipeline_NettySink。 com.huawei.bigdata.flink.examples.TestPipeline_NettySource1。
com.huawei.bigdata.flink.examples.TestPipeline_NettySink。 com.huawei.bigdata.flink.examples.TestPipeline_NettySource1。
Job Pipeline流图结构 Pipeline是由Flink的多个Job通过TCP连接起来,上游Job可以直接向下游Job发送数据。这种发送数据的流图称为Job Pipeline,如图1所示。
com.huawei.bigdata.flink.examples.TestPipelineNettySink。 com.huawei.bigdata.flink.examples.TestPipelineNettySource1。
com.huawei.bigdata.flink.examples.TestPipeline_NettySink。 com.huawei.bigdata.flink.examples.TestPipeline_NettySource1。
Flink Job Pipeline样例程序(Scala) 发送消息 下面代码片段仅为演示,完整代码参见FlinkPipelineScalaExample样例工程下的com.huawei.bigdata.flink.examples.Information: package com.huawei.bigdata.flink.examples