华为云首页用户手册

MAPREDUCE服务 MRS-使用Spark BulkLoad工具同步数据到HBase表中:操作步骤

MAPREDUCE服务 MRS-使用Spark BulkLoad工具同步数据到HBase表中:操作步骤

时间：2025-03-07 18:18:28

MAPREDUCE服务 MRS HBase企业级能力增强

操作步骤

以客户端安装用户，登录安装客户端的节点。
执行以下命令切换到客户端目录。

cd 客户端安装目录
执行以下命令配置环境变量。

source bigdata_env
如果当前集群已启用Kerberos认证，执行以下命令认证当前用户

kinit 组件业务用户

如果当前集群未启用Kerberos认证，则执行以下命令设置Hadoop用户名：

export HADOOP_USER_NAME=hbase
进入Spark客户端目录，执行如下命令，同步数据到HBase目标表中。

cd Spark/spark/bin

例如，执行以下命令同步test.orc_table表的所有数据到HBase的test:orc_table表中，使用id+uuid组合作为rowkey列，输出路径指定为“/tmp/orc_table”：

spark-submit --master yarn --deploy-mode cluster --jars 客户端安装目录/HBase/hbase/lib/protobuf-java-2.5.0.jar,客户端安装目录/HBase/hbase/conf/* --conf spark.yarn.user.classpath.first=true --class com.huawei.hadoop.hbase.tools.bulkload.SparkBulkLoadTool 客户端安装目录/HBase/hbase/lib/hbase-it-bulk-load-*.jar -sql "select * from test.orc_table" -tb "test:orc_table" -rc "id,uuid" -op "/tmp/orc_table"

上一篇：MAPREDUCE服务 MRS-使用Spark BulkLoad工具同步数据到HBase表中:前提条件

下一篇：MAPREDUCE服务 MRS-使用Spark BulkLoad工具同步数据到HBase表中:前提条件

开年采购季抽奖赢万元免单

立即前往

续费同价 L实例 2核2G 4M

98元/年

企业专享 X实例 2核4G 5M

198元/年

热门域名 1元随心购

1元/年起

MAPREDUCE服务 MRS-使用Spark BulkLoad工具同步数据到HBase表中:操作步骤

意见反馈

0/200

提交成功！非常感谢您的反馈，我们会继续努力做到更好反馈提交失败！请稍后重试！

推荐文章

解决方案
相关专题