MAPREDUCE服务 MRS-使用Hue提交Oozie Distcp作业:操作步骤
操作步骤
- 创建工作流,请参考使用Hue创建工作流。
- 在工作流编辑页面,选择“DistCp”按钮,将其拖到操作区中。
- 当前DistCp操作是否是跨集群操作。
- 对两个集群进行跨Manager集群互信。
- 在弹出的“Distcp”窗口中配置“源”的值,例如“hdfs://hacluster/user/admin/examples/input-data/text/data.txt”。配置“目标”的值,例如“hdfs://target_ip:target_port/user/admin/examples/output-data/distcp-workflow/data.txt”。然后单击“添加”。
- 单击右上角的配置按钮,在打开的“属性”页签配置界面中,单击“属性+”,在左边文本框中填写属性名称“oozie.launcher.mapreduce.job.hdfs-servers”,在右边文本框中填写属性值“hdfs://source_ip:source_port,hdfs://target_ip:target_port”,执行8。
source_ip:源集群的HDFS的NameNode的业务地址。
source_port:源集群的HDFS的NameNode的端口号。
target_ip:目标集群的HDFS的NameNode的业务地址。
target_port:目标集群的HDFS的NameNode的端口号。
- 在弹出的“Distcp”窗口中配置“源”的值,例如“/user/admin/examples/input-data/text/data.txt”。配置“目标”的值,例如“/user/admin/examples/output-data/distcp-workflow/data.txt”。然后单击“添加”。
- 单击右上角的配置按钮,在打开的配置界面中,单击“删除+”,添加删除目录,例如“/user/admin/examples/output-data/distcp-workflow”。
- 单击Oozie编辑器右上角的。
保存前如果需要修改作业名称(默认为“My Workflow”),可以直接单击该名称进行修改,例如“Distcp-Workflow”。
- 保存完成后,单击,提交该作业。
作业提交后,可通过Hue界面查看作业的详细信息、日志、进度等相关内容。
- MapReduce服务_什么是Hue_如何使用Hue
- MapReduce服务_如何使用MapReduce服务_MRS集群客户端安装与使用
- MapReduce服务_什么是Loader_如何使用Loader
- MRS备份恢复_MapReduce备份_数据备份
- MapReduce服务_什么是存算分离_如何配置MRS集群存算分离
- 大数据分析是什么_使用MapReduce_创建MRS服务
- MapReduce服务_什么是Yarn_如何使用Yarn
- MapReduce服务_什么是HetuEngine_如何使用HetuEngine
- MapReduce服务_什么是Kafka_如何使用Kafka
- 什么是Spark SQL作业_数据湖探索DLISpark SQL作业