华为云首页用户手册

MAPREDUCE服务 MRS-Spark Structured Streaming状态操作样例程序开发思路:数据规划

MAPREDUCE服务 MRS-Spark Structured Streaming状态操作样例程序开发思路:数据规划

时间：2024-06-13 09:39:22

MAPREDUCE服务 MRS Spark Structured Streaming状态操作样例程序

数据规划

在kafka中生成模拟数据（需要有Kafka权限用户）。
确保集群安装完成，包括安装HDFS、Yarn、Spark2x和Kafka服务。
将Kafka的Broker配置参数“allow.everyone.if.no.acl.found”的值修改为“true”。
创建Topic。
{zkQuorum}表示ZooKeeper集群信息，格式为IP:port。

$KAFKA_HOME/bin/kafka-topics.sh --create --zookeeper {zkQuorum}/kafka --replication-factor 1 --partitions 1 --topic {Topic}
启动Kafka的Producer，向Kafka发送数据。
{ClassPath}表示工程jar包的存放路径，详细路径由用户指定，可参考在Linux环境中调测Spark应用章节中导出jar包的操作步骤。

java -cp $SPARK_HOME/conf:$SPARK_HOME/jars/*:$SPARK_HOME/jars/streamingClient010/*:{ClassPath} com.huawei.bigdata.spark.examples.KafkaProducer {brokerlist} {topic} {number of events produce every 0.02s}

示例：

java -cp /opt/client/Spark2x/spark/conf:/opt/StructuredStreamingState-1.0.jar:/opt/client/Spark2x/spark/jars/*:/opt/client/Spark2x/spark/jars/streamingClient010/* com.huawei.bigdata.spark.examples.KafkaProducer xxx.xxx.xxx.xxx:21005,xxx.xxx.xxx.xxx:21005,xxx.xxx.xxx.xxx:21005 mytopic 10

上一篇：MAPREDUCE服务 MRS-HetuEngine应用开发流程介绍

下一篇：MAPREDUCE服务 MRS-导入并配置Flink样例工程:样例工程运行依赖包参考信息

新客秒杀 2核2G 3M L实例

68元/年

普惠上云领千元上云礼券

立即前往

企业专享 X实例 4核8G 5M

888元/年

热门域名 1元随心购

1元/年起

MAPREDUCE服务 MRS-Spark Structured Streaming状态操作样例程序开发思路:数据规划

意见反馈

0/200

提交成功！非常感谢您的反馈，我们会继续努力做到更好反馈提交失败！请稍后重试！

推荐文章

解决方案
相关专题