MAPREDUCE服务 MRS-Spark Structured Streaming状态操作样例程序开发思路:数据规划
数据规划
- 在kafka中生成模拟数据(需要有Kafka权限用户)
- 确保集群安装完成,包括HDFS、Yarn、Spark2x和Kafka。
- 创建Topic。
{zkQuorum}表示ZooKeeper集群信息,格式为IP:port。
$KAFKA_HOME/bin/kafka-topics.sh --create --zookeeper {zkQuorum}/kafka --replication-factor 1 --partitions 1 --topic {Topic}
- 启动Kafka的Producer,向Kafka发送数据。
{ClassPath}表示工程jar包的存放路径,详细路径由用户指定,可参考在Linux环境中编包并运行Spark程序章节中导出jar包的操作步骤。
java -cp $SPARK_HOME/conf:$SPARK_HOME/jars/*:$SPARK_HOME/jars/streamingClient010/*:{ClassPath} com.huawei.bigdata.spark.examples.KafkaProducer {brokerlist} {topic} {number of events produce every 0.02s}
示例:
java -cp /opt/client/Spark2x/spark/conf:/opt/StructuredStreamingState-1.0.jar:/opt/client/Spark2x/spark/jars/*:/opt/client/Spark2x/spark/jars/streamingClient010/* com.huawei.bigdata.spark.examples.KafkaProducer xxx.xxx.xxx.xxx:21005,xxx.xxx.xxx.xxx:21005,xxx.xxx.xxx.xxx:21005 mytopic 10
- 什么是Spark_如何使用Spark_Spark的功能是什么
- 小程序免费开发_免费小程序开发平台_免费开发小程序_免费的小程序平台
- GaussDB实例状态_GaussDB数据库实例状态_高斯数据库实例状态_华为云
- 免费店铺小程序_免费制作小程序_小程序免费开发平台_免费的小程序
- 免费小程序_免费下载小程序_小程序免费开发_零售管理_教育
- 函数工作流FunctionGraph支持毫秒级响应文件处理_函数工作流_华为云FunctionGraph-华为云
- GaussDB操作_GaussDB版本_高斯数据库操作
- GaussDB开发_GaussDB数据库开发_高斯数据库开发_华为云
- 数据治理中心_数据开发_数据开发示例_使用教程-华为云
- GaussDB怎么样_华为云数据库_高斯数据库怎么样-华为云