sparkstreaming读取kafka数据,读不到怎么判断

发布网友发布时间：2022-04-30 01:40

共1个回答

热心网友时间：2022-04-14 07:16

基于Receiver方式实现会利用Kakfa的高层消费API，和所有的其他Receivers一样，接受到的数据会保存到excutors中，然后由spark Streaming 来启动Job进行处理这些数据。
在默认的配置下，这种方式在失败的情况下，会丢失数据，如果要保证零数据丢失，需要启用WAL(Write Ahead Logs)。它同步将接受到数据保存到分布式文件系统上比如HDFS。所以数据在出错的情况下可以恢复出来。
使用两个步骤：
1、添加依赖：spark-streaming-kafka_2.10-1.3.0
2、编程：import org.apache.spark.streaming.kafka._

声明：本网页内容为用户发布，旨在传播知识，不代表本网认同其观点，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。E-MAIL:11247931@qq.com