Skip to content

SparkStreaming新手友好向模板,简化SparkStreaming开发

Notifications You must be signed in to change notification settings

ludengke95/spark-streaming-kafka-template

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

36 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

spark-streaming-kafka-template

1. 为何会产生一个名叫 spark-streaming-kafka-template 的轮子(现在估计连轮子都算不上)

  • 是不是还在头疼 SparkStreaming 如何组合kafka,SparkStateStreaming怎么实现数据去重
  • Kafka 引入了,但是 Offset 怎么存储又是个问题,是由 kafka 自动管理还是,存储到 zk ,还是写到 mysql。
  • spark-streaming-kafka-template 就是为了解决诸如此类的问题应运而生的,希望能够帮助你简化开发。

这个项目的初衷就是为了简化 SparkStreaming 对接 Kafka,至于这个轮子圆不圆,走不走的远就要靠大家来检验了。

2. 计划功能

  • Spark Streaming Kafka Offset in Zookeeper
  • Spark Streaming Kafka Offset in Mysql
  • Spark Streaming Kafka Offset in Kafka
  • Spark State Streaming Kafka Offset in Zookeeper
  • Spark State Streaming Kafka Offset in Mysql
  • Spark State Streaming Kafka Offset in Kafka
  • Spark Streaming Kafka Export to Hive

3. 文档说明

  1. spark-streaming-kafka-template 文档

4. 感谢一下开源项目

  • @code4craft/webmagic:十分感谢 webmegic ,其实这个项目的一些想法也是源于这个项目,可以看出作者逻辑十分清晰,代码扩展也很简单,希望 spark-streaming-kafka-template 也能够像 webmagic 一样简单,简化更多人的 spark 开发。
  • @looly/hutool:第一次见到这个项目的时候,我都惊艳到了,功能挺全的。而且比较实用,简单,推荐给各位大哥。

5. 后言

  • 项目还在进行中,只有我一个人,如果你觉得可以动动你的小手,点一点 fork,star。
  • 如果你也对这个项目有想法,可以加入我们(一个人可以说我们嘛?)
    联系方式:ludengke95@gmail.com/ludengke95@163.com

About

SparkStreaming新手友好向模板,简化SparkStreaming开发

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages