一个完善的Spark Streaming二次封装开源框架,包含:实时流任务调度、kafka偏移量管理,web后台管理,web api启动、停止spark streaming,宕机告警、自动重启等等功能支持,用户只需要关心业务代码,无需关注繁琐的技术细节,大大提高实时流开发效率和难度(附demo)。
商品类目预测,使用Spring Boot开发框架和Spark MLlib机器学习框架,通过TF-IDF和Bayes算法,训练出一个商品类目预测模型。该模型可以根据商品名称自动预测出商品类目。项目对外提供RESTFul接口。