@fashengs
杨锦文 暂无简介
流处理极速开发框架, 简单易用的流处理计算平台
新一代爬虫平台,以图形化方式定义爬虫流程,不写代码即可完成爬虫。
Apache Spark的性能表现受到配置参数的影响,这些参数的调优往往由人力完成,然而不适当的参数配置可能严重地降低系统的性能表现。 本工具能够根据历史记录自动调整Apache spark的参数设置
在数据仓库建设中,经常会使用到数据血缘追踪方面的功能,本项目实现了对hql集合进行静态分析,获取hql对应的血缘图(表血缘 + 字段血缘)