数据平台建设过程中需要对数据血缘进行解析,通过对血缘数据的探索,可以快速获取数据,加快数据开发的效率。 对报表SQL进行解析获取语法树,从而进一步获取列级的血缘,生成报表页面与数据源的关系。
数据平台建设过程中需要对数据血缘进行解析,通过对血缘数据的探索,可以快速获取数据,加快数据开发的效率。 对报表SQL进行解析获取语法树,从而进一步获取列级的血缘,生成报表页面与数据源的关系。
数仓中指标体系需要清晰合理的命名规范,本仓库基于Python+Networkx构建了基于命名的有限状态自动机,实现了命名的规范化验证,同时能够进行自动补全。
针对电商平台亿级数据的用户画像系统demo。该系统基于Flink流处理引擎搭建,能够生成电商平台用户的画像数据。画像数据可以帮助电商平台运营者深入了解用户,从而可以针对性的进行商品推荐与广告投放,从而增加用户的粘度与平台的趣味性,具有非常高的商业价值。详情请参考README.md文件。
最近一年贡献:18 次
最长连续贡献:1 日
最近连续贡献:1 日
贡献度的统计数据包括代码提交、创建任务 / Pull Request、合并 Pull Request,其中代码提交的次数需本地配置的 git 邮箱是 Gitee 帐号已确认绑定的才会被统计。