Apache Kylin 实战包含Kylin概述、Kylin安装、使用Kylin构建Cube、增量构建Cube、Cube优化、流式构建、实时OLAP等内容 Apache Druid包含Apache Druid简介及架构、Druid 部署、Druid入门案例、Druid 架构与原理、Druid实战案例等内容
clickhouse包含概述、安装、数据类型、表引擎、Merge Tree家族表引擎、HDFS、Mysql、Kafka、JDBC、副本和分片、SQL语法、选择查询等。 kudu包含概述、kudu的架构、安装和运行、kudu常用的api(java)、flink下沉数据到kudu、kudu表设计(扩展)等。
clickhouse作业包含创建MergeTree表,并测试CRUD操作、实现ClickHouse从kafka、MySql获取数据。 kudu的作业包含kuduAPI代码编写
计算领域锋利的武器Flink笔记包含Flink概述及入门案例、Flink体系结构及安装部署、Flink常用API及Window窗口机制、Flink watermark及state机制、Flink 并行度及KafkaConnector源码理解、Flink Table及作业提交的笔记
计算领域锋利的武器Flink的作业包含idea代码编写入门案例、window机制案例代码编写、watermark案例代码编写、state案例代码编写、并行度设置代码、理解FlinkKafka源码及flinktable案例代码编写和作业提交流程图
spark原理及源码剖析的笔记包含核心组件的运行机制(Master、Worker、SparkContext等)、任务调度的原理、Shuffle原理、内存管理、数据倾斜处理、Spark优化等内容
spark实战应用(下)的笔记包含实时流式计算框架Spark Streaming、Spark Streaming与Kafka整合及Spark GraphX图计算等
Scala编程包含Scala基础、控制结构和函数、数组和元组、类和对象、继承、特质、模式匹配和样例类、函数及抽象化、集合、隐式机制、扩展部分之类型参数中泛型类、泛型函数、协变和逆变及Akka等内容
PB级企业电商离线数仓项目实战(下)包含了电商分析之--核心交易、任务调度系统Airflow、元数据管理工具Atlas(扩展)、数据质量监控工具Griffin(扩展)及数据可视化的内容的笔记
电商分析之--核心交易、任务调度系统Airflow、元数据管理工具Atlas(扩展)、数据质量监控工具Griffin(扩展)及数据可视化的使用。