gitextract_jbz91sxj/ ├── README.md ├── docs/ │ ├── 1条message中包含哪些信息.md │ ├── HDFS架构.md │ ├── HMaster宕机.md │ ├── HiveToMR.md │ ├── HiveUDF简单介绍.md │ ├── Hive中大表join小表的优化方法.md │ ├── Impala和hive的查询有哪些区别.md │ ├── MapReduce过程.md │ ├── RDD懒加载是什么意思.md │ ├── RDD有哪些特点.md │ ├── RDD的缓存级别都有哪些.md │ ├── Spark中的算子都有哪些.md │ ├── Spark的partitioner都有哪些.md │ ├── Yarn架构.md │ ├── Yarn调度MapReduce.md │ ├── ack有哪几种.md │ ├── flink中的sessionWindow怎样使用.md │ ├── flink中的时间概念.md │ ├── flink具体是如何实现exactlyonce语义.md │ ├── flink是如何实现反压的.md │ ├── flink的state是存储在哪里的.md │ ├── flink的window分类.md │ ├── flink的window实现机制.md │ ├── flink的部署模式都有哪些.md │ ├── hadoop1.x和hadoop2.x的区别.md │ ├── hadoop1.x的缺点.md │ ├── hadoopHA介绍.md │ ├── hadoop的常用配置文件有哪些.md │ ├── hbase如何设计rowkey.md │ ├── hbase的HA实现.md │ ├── hdfs写流程.md │ ├── hdfs创建一个文件的流程.md │ ├── hdfs读流程.md │ ├── hive中join都有哪些.md │ ├── hive内部表和外部表的区别.md │ ├── hive四种排序方式的区别.md │ ├── hive的metastore的三种模式.md │ ├── kafka与sparkstreaming集成.md │ ├── kafka与其他消息组件对比.md │ ├── kafka可以脱离zookeeper单独使用吗.md │ ├── kafka同时设置了7天和10G清除数据.md │ ├── kafka实现高吞吐的原理.md │ ├── kafka怎样保证不丢失消息.md │ ├── kafka怎样保证不重复消费.md │ ├── kafka有几种数据保留策略.md │ ├── spark2.0为什么放弃了akka而用netty.md │ ├── spark中cluster模式和client模式有什么区别.md │ ├── spark中的广播变量.md │ ├── spark从提交一个jar到最后返回结果.md │ ├── spark有哪几种join.md │ ├── spark的shuffle介绍.md │ ├── spark的stage是如何划分的.md │ ├── spark的内存管理机制.md │ ├── spark的各种HA.md │ ├── zk是怎样保证主从节点的状态同步.md │ ├── zk有几种部署模式.md │ ├── zk的分布式锁实现方式.md │ ├── zookeeper是什么.md │ ├── 一个spark程序的执行流程.md │ ├── 分析一下一段spark代码中哪些部分在Driver端执行.md │ ├── 启动hadoop集群会分别启动哪些进程.md │ ├── 大数据生态圈还有哪些选举协议.md │ ├── 如何清理过期数据.md │ ├── 如何通过offset寻找数据.md │ ├── 小文件过多会有什么危害.md │ ├── 怎样去处理数据倾斜.md │ ├── 按照学生科目取每个科目的TopN.md │ ├── 获取每个用户的前14次的数据.md │ ├── 讲一下Hbase架构.md │ ├── 讲一下flinkonyarn的部署.md │ ├── 讲一下flink的作业执行流程.md │ ├── 讲一下flink的运行架构.md │ ├── 讲一下hbase的写数据的流程.md │ ├── 讲一下hbase的存储结构.md │ ├── 讲一下hbase读数据的流程.md │ ├── 讲一下kafk的架构.md │ ├── 讲一下leader 选举过程.md │ ├── 讲一下spark的几种部署方式.md │ ├── 讲一下spark的运行架构.md │ ├── 讲一下zookeeper在kafka中的作用.md │ ├── 讲一下宽依赖和窄依赖.md │ └── 说一下zk的通知机制.md └── pictures/ └── 架构图.pptx