gitextract_zbjfquu6/ ├── .gitignore ├── README.md ├── code/ │ ├── Flink/ │ │ ├── flink-basis-java/ │ │ │ ├── pom.xml │ │ │ └── src/ │ │ │ └── main/ │ │ │ ├── java/ │ │ │ │ └── com/ │ │ │ │ └── heibaiying/ │ │ │ │ └── StreamingJob.java │ │ │ └── resources/ │ │ │ └── log4j.properties │ │ ├── flink-basis-scala/ │ │ │ ├── pom.xml │ │ │ └── src/ │ │ │ └── main/ │ │ │ ├── resources/ │ │ │ │ ├── log4j.properties │ │ │ │ └── wordcount.txt │ │ │ └── scala/ │ │ │ └── com/ │ │ │ └── heibaiying/ │ │ │ ├── WordCountBatch.scala │ │ │ └── WordCountStreaming.scala │ │ ├── flink-kafka-integration/ │ │ │ ├── pom.xml │ │ │ └── src/ │ │ │ └── main/ │ │ │ ├── java/ │ │ │ │ └── com/ │ │ │ │ └── heibaiying/ │ │ │ │ ├── CustomSinkJob.java │ │ │ │ ├── KafkaStreamingJob.java │ │ │ │ ├── bean/ │ │ │ │ │ └── Employee.java │ │ │ │ └── sink/ │ │ │ │ └── FlinkToMySQLSink.java │ │ │ └── resources/ │ │ │ └── log4j.properties │ │ └── flink-state-management/ │ │ ├── pom.xml │ │ └── src/ │ │ └── main/ │ │ ├── java/ │ │ │ └── com/ │ │ │ └── heibaiying/ │ │ │ ├── keyedstate/ │ │ │ │ ├── KeyedStateJob.java │ │ │ │ ├── ThresholdWarning.java │ │ │ │ └── ThresholdWarningWithTTL.java │ │ │ └── operatorstate/ │ │ │ ├── OperatorStateJob.java │ │ │ └── ThresholdWarning.java │ │ └── resources/ │ │ └── log4j.properties │ ├── Hadoop/ │ │ ├── hadoop-word-count/ │ │ │ ├── pom.xml │ │ │ └── src/ │ │ │ └── main/ │ │ │ ├── java/ │ │ │ │ └── com/ │ │ │ │ └── heibaiying/ │ │ │ │ ├── WordCountApp.java │ │ │ │ ├── WordCountCombinerApp.java │ │ │ │ ├── WordCountCombinerPartitionerApp.java │ │ │ │ ├── component/ │ │ │ │ │ ├── CustomPartitioner.java │ │ │ │ │ ├── WordCountMapper.java │ │ │ │ │ └── WordCountReducer.java │ │ │ │ └── utils/ │ │ │ │ └── WordCountDataUtils.java │ │ │ └── resources/ │ │ │ └── log4j.properties │ │ └── hdfs-java-api/ │ │ ├── pom.xml │ │ └── src/ │ │ ├── main/ │ │ │ └── java/ │ │ │ └── com/ │ │ │ └── heibaiying/ │ │ │ └── utils/ │ │ │ └── HdfsUtils.java │ │ └── test/ │ │ └── java/ │ │ └── HdfsTest.java │ ├── Hbase/ │ │ ├── hbase-java-api-1.x/ │ │ │ ├── pom.xml │ │ │ └── src/ │ │ │ ├── main/ │ │ │ │ └── java/ │ │ │ │ └── com/ │ │ │ │ └── heibaiying/ │ │ │ │ └── HBaseUtils.java │ │ │ └── test/ │ │ │ └── java/ │ │ │ └── com/ │ │ │ └── heibaiying/ │ │ │ └── HbaseUtilsTest.java │ │ ├── hbase-java-api-2.x/ │ │ │ ├── pom.xml │ │ │ └── src/ │ │ │ ├── main/ │ │ │ │ └── java/ │ │ │ │ └── com/ │ │ │ │ └── heibaiying/ │ │ │ │ └── HBaseUtils.java │ │ │ └── test/ │ │ │ └── java/ │ │ │ └── heibaiying/ │ │ │ └── HBaseUtilsTest.java │ │ └── hbase-observer-coprocessor/ │ │ ├── pom.xml │ │ └── src/ │ │ └── main/ │ │ └── java/ │ │ └── com/ │ │ └── heibaiying/ │ │ └── AppendRegionObserver.java │ ├── Kafka/ │ │ └── kafka-basis/ │ │ ├── pom.xml │ │ └── src/ │ │ └── main/ │ │ └── java/ │ │ └── com/ │ │ └── heibaiying/ │ │ ├── consumers/ │ │ │ ├── ConsumerASyn.java │ │ │ ├── ConsumerASynAndSyn.java │ │ │ ├── ConsumerASynWithOffsets.java │ │ │ ├── ConsumerExit.java │ │ │ ├── ConsumerGroup.java │ │ │ ├── ConsumerSyn.java │ │ │ ├── RebalanceListener.java │ │ │ └── StandaloneConsumer.java │ │ └── producers/ │ │ ├── ProducerASyn.java │ │ ├── ProducerSyn.java │ │ ├── ProducerWithPartitioner.java │ │ ├── SimpleProducer.java │ │ └── partitioners/ │ │ └── CustomPartitioner.java │ ├── Phoenix/ │ │ ├── spring-boot-mybatis-phoenix/ │ │ │ ├── pom.xml │ │ │ └── src/ │ │ │ ├── main/ │ │ │ │ ├── java/ │ │ │ │ │ └── com/ │ │ │ │ │ └── heibaiying/ │ │ │ │ │ └── springboot/ │ │ │ │ │ ├── SpringBootMybatisApplication.java │ │ │ │ │ ├── bean/ │ │ │ │ │ │ └── USPopulation.java │ │ │ │ │ └── dao/ │ │ │ │ │ └── PopulationDao.java │ │ │ │ └── resources/ │ │ │ │ └── application.yml │ │ │ └── test/ │ │ │ └── java/ │ │ │ └── com/ │ │ │ └── heibaiying/ │ │ │ └── springboot/ │ │ │ └── PopulationTest.java │ │ └── spring-mybatis-phoenix/ │ │ ├── pom.xml │ │ └── src/ │ │ ├── main/ │ │ │ ├── java/ │ │ │ │ └── com/ │ │ │ │ └── heibaiying/ │ │ │ │ ├── bean/ │ │ │ │ │ └── USPopulation.java │ │ │ │ └── dao/ │ │ │ │ └── PopulationDao.java │ │ │ └── resources/ │ │ │ ├── jdbc.properties │ │ │ ├── mappers/ │ │ │ │ └── Population.xml │ │ │ ├── mybatisConfig.xml │ │ │ └── springApplication.xml │ │ └── test/ │ │ └── java/ │ │ └── com/ │ │ └── heibaiying/ │ │ └── dao/ │ │ └── PopulationDaoTest.java │ ├── Storm/ │ │ ├── storm-hbase-integration/ │ │ │ ├── pom.xml │ │ │ └── src/ │ │ │ └── main/ │ │ │ └── java/ │ │ │ └── com/ │ │ │ └── heibaiying/ │ │ │ ├── WordCountToHBaseApp.java │ │ │ └── component/ │ │ │ ├── CountBolt.java │ │ │ ├── DataSourceSpout.java │ │ │ └── SplitBolt.java │ │ ├── storm-hdfs-integration/ │ │ │ ├── pom.xml │ │ │ └── src/ │ │ │ └── main/ │ │ │ └── java/ │ │ │ └── com.heibaiying/ │ │ │ ├── DataToHdfsApp.java │ │ │ └── component/ │ │ │ └── DataSourceSpout.java │ │ ├── storm-kafka-integration/ │ │ │ ├── pom.xml │ │ │ └── src/ │ │ │ └── main/ │ │ │ └── java/ │ │ │ └── com/ │ │ │ └── heibaiying/ │ │ │ └── kafka/ │ │ │ ├── read/ │ │ │ │ ├── LogConsoleBolt.java │ │ │ │ └── ReadingFromKafkaApp.java │ │ │ └── write/ │ │ │ ├── DataSourceSpout.java │ │ │ └── WritingToKafkaApp.java │ │ ├── storm-redis-integration/ │ │ │ ├── pom.xml │ │ │ └── src/ │ │ │ └── main/ │ │ │ └── java/ │ │ │ └── com/ │ │ │ └── heibaiying/ │ │ │ ├── CustomRedisCountApp.java │ │ │ ├── WordCountToRedisApp.java │ │ │ └── component/ │ │ │ ├── CountBolt.java │ │ │ ├── DataSourceSpout.java │ │ │ ├── RedisCountStoreBolt.java │ │ │ ├── SplitBolt.java │ │ │ └── WordCountStoreMapper.java │ │ └── storm-word-count/ │ │ ├── pom.xml │ │ └── src/ │ │ └── main/ │ │ ├── java/ │ │ │ └── com/ │ │ │ └── heibaiying/ │ │ │ └── wordcount/ │ │ │ ├── ClusterWordCountApp.java │ │ │ ├── LocalWordCountApp.java │ │ │ └── component/ │ │ │ ├── CountBolt.java │ │ │ ├── DataSourceSpout.java │ │ │ └── SplitBolt.java │ │ └── resources/ │ │ └── assembly.xml │ ├── Zookeeper/ │ │ └── curator/ │ │ ├── pom.xml │ │ └── src/ │ │ └── main/ │ │ └── java/ │ │ └── com/ │ │ └── heibaiying/ │ │ ├── AclOperation.java │ │ └── BasicOperation.java │ └── spark/ │ ├── spark-streaming-basis/ │ │ ├── pom.xml │ │ └── src/ │ │ └── main/ │ │ └── java/ │ │ └── com/ │ │ └── heibaiying/ │ │ ├── NetworkWordCount.scala │ │ ├── NetworkWordCountToRedis.scala │ │ ├── NetworkWordCountV2.scala │ │ └── utils/ │ │ └── JedisPoolUtil.java │ ├── spark-streaming-flume/ │ │ ├── pom.xml │ │ └── src/ │ │ └── main/ │ │ └── scala/ │ │ └── com/ │ │ └── heibaiying/ │ │ └── flume/ │ │ ├── PullBasedWordCount.scala │ │ └── PushBasedWordCount.scala │ └── spark-streaming-kafka/ │ ├── pom.xml │ └── src/ │ └── main/ │ └── scala/ │ └── com/ │ └── heibaiying/ │ └── kafka/ │ └── KafkaDirectStream.scala ├── notes/ │ ├── Azkaban_Flow_1.0_的使用.md │ ├── Azkaban_Flow_2.0_的使用.md │ ├── Azkaban简介.md │ ├── Flink_Data_Sink.md │ ├── Flink_Data_Source.md │ ├── Flink_Data_Transformation.md │ ├── Flink_Windows.md │ ├── Flink开发环境搭建.md │ ├── Flink核心概念综述.md │ ├── Flink状态管理与检查点机制.md │ ├── Flume整合Kafka.md │ ├── Flume简介及基本使用.md │ ├── HDFS-Java-API.md │ ├── HDFS常用Shell命令.md │ ├── Hadoop-HDFS.md │ ├── Hadoop-MapReduce.md │ ├── Hadoop-YARN.md │ ├── Hbase_Java_API.md │ ├── Hbase_Shell.md │ ├── Hbase协处理器详解.md │ ├── Hbase容灾与备份.md │ ├── Hbase的SQL中间层_Phoenix.md │ ├── Hbase简介.md │ ├── Hbase系统架构及数据结构.md │ ├── Hbase过滤器详解.md │ ├── HiveCLI和Beeline命令行的基本使用.md │ ├── Hive分区表和分桶表.md │ ├── Hive常用DDL操作.md │ ├── Hive常用DML操作.md │ ├── Hive数据查询详解.md │ ├── Hive简介及核心概念.md │ ├── Hive视图和索引.md │ ├── Kafka消费者详解.md │ ├── Kafka深入理解分区副本机制.md │ ├── Kafka生产者详解.md │ ├── Kafka简介.md │ ├── Scala函数和闭包.md │ ├── Scala列表和集.md │ ├── Scala基本数据类型和运算符.md │ ├── Scala数组.md │ ├── Scala映射和元组.md │ ├── Scala模式匹配.md │ ├── Scala流程控制语句.md │ ├── Scala简介及开发环境配置.md │ ├── Scala类和对象.md │ ├── Scala类型参数.md │ ├── Scala继承和特质.md │ ├── Scala隐式转换和隐式参数.md │ ├── Scala集合类型.md │ ├── SparkSQL_Dataset和DataFrame简介.md │ ├── SparkSQL外部数据源.md │ ├── SparkSQL常用聚合函数.md │ ├── SparkSQL联结操作.md │ ├── Spark_RDD.md │ ├── Spark_Streaming与流处理.md │ ├── Spark_Streaming基本操作.md │ ├── Spark_Streaming整合Flume.md │ ├── Spark_Streaming整合Kafka.md │ ├── Spark_Structured_API的基本使用.md │ ├── Spark_Transformation和Action算子.md │ ├── Spark简介.md │ ├── Spark累加器与广播变量.md │ ├── Spark部署模式与作业提交.md │ ├── Spring+Mybtais+Phoenix整合.md │ ├── Sqoop基本使用.md │ ├── Sqoop简介与安装.md │ ├── Storm三种打包方式对比分析.md │ ├── Storm和流处理简介.md │ ├── Storm核心概念详解.md │ ├── Storm编程模型详解.md │ ├── Storm集成HBase和HDFS.md │ ├── Storm集成Kakfa.md │ ├── Storm集成Redis详解.md │ ├── Zookeeper_ACL权限控制.md │ ├── Zookeeper_Java客户端Curator.md │ ├── Zookeeper常用Shell命令.md │ ├── Zookeeper简介及核心概念.md │ ├── installation/ │ │ ├── Azkaban_3.x_编译及部署.md │ │ ├── Flink_Standalone_Cluster.md │ │ ├── HBase单机环境搭建.md │ │ ├── HBase集群环境搭建.md │ │ ├── Hadoop单机环境搭建.md │ │ ├── Hadoop集群环境搭建.md │ │ ├── Linux下Flume的安装.md │ │ ├── Linux下JDK安装.md │ │ ├── Linux下Python安装.md │ │ ├── Linux环境下Hive的安装部署.md │ │ ├── Spark开发环境搭建.md │ │ ├── Spark集群环境搭建.md │ │ ├── Storm单机环境搭建.md │ │ ├── Storm集群环境搭建.md │ │ ├── Zookeeper单机环境和集群环境搭建.md │ │ ├── 基于Zookeeper搭建Hadoop高可用集群.md │ │ ├── 基于Zookeeper搭建Kafka高可用集群.md │ │ └── 虚拟机静态IP及多IP配置.md │ ├── 大数据学习路线.md │ ├── 大数据常用软件安装指南.md │ ├── 大数据应用常用打包方式.md │ ├── 大数据技术栈思维导图.md │ └── 资料分享与工具推荐.md ├── pictures/ │ ├── bigdata-notes-icon.psd │ └── 大数据技术栈思维导图.xmind └── resources/ ├── csv/ │ └── dept.csv ├── json/ │ ├── dept.json │ └── emp.json ├── mysql-connector-java-5.1.47.jar ├── orc/ │ └── dept.orc ├── parquet/ │ ├── dept.parquet │ └── emp.parquet ├── tsv/ │ ├── dept.tsv │ └── emp.tsv └── txt/ ├── dept.txt └── emp.txt