gitextract_uh8insif/ ├── .gitattributes ├── .gitignore ├── 00_intro_and_history/ │ ├── 00_intro_and_history.md │ ├── notes/ │ │ └── .gitignore │ ├── quiz/ │ │ └── .gitignore │ └── spring_2017_announcements/ │ └── spring_2017_announcements.md ├── 01_basic_data_prep/ │ ├── 01_basic_data_prep.md │ ├── assignment/ │ │ └── .gitignore │ ├── notes/ │ │ └── .gitignore │ ├── quiz/ │ │ └── .gitignore │ └── src/ │ ├── notebooks/ │ │ ├── py/ │ │ │ ├── .gitignore │ │ │ └── Py_Part_0_pandas_numpy.ipynb │ │ ├── r/ │ │ │ ├── .gitignore │ │ │ ├── R_Part_0_Basics_dplyr_and_ggplot2.ipynb │ │ │ └── R_Part_1_data.table.ipynb │ │ └── sas/ │ │ ├── SAS_Part_0_Base_SAS_PROC_SGPLOT.ipynb │ │ └── SAS_Part_1_PROC_SQL.ipynb │ └── raw/ │ ├── py/ │ │ ├── Py_Part_0_pandas_numpy.py │ │ ├── pyspark_example.py │ │ ├── scratch.csv │ │ ├── scratch2.csv │ │ └── scratch3.csv │ ├── r/ │ │ ├── .gitignore │ │ ├── R_Part_0_Basics_dplyr_and_ggplot2.r │ │ └── R_Part_1_data.table.r │ └── sas/ │ ├── .gitignore │ ├── SAS_Part_0_Base_SAS_PROC_SGPLOT.sas │ └── SAS_Part_1_PROC_SQL.sas ├── 02_analytical_data_prep/ │ ├── 02_analytical_data_prep.md │ ├── data/ │ │ ├── loan.csv │ │ └── loans.sas7bdat │ ├── notes/ │ │ └── .gitignore │ ├── quiz/ │ │ └── .gitignore │ ├── src/ │ │ ├── .gitignore │ │ ├── DataPreperation.py │ │ ├── data_sets/ │ │ │ └── kaggle_house/ │ │ │ ├── test.csv │ │ │ └── train.csv │ │ ├── housing.html │ │ ├── housing.ipynb │ │ ├── py_part_2_discretization.ipynb │ │ ├── py_part_2_encoding.ipynb │ │ ├── py_part_2_feature_extraction.ipynb │ │ ├── py_part_2_feature_selection.ipynb │ │ ├── py_part_2_impute.ipynb │ │ ├── py_part_2_over_sample.ipynb │ │ ├── py_part_2_standardize.ipynb │ │ ├── py_part_2_target_encode_categorical.ipynb │ │ ├── py_part_2_target_encode_numeric.ipynb │ │ └── py_part_2_winsorize.ipynb │ └── xml/ │ └── 02_analytical_data_prep.xml ├── 03_regression/ │ ├── .gitignore │ ├── 03_regression.md │ ├── assignment/ │ │ └── .gitignore │ ├── data/ │ │ ├── .gitignore │ │ ├── loan_clean.csv │ │ ├── test.csv │ │ └── train.csv │ ├── quiz/ │ │ └── .gitignore │ ├── src/ │ │ ├── .gitignore │ │ ├── py_part_3_kaggle_starter.ipynb │ │ ├── py_part_3_linear_regression_gradient_descent.ipynb │ │ ├── py_part_3_penalized_linear_regression.ipynb │ │ ├── py_part_3_penalized_logistic_regression.ipynb │ │ ├── spark_kaggle_starter/ │ │ │ ├── README.md │ │ │ ├── feature_combiner.py │ │ │ ├── get_type_lists.py │ │ │ ├── logging_lib/ │ │ │ │ ├── LICENSE.md │ │ │ │ ├── LoggingController.py │ │ │ │ ├── MarkdownBuilder.py │ │ │ │ ├── README.md │ │ │ │ ├── __init__.py │ │ │ │ ├── example.py │ │ │ │ └── markdown_preview_github.css │ │ │ ├── main.py │ │ │ ├── spark_controler/ │ │ │ │ ├── LICENSE.md │ │ │ │ ├── README.md │ │ │ │ ├── __init__.py │ │ │ │ ├── ec2_instance_data_dict.py │ │ │ │ ├── emr_controller.py │ │ │ │ ├── files/ │ │ │ │ │ ├── setup.sh │ │ │ │ │ └── terminate_idle_cluster.sh │ │ │ │ ├── resource_calculator/ │ │ │ │ │ └── C2FO-Spark-Config-Cheatsheet.xlsx │ │ │ │ └── scripts/ │ │ │ │ ├── bootstrap_actions.sh │ │ │ │ ├── deep_learning_install_complete.sh │ │ │ │ ├── pyspark_quick_setup.sh │ │ │ │ └── terminate_idle_cluster.sh │ │ │ ├── spark_main.py │ │ │ └── target_encoder.py │ │ └── target_encoder.py │ ├── xlsx/ │ │ └── assessment_workbook.xlsx │ └── xml/ │ ├── 03_linear_regression.xml │ └── 03_logistic_regression.xml ├── 04_decision_trees/ │ ├── 04_decision_trees.md │ ├── data/ │ │ └── .gitignore │ ├── quiz/ │ │ └── .gitignore │ ├── src/ │ │ ├── py_part_4_decision_tree_ensembles.ipynb │ │ └── py_part_4_kaggle_xgboost.ipynb │ └── xml/ │ └── 04_decision_trees.xml ├── 05_neural_networks/ │ ├── 05_neural_networks.md │ ├── assignment/ │ │ └── .gitignore │ ├── data/ │ │ └── .gitignore │ ├── quiz/ │ │ ├── .gitignore │ │ └── sample/ │ │ └── .gitignore │ ├── src/ │ │ ├── .gitignore │ │ ├── py_part_5_MNIST_DNN.ipynb │ │ ├── py_part_5_MNIST_autoencoder.ipynb │ │ ├── py_part_5_MNIST_data_augmentation.ipynb │ │ ├── py_part_5_MNIST_keras_lenet.ipynb │ │ ├── py_part_5_basic_mlp_example.ipynb │ │ └── py_part_5_neural_networks.ipynb │ └── xml/ │ └── 05_neural_networks.xml ├── 06_clustering/ │ ├── 06_clustering.md │ ├── assignment/ │ │ └── key/ │ │ └── .gitignore │ ├── quiz/ │ │ └── .gitignore │ ├── src/ │ │ └── py_part_6_clustering.ipynb │ └── xml/ │ └── 06_clustering.xml ├── 07_association_rules/ │ ├── 07_association_rules.md │ ├── assignment/ │ │ ├── .gitignore │ │ └── assignment_7.docx │ ├── quiz/ │ │ └── .gitignore │ └── xml/ │ └── 07_association_rules.xml ├── 08_text_mining/ │ ├── 08_text_mining.md │ ├── quiz/ │ │ ├── .gitignore │ │ └── sample/ │ │ ├── .gitignore │ │ └── Quiz_8.docx │ └── xml/ │ └── 08_text_mining.xml ├── 09_matrix_factorization/ │ ├── 09_matrix_factorization.md │ └── src/ │ ├── py_part_9_iris_pca.ipynb │ └── py_part_9_kaggle_GLRM_example.ipynb ├── 10_model_interpretability/ │ ├── 10_model_interpretability.md │ ├── quiz/ │ │ └── .gitignore │ └── src/ │ ├── dt_surrogate.ipynb │ ├── lime.ipynb │ ├── loco.ipynb │ ├── mono_xgboost.ipynb │ ├── pdp_ice.ipynb │ └── sensitivity_analysis.ipynb ├── README.md ├── anaconda_py35_h2o_xgboost_graphviz/ │ └── Dockerfile ├── cold_call.py └── requirements.txt