gitextract_8esimy8a/ ├── .binder/ │ ├── postBuild │ └── requirements.txt ├── .circleci/ │ ├── artifact_path │ └── config.yml ├── .codecov.yml ├── .coveragerc ├── .git-blame-ignore-revs ├── .gitattributes ├── .github/ │ ├── FUNDING.yml │ ├── ISSUE_TEMPLATE/ │ │ ├── bug_report.yml │ │ ├── config.yml │ │ ├── doc_improvement.yml │ │ └── feature_request.yml │ ├── PULL_REQUEST_TEMPLATE.md │ ├── labeler-file-extensions.yml │ ├── labeler-module.yml │ ├── scripts/ │ │ └── label_title_regex.py │ └── workflows/ │ ├── assign.yml │ ├── check-changelog.yml │ ├── check-manifest.yml │ ├── labeler-module.yml │ ├── labeler-title-regex.yml │ ├── publish_pypi.yml │ ├── twitter.yml │ ├── unassign.yml │ └── wheels.yml ├── .gitignore ├── .mailmap ├── .pre-commit-config.yaml ├── .travis.yml ├── CODE_OF_CONDUCT.md ├── CONTRIBUTING.md ├── COPYING ├── MANIFEST.in ├── Makefile ├── README.rst ├── SECURITY.md ├── asv_benchmarks/ │ ├── .gitignore │ ├── asv.conf.json │ └── benchmarks/ │ ├── __init__.py │ ├── cluster.py │ ├── common.py │ ├── config.json │ ├── datasets.py │ ├── decomposition.py │ ├── ensemble.py │ ├── linear_model.py │ ├── manifold.py │ ├── metrics.py │ ├── model_selection.py │ ├── neighbors.py │ ├── svm.py │ └── utils.py ├── azure-pipelines.yml ├── benchmarks/ │ ├── .gitignore │ ├── bench_20newsgroups.py │ ├── bench_covertype.py │ ├── bench_feature_expansions.py │ ├── bench_glm.py │ ├── bench_glmnet.py │ ├── bench_hist_gradient_boosting.py │ ├── bench_hist_gradient_boosting_adult.py │ ├── bench_hist_gradient_boosting_categorical_only.py │ ├── bench_hist_gradient_boosting_higgsboson.py │ ├── bench_hist_gradient_boosting_threading.py │ ├── bench_isolation_forest.py │ ├── bench_isotonic.py │ ├── bench_kernel_pca_solvers_time_vs_n_components.py │ ├── bench_kernel_pca_solvers_time_vs_n_samples.py │ ├── bench_lasso.py │ ├── bench_lof.py │ ├── bench_mnist.py │ ├── bench_multilabel_metrics.py │ ├── bench_online_ocsvm.py │ ├── bench_plot_fastkmeans.py │ ├── bench_plot_hierarchical.py │ ├── bench_plot_incremental_pca.py │ ├── bench_plot_lasso_path.py │ ├── bench_plot_neighbors.py │ ├── bench_plot_nmf.py │ ├── bench_plot_omp_lars.py │ ├── bench_plot_parallel_pairwise.py │ ├── bench_plot_polynomial_kernel_approximation.py │ ├── bench_plot_randomized_svd.py │ ├── bench_plot_svd.py │ ├── bench_plot_ward.py │ ├── bench_random_projections.py │ ├── bench_rcv1_logreg_convergence.py │ ├── bench_saga.py │ ├── bench_sample_without_replacement.py │ ├── bench_sgd_regression.py │ ├── bench_sparsify.py │ ├── bench_text_vectorizers.py │ ├── bench_tree.py │ ├── bench_tsne_mnist.py │ └── plot_tsne_mnist.py ├── build_tools/ │ ├── Makefile │ ├── azure/ │ │ ├── install.sh │ │ ├── install_win.sh │ │ ├── posix-docker.yml │ │ ├── posix.yml │ │ ├── test_docs.sh │ │ ├── test_docstring.sh │ │ ├── test_pytest_soft_dependency.sh │ │ ├── test_script.sh │ │ ├── upload_codecov.sh │ │ └── windows.yml │ ├── circle/ │ │ ├── build_doc.sh │ │ ├── build_test_arm.sh │ │ ├── build_test_pypy.sh │ │ ├── checkout_merge_commit.sh │ │ ├── linting.sh │ │ ├── list_versions.py │ │ └── push_doc.sh │ ├── codespell_ignore_words.txt │ ├── generate_authors_table.py │ ├── github/ │ │ ├── Windows │ │ ├── build_minimal_windows_image.sh │ │ ├── build_source.sh │ │ ├── build_wheels.sh │ │ ├── check_build_trigger.sh │ │ ├── check_wheels.py │ │ ├── repair_windows_wheels.sh │ │ ├── test_source.sh │ │ ├── test_wheels.sh │ │ ├── test_windows_wheels.sh │ │ ├── upload_anaconda.sh │ │ └── vendor.py │ ├── shared.sh │ └── travis/ │ ├── after_success.sh │ ├── install.sh │ ├── install_main.sh │ ├── install_wheels.sh │ ├── script.sh │ ├── test_docs.sh │ ├── test_script.sh │ └── test_wheels.sh ├── conftest.py ├── doc/ │ ├── Makefile │ ├── README.md │ ├── about.rst │ ├── authors.rst │ ├── authors_emeritus.rst │ ├── binder/ │ │ └── requirements.txt │ ├── common_pitfalls.rst │ ├── communication_team.rst │ ├── computing/ │ │ ├── computational_performance.rst │ │ ├── parallelism.rst │ │ └── scaling_strategies.rst │ ├── computing.rst │ ├── conf.py │ ├── conftest.py │ ├── contents.rst │ ├── data_transforms.rst │ ├── datasets/ │ │ ├── loading_other_datasets.rst │ │ ├── real_world.rst │ │ ├── sample_generators.rst │ │ └── toy_dataset.rst │ ├── datasets.rst │ ├── developers/ │ │ ├── advanced_installation.rst │ │ ├── bug_triaging.rst │ │ ├── contributing.rst │ │ ├── develop.rst │ │ ├── index.rst │ │ ├── maintainer.rst │ │ ├── performance.rst │ │ ├── plotting.rst │ │ ├── tips.rst │ │ └── utilities.rst │ ├── faq.rst │ ├── getting_started.rst │ ├── glossary.rst │ ├── governance.rst │ ├── includes/ │ │ ├── big_toc_css.rst │ │ └── bigger_toc_css.rst │ ├── inspection.rst │ ├── install.rst │ ├── make.bat │ ├── model_selection.rst │ ├── modules/ │ │ ├── biclustering.rst │ │ ├── calibration.rst │ │ ├── classes.rst │ │ ├── clustering.rst │ │ ├── compose.rst │ │ ├── covariance.rst │ │ ├── cross_decomposition.rst │ │ ├── cross_validation.rst │ │ ├── decomposition.rst │ │ ├── density.rst │ │ ├── ensemble.rst │ │ ├── feature_extraction.rst │ │ ├── feature_selection.rst │ │ ├── gaussian_process.rst │ │ ├── grid_search.rst │ │ ├── impute.rst │ │ ├── isotonic.rst │ │ ├── kernel_approximation.rst │ │ ├── kernel_ridge.rst │ │ ├── lda_qda.rst │ │ ├── learning_curve.rst │ │ ├── linear_model.rst │ │ ├── manifold.rst │ │ ├── metrics.rst │ │ ├── mixture.rst │ │ ├── model_evaluation.rst │ │ ├── model_persistence.rst │ │ ├── multiclass.rst │ │ ├── naive_bayes.rst │ │ ├── neighbors.rst │ │ ├── neural_networks_supervised.rst │ │ ├── neural_networks_unsupervised.rst │ │ ├── outlier_detection.rst │ │ ├── partial_dependence.rst │ │ ├── permutation_importance.rst │ │ ├── pipeline.rst │ │ ├── preprocessing.rst │ │ ├── preprocessing_targets.rst │ │ ├── random_projection.rst │ │ ├── semi_supervised.rst │ │ ├── sgd.rst │ │ ├── svm.rst │ │ ├── tree.rst │ │ └── unsupervised_reduction.rst │ ├── preface.rst │ ├── presentations.rst │ ├── related_projects.rst │ ├── roadmap.rst │ ├── sphinxext/ │ │ ├── MANIFEST.in │ │ ├── add_toctree_functions.py │ │ ├── custom_references_resolver.py │ │ ├── doi_role.py │ │ ├── github_link.py │ │ └── sphinx_issues.py │ ├── supervised_learning.rst │ ├── support.rst │ ├── templates/ │ │ ├── class.rst │ │ ├── class_with_call.rst │ │ ├── deprecated_class.rst │ │ ├── deprecated_class_with_call.rst │ │ ├── deprecated_class_without_init.rst │ │ ├── deprecated_function.rst │ │ ├── function.rst │ │ ├── generate_deprecated.sh │ │ ├── index.html │ │ ├── numpydoc_docstring.rst │ │ └── redirects.html │ ├── testimonials/ │ │ ├── README.txt │ │ ├── images/ │ │ │ └── Makefile │ │ └── testimonials.rst │ ├── themes/ │ │ └── scikit-learn-modern/ │ │ ├── javascript.html │ │ ├── layout.html │ │ ├── nav.html │ │ ├── search.html │ │ ├── static/ │ │ │ ├── css/ │ │ │ │ └── theme.css │ │ │ └── js/ │ │ │ └── searchtools.js │ │ └── theme.conf │ ├── triage_team.rst │ ├── tune_toc.rst │ ├── tutorial/ │ │ ├── basic/ │ │ │ └── tutorial.rst │ │ ├── common_includes/ │ │ │ └── info.txt │ │ ├── index.rst │ │ ├── machine_learning_map/ │ │ │ ├── ML_MAPS_README.txt │ │ │ ├── index.rst │ │ │ ├── parse_path.py │ │ │ ├── pyparsing.py │ │ │ └── svg2imagemap.py │ │ ├── statistical_inference/ │ │ │ ├── index.rst │ │ │ ├── model_selection.rst │ │ │ ├── putting_together.rst │ │ │ ├── settings.rst │ │ │ ├── supervised_learning.rst │ │ │ └── unsupervised_learning.rst │ │ └── text_analytics/ │ │ ├── .gitignore │ │ ├── data/ │ │ │ ├── languages/ │ │ │ │ └── fetch_data.py │ │ │ ├── movie_reviews/ │ │ │ │ └── fetch_data.py │ │ │ └── twenty_newsgroups/ │ │ │ └── fetch_data.py │ │ ├── skeletons/ │ │ │ ├── exercise_01_language_train_model.py │ │ │ └── exercise_02_sentiment.py │ │ ├── solutions/ │ │ │ ├── exercise_01_language_train_model.py │ │ │ ├── exercise_02_sentiment.py │ │ │ └── generate_skeletons.py │ │ └── working_with_text_data.rst │ ├── unsupervised_learning.rst │ ├── user_guide.rst │ ├── visualizations.rst │ ├── whats_new/ │ │ ├── _contributors.rst │ │ ├── changelog_legend.inc │ │ ├── older_versions.rst │ │ ├── v0.13.rst │ │ ├── v0.14.rst │ │ ├── v0.15.rst │ │ ├── v0.16.rst │ │ ├── v0.17.rst │ │ ├── v0.18.rst │ │ ├── v0.19.rst │ │ ├── v0.20.rst │ │ ├── v0.21.rst │ │ ├── v0.22.rst │ │ ├── v0.23.rst │ │ ├── v0.24.rst │ │ ├── v1.0.rst │ │ └── v1.1.rst │ └── whats_new.rst ├── examples/ │ ├── README.txt │ ├── applications/ │ │ ├── README.txt │ │ ├── plot_cyclical_feature_engineering.py │ │ ├── plot_digits_denoising.py │ │ ├── plot_face_recognition.py │ │ ├── plot_model_complexity_influence.py │ │ ├── plot_out_of_core_classification.py │ │ ├── plot_outlier_detection_wine.py │ │ ├── plot_prediction_latency.py │ │ ├── plot_species_distribution_modeling.py │ │ ├── plot_stock_market.py │ │ ├── plot_tomography_l1_reconstruction.py │ │ ├── plot_topics_extraction_with_nmf_lda.py │ │ ├── svm_gui.py │ │ └── wikipedia_principal_eigenvector.py │ ├── bicluster/ │ │ ├── README.txt │ │ ├── plot_bicluster_newsgroups.py │ │ ├── plot_spectral_biclustering.py │ │ └── plot_spectral_coclustering.py │ ├── calibration/ │ │ ├── README.txt │ │ ├── plot_calibration.py │ │ ├── plot_calibration_curve.py │ │ ├── plot_calibration_multiclass.py │ │ └── plot_compare_calibration.py │ ├── classification/ │ │ ├── README.txt │ │ ├── plot_classification_probability.py │ │ ├── plot_classifier_comparison.py │ │ ├── plot_digits_classification.py │ │ ├── plot_lda.py │ │ └── plot_lda_qda.py │ ├── cluster/ │ │ ├── README.txt │ │ ├── plot_adjusted_for_chance_measures.py │ │ ├── plot_affinity_propagation.py │ │ ├── plot_agglomerative_clustering.py │ │ ├── plot_agglomerative_clustering_metrics.py │ │ ├── plot_agglomerative_dendrogram.py │ │ ├── plot_birch_vs_minibatchkmeans.py │ │ ├── plot_cluster_comparison.py │ │ ├── plot_cluster_iris.py │ │ ├── plot_coin_segmentation.py │ │ ├── plot_coin_ward_segmentation.py │ │ ├── plot_color_quantization.py │ │ ├── plot_dbscan.py │ │ ├── plot_dict_face_patches.py │ │ ├── plot_digits_agglomeration.py │ │ ├── plot_digits_linkage.py │ │ ├── plot_face_compress.py │ │ ├── plot_feature_agglomeration_vs_univariate_selection.py │ │ ├── plot_inductive_clustering.py │ │ ├── plot_kmeans_assumptions.py │ │ ├── plot_kmeans_digits.py │ │ ├── plot_kmeans_plusplus.py │ │ ├── plot_kmeans_silhouette_analysis.py │ │ ├── plot_kmeans_stability_low_dim_dense.py │ │ ├── plot_linkage_comparison.py │ │ ├── plot_mean_shift.py │ │ ├── plot_mini_batch_kmeans.py │ │ ├── plot_optics.py │ │ ├── plot_segmentation_toy.py │ │ └── plot_ward_structured_vs_unstructured.py │ ├── compose/ │ │ ├── README.txt │ │ ├── plot_column_transformer.py │ │ ├── plot_column_transformer_mixed_types.py │ │ ├── plot_compare_reduction.py │ │ ├── plot_digits_pipe.py │ │ ├── plot_feature_union.py │ │ └── plot_transformed_target.py │ ├── covariance/ │ │ ├── README.txt │ │ ├── plot_covariance_estimation.py │ │ ├── plot_lw_vs_oas.py │ │ ├── plot_mahalanobis_distances.py │ │ ├── plot_robust_vs_empirical_covariance.py │ │ └── plot_sparse_cov.py │ ├── cross_decomposition/ │ │ ├── README.txt │ │ ├── plot_compare_cross_decomposition.py │ │ └── plot_pcr_vs_pls.py │ ├── datasets/ │ │ ├── README.txt │ │ ├── plot_digits_last_image.py │ │ ├── plot_iris_dataset.py │ │ ├── plot_random_dataset.py │ │ └── plot_random_multilabel_dataset.py │ ├── decomposition/ │ │ ├── README.txt │ │ ├── plot_beta_divergence.py │ │ ├── plot_faces_decomposition.py │ │ ├── plot_ica_blind_source_separation.py │ │ ├── plot_ica_vs_pca.py │ │ ├── plot_image_denoising.py │ │ ├── plot_incremental_pca.py │ │ ├── plot_kernel_pca.py │ │ ├── plot_pca_3d.py │ │ ├── plot_pca_iris.py │ │ ├── plot_pca_vs_fa_model_selection.py │ │ ├── plot_pca_vs_lda.py │ │ ├── plot_sparse_coding.py │ │ └── plot_varimax_fa.py │ ├── ensemble/ │ │ ├── README.txt │ │ ├── plot_adaboost_hastie_10_2.py │ │ ├── plot_adaboost_multiclass.py │ │ ├── plot_adaboost_regression.py │ │ ├── plot_adaboost_twoclass.py │ │ ├── plot_bias_variance.py │ │ ├── plot_ensemble_oob.py │ │ ├── plot_feature_transformation.py │ │ ├── plot_forest_importances.py │ │ ├── plot_forest_importances_faces.py │ │ ├── plot_forest_iris.py │ │ ├── plot_gradient_boosting_categorical.py │ │ ├── plot_gradient_boosting_early_stopping.py │ │ ├── plot_gradient_boosting_oob.py │ │ ├── plot_gradient_boosting_quantile.py │ │ ├── plot_gradient_boosting_regression.py │ │ ├── plot_gradient_boosting_regularization.py │ │ ├── plot_isolation_forest.py │ │ ├── plot_monotonic_constraints.py │ │ ├── plot_random_forest_embedding.py │ │ ├── plot_random_forest_regression_multioutput.py │ │ ├── plot_stack_predictors.py │ │ ├── plot_voting_decision_regions.py │ │ ├── plot_voting_probas.py │ │ └── plot_voting_regressor.py │ ├── exercises/ │ │ ├── README.txt │ │ ├── plot_cv_diabetes.py │ │ ├── plot_cv_digits.py │ │ ├── plot_digits_classification_exercise.py │ │ └── plot_iris_exercise.py │ ├── feature_selection/ │ │ ├── README.txt │ │ ├── plot_f_test_vs_mi.py │ │ ├── plot_feature_selection.py │ │ ├── plot_feature_selection_pipeline.py │ │ ├── plot_rfe_digits.py │ │ ├── plot_rfe_with_cross_validation.py │ │ └── plot_select_from_model_diabetes.py │ ├── gaussian_process/ │ │ ├── README.txt │ │ ├── plot_compare_gpr_krr.py │ │ ├── plot_gpc.py │ │ ├── plot_gpc_iris.py │ │ ├── plot_gpc_isoprobability.py │ │ ├── plot_gpc_xor.py │ │ ├── plot_gpr_co2.py │ │ ├── plot_gpr_noisy.py │ │ ├── plot_gpr_noisy_targets.py │ │ ├── plot_gpr_on_structured_data.py │ │ └── plot_gpr_prior_posterior.py │ ├── impute/ │ │ ├── README.txt │ │ ├── plot_iterative_imputer_variants_comparison.py │ │ └── plot_missing_values.py │ ├── inspection/ │ │ ├── README.txt │ │ ├── plot_linear_model_coefficient_interpretation.py │ │ ├── plot_partial_dependence.py │ │ ├── plot_permutation_importance.py │ │ └── plot_permutation_importance_multicollinear.py │ ├── kernel_approximation/ │ │ ├── README.txt │ │ └── plot_scalable_poly_kernels.py │ ├── linear_model/ │ │ ├── README.txt │ │ ├── plot_ard.py │ │ ├── plot_bayesian_ridge.py │ │ ├── plot_bayesian_ridge_curvefit.py │ │ ├── plot_elastic_net_precomputed_gram_matrix_with_weighted_samples.py │ │ ├── plot_huber_vs_ridge.py │ │ ├── plot_iris_logistic.py │ │ ├── plot_lasso_and_elasticnet.py │ │ ├── plot_lasso_coordinate_descent_path.py │ │ ├── plot_lasso_dense_vs_sparse_data.py │ │ ├── plot_lasso_lars.py │ │ ├── plot_lasso_model_selection.py │ │ ├── plot_logistic.py │ │ ├── plot_logistic_l1_l2_sparsity.py │ │ ├── plot_logistic_multinomial.py │ │ ├── plot_logistic_path.py │ │ ├── plot_multi_task_lasso_support.py │ │ ├── plot_nnls.py │ │ ├── plot_ols.py │ │ ├── plot_ols_3d.py │ │ ├── plot_ols_ridge_variance.py │ │ ├── plot_omp.py │ │ ├── plot_poisson_regression_non_normal_loss.py │ │ ├── plot_polynomial_interpolation.py │ │ ├── plot_quantile_regression.py │ │ ├── plot_ransac.py │ │ ├── plot_ridge_coeffs.py │ │ ├── plot_ridge_path.py │ │ ├── plot_robust_fit.py │ │ ├── plot_sgd_comparison.py │ │ ├── plot_sgd_early_stopping.py │ │ ├── plot_sgd_iris.py │ │ ├── plot_sgd_loss_functions.py │ │ ├── plot_sgd_penalties.py │ │ ├── plot_sgd_separating_hyperplane.py │ │ ├── plot_sgd_weighted_samples.py │ │ ├── plot_sgdocsvm_vs_ocsvm.py │ │ ├── plot_sparse_logistic_regression_20newsgroups.py │ │ ├── plot_sparse_logistic_regression_mnist.py │ │ ├── plot_theilsen.py │ │ └── plot_tweedie_regression_insurance_claims.py │ ├── manifold/ │ │ ├── README.txt │ │ ├── plot_compare_methods.py │ │ ├── plot_lle_digits.py │ │ ├── plot_manifold_sphere.py │ │ ├── plot_mds.py │ │ ├── plot_swissroll.py │ │ └── plot_t_sne_perplexity.py │ ├── miscellaneous/ │ │ ├── README.txt │ │ ├── plot_anomaly_comparison.py │ │ ├── plot_changed_only_pprint_parameter.py │ │ ├── plot_display_object_visualization.py │ │ ├── plot_isotonic_regression.py │ │ ├── plot_johnson_lindenstrauss_bound.py │ │ ├── plot_kernel_approximation.py │ │ ├── plot_kernel_ridge_regression.py │ │ ├── plot_multilabel.py │ │ ├── plot_multioutput_face_completion.py │ │ ├── plot_partial_dependence_visualization_api.py │ │ ├── plot_pipeline_display.py │ │ └── plot_roc_curve_visualization_api.py │ ├── mixture/ │ │ ├── README.txt │ │ ├── plot_concentration_prior.py │ │ ├── plot_gmm.py │ │ ├── plot_gmm_covariances.py │ │ ├── plot_gmm_pdf.py │ │ ├── plot_gmm_selection.py │ │ └── plot_gmm_sin.py │ ├── model_selection/ │ │ ├── README.txt │ │ ├── grid_search_text_feature_extraction.py │ │ ├── plot_confusion_matrix.py │ │ ├── plot_cv_indices.py │ │ ├── plot_cv_predict.py │ │ ├── plot_det.py │ │ ├── plot_grid_search_digits.py │ │ ├── plot_grid_search_refit_callable.py │ │ ├── plot_grid_search_stats.py │ │ ├── plot_learning_curve.py │ │ ├── plot_multi_metric_evaluation.py │ │ ├── plot_nested_cross_validation_iris.py │ │ ├── plot_permutation_tests_for_classification.py │ │ ├── plot_precision_recall.py │ │ ├── plot_randomized_search.py │ │ ├── plot_roc.py │ │ ├── plot_roc_crossval.py │ │ ├── plot_successive_halving_heatmap.py │ │ ├── plot_successive_halving_iterations.py │ │ ├── plot_train_error_vs_test_error.py │ │ ├── plot_underfitting_overfitting.py │ │ └── plot_validation_curve.py │ ├── multioutput/ │ │ ├── README.txt │ │ └── plot_classifier_chain_yeast.py │ ├── neighbors/ │ │ ├── README.txt │ │ ├── approximate_nearest_neighbors.py │ │ ├── plot_caching_nearest_neighbors.py │ │ ├── plot_classification.py │ │ ├── plot_digits_kde_sampling.py │ │ ├── plot_kde_1d.py │ │ ├── plot_lof_novelty_detection.py │ │ ├── plot_lof_outlier_detection.py │ │ ├── plot_nca_classification.py │ │ ├── plot_nca_dim_reduction.py │ │ ├── plot_nca_illustration.py │ │ ├── plot_nearest_centroid.py │ │ ├── plot_regression.py │ │ └── plot_species_kde.py │ ├── neural_networks/ │ │ ├── README.txt │ │ ├── plot_mlp_alpha.py │ │ ├── plot_mlp_training_curves.py │ │ ├── plot_mnist_filters.py │ │ └── plot_rbm_logistic_classification.py │ ├── preprocessing/ │ │ ├── README.txt │ │ ├── plot_all_scaling.py │ │ ├── plot_discretization.py │ │ ├── plot_discretization_classification.py │ │ ├── plot_discretization_strategies.py │ │ ├── plot_map_data_to_normal.py │ │ └── plot_scaling_importance.py │ ├── release_highlights/ │ │ ├── README.txt │ │ ├── plot_release_highlights_0_22_0.py │ │ ├── plot_release_highlights_0_23_0.py │ │ ├── plot_release_highlights_0_24_0.py │ │ └── plot_release_highlights_1_0_0.py │ ├── semi_supervised/ │ │ ├── README.txt │ │ ├── plot_label_propagation_digits.py │ │ ├── plot_label_propagation_digits_active_learning.py │ │ ├── plot_label_propagation_structure.py │ │ ├── plot_self_training_varying_threshold.py │ │ ├── plot_semi_supervised_newsgroups.py │ │ └── plot_semi_supervised_versus_svm_iris.py │ ├── svm/ │ │ ├── README.txt │ │ ├── plot_custom_kernel.py │ │ ├── plot_iris_svc.py │ │ ├── plot_linearsvc_support_vectors.py │ │ ├── plot_oneclass.py │ │ ├── plot_rbf_parameters.py │ │ ├── plot_separating_hyperplane.py │ │ ├── plot_separating_hyperplane_unbalanced.py │ │ ├── plot_svm_anova.py │ │ ├── plot_svm_kernels.py │ │ ├── plot_svm_margin.py │ │ ├── plot_svm_nonlinear.py │ │ ├── plot_svm_regression.py │ │ ├── plot_svm_scale_c.py │ │ ├── plot_svm_tie_breaking.py │ │ └── plot_weighted_samples.py │ ├── text/ │ │ ├── README.txt │ │ ├── plot_document_classification_20newsgroups.py │ │ ├── plot_document_clustering.py │ │ └── plot_hashing_vs_dict_vectorizer.py │ └── tree/ │ ├── README.txt │ ├── plot_cost_complexity_pruning.py │ ├── plot_iris_dtc.py │ ├── plot_tree_regression.py │ ├── plot_tree_regression_multioutput.py │ └── plot_unveil_tree_structure.py ├── lgtm.yml ├── maint_tools/ │ ├── check_pxd_in_installation.py │ ├── create_issue_from_juint.py │ ├── sort_whats_new.py │ ├── test_docstrings.py │ └── whats_missing.sh ├── pyproject.toml ├── setup.cfg ├── setup.py └── sklearn/ ├── __check_build/ │ ├── __init__.py │ ├── _check_build.pyx │ └── setup.py ├── __init__.py ├── _build_utils/ │ ├── __init__.py │ ├── openmp_helpers.py │ └── pre_build_helpers.py ├── _config.py ├── _distributor_init.py ├── _isotonic.pyx ├── _loss/ │ ├── __init__.py │ ├── glm_distribution.py │ └── tests/ │ ├── __init__.py │ └── test_glm_distribution.py ├── _min_dependencies.py ├── base.py ├── calibration.py ├── cluster/ │ ├── __init__.py │ ├── _affinity_propagation.py │ ├── _agglomerative.py │ ├── _bicluster.py │ ├── _birch.py │ ├── _dbscan.py │ ├── _dbscan_inner.pyx │ ├── _feature_agglomeration.py │ ├── _hierarchical_fast.pyx │ ├── _k_means_common.pxd │ ├── _k_means_common.pyx │ ├── _k_means_elkan.pyx │ ├── _k_means_lloyd.pyx │ ├── _k_means_minibatch.pyx │ ├── _kmeans.py │ ├── _mean_shift.py │ ├── _optics.py │ ├── _spectral.py │ ├── setup.py │ └── tests/ │ ├── __init__.py │ ├── common.py │ ├── test_affinity_propagation.py │ ├── test_bicluster.py │ ├── test_birch.py │ ├── test_dbscan.py │ ├── test_feature_agglomeration.py │ ├── test_hierarchical.py │ ├── test_k_means.py │ ├── test_mean_shift.py │ ├── test_optics.py │ └── test_spectral.py ├── compose/ │ ├── __init__.py │ ├── _column_transformer.py │ ├── _target.py │ └── tests/ │ ├── __init__.py │ ├── test_column_transformer.py │ └── test_target.py ├── conftest.py ├── covariance/ │ ├── __init__.py │ ├── _elliptic_envelope.py │ ├── _empirical_covariance.py │ ├── _graph_lasso.py │ ├── _robust_covariance.py │ ├── _shrunk_covariance.py │ └── tests/ │ ├── __init__.py │ ├── test_covariance.py │ ├── test_elliptic_envelope.py │ ├── test_graphical_lasso.py │ └── test_robust_covariance.py ├── cross_decomposition/ │ ├── __init__.py │ ├── _pls.py │ └── tests/ │ ├── __init__.py │ └── test_pls.py ├── datasets/ │ ├── __init__.py │ ├── _base.py │ ├── _california_housing.py │ ├── _covtype.py │ ├── _kddcup99.py │ ├── _lfw.py │ ├── _olivetti_faces.py │ ├── _openml.py │ ├── _rcv1.py │ ├── _samples_generator.py │ ├── _species_distributions.py │ ├── _svmlight_format_fast.pyx │ ├── _svmlight_format_io.py │ ├── _twenty_newsgroups.py │ ├── data/ │ │ ├── __init__.py │ │ ├── boston_house_prices.csv │ │ ├── breast_cancer.csv │ │ ├── iris.csv │ │ ├── linnerud_exercise.csv │ │ ├── linnerud_physiological.csv │ │ └── wine_data.csv │ ├── descr/ │ │ ├── __init__.py │ │ ├── boston_house_prices.rst │ │ ├── breast_cancer.rst │ │ ├── california_housing.rst │ │ ├── covtype.rst │ │ ├── diabetes.rst │ │ ├── digits.rst │ │ ├── iris.rst │ │ ├── kddcup99.rst │ │ ├── lfw.rst │ │ ├── linnerud.rst │ │ ├── olivetti_faces.rst │ │ ├── rcv1.rst │ │ ├── twenty_newsgroups.rst │ │ └── wine_data.rst │ ├── images/ │ │ ├── README.txt │ │ └── __init__.py │ ├── setup.py │ └── tests/ │ ├── __init__.py │ ├── conftest.py │ ├── data/ │ │ ├── __init__.py │ │ ├── openml/ │ │ │ ├── __init__.py │ │ │ ├── id_1/ │ │ │ │ └── __init__.py │ │ │ ├── id_1119/ │ │ │ │ └── __init__.py │ │ │ ├── id_2/ │ │ │ │ └── __init__.py │ │ │ ├── id_292/ │ │ │ │ └── __init__.py │ │ │ ├── id_3/ │ │ │ │ └── __init__.py │ │ │ ├── id_40589/ │ │ │ │ └── __init__.py │ │ │ ├── id_40675/ │ │ │ │ └── __init__.py │ │ │ ├── id_40945/ │ │ │ │ └── __init__.py │ │ │ ├── id_40966/ │ │ │ │ └── __init__.py │ │ │ ├── id_42585/ │ │ │ │ └── __init__.py │ │ │ ├── id_561/ │ │ │ │ └── __init__.py │ │ │ ├── id_61/ │ │ │ │ └── __init__.py │ │ │ └── id_62/ │ │ │ └── __init__.py │ │ ├── svmlight_classification.txt │ │ ├── svmlight_invalid.txt │ │ ├── svmlight_invalid_order.txt │ │ └── svmlight_multilabel.txt │ ├── test_20news.py │ ├── test_base.py │ ├── test_california_housing.py │ ├── test_common.py │ ├── test_covtype.py │ ├── test_kddcup99.py │ ├── test_lfw.py │ ├── test_olivetti_faces.py │ ├── test_openml.py │ ├── test_rcv1.py │ ├── test_samples_generator.py │ └── test_svmlight_format.py ├── decomposition/ │ ├── __init__.py │ ├── _base.py │ ├── _cdnmf_fast.pyx │ ├── _dict_learning.py │ ├── _factor_analysis.py │ ├── _fastica.py │ ├── _incremental_pca.py │ ├── _kernel_pca.py │ ├── _lda.py │ ├── _nmf.py │ ├── _online_lda_fast.pyx │ ├── _pca.py │ ├── _sparse_pca.py │ ├── _truncated_svd.py │ ├── setup.py │ └── tests/ │ ├── __init__.py │ ├── test_dict_learning.py │ ├── test_factor_analysis.py │ ├── test_fastica.py │ ├── test_incremental_pca.py │ ├── test_kernel_pca.py │ ├── test_nmf.py │ ├── test_online_lda.py │ ├── test_pca.py │ ├── test_sparse_pca.py │ └── test_truncated_svd.py ├── discriminant_analysis.py ├── dummy.py ├── ensemble/ │ ├── __init__.py │ ├── _bagging.py │ ├── _base.py │ ├── _forest.py │ ├── _gb.py │ ├── _gb_losses.py │ ├── _gradient_boosting.pyx │ ├── _hist_gradient_boosting/ │ │ ├── __init__.py │ │ ├── _binning.pyx │ │ ├── _bitset.pxd │ │ ├── _bitset.pyx │ │ ├── _gradient_boosting.pyx │ │ ├── _loss.pyx │ │ ├── _predictor.pyx │ │ ├── binning.py │ │ ├── common.pxd │ │ ├── common.pyx │ │ ├── gradient_boosting.py │ │ ├── grower.py │ │ ├── histogram.pyx │ │ ├── loss.py │ │ ├── predictor.py │ │ ├── splitting.pyx │ │ ├── tests/ │ │ │ ├── __init__.py │ │ │ ├── test_binning.py │ │ │ ├── test_bitset.py │ │ │ ├── test_compare_lightgbm.py │ │ │ ├── test_gradient_boosting.py │ │ │ ├── test_grower.py │ │ │ ├── test_histogram.py │ │ │ ├── test_loss.py │ │ │ ├── test_monotonic_contraints.py │ │ │ ├── test_predictor.py │ │ │ ├── test_splitting.py │ │ │ └── test_warm_start.py │ │ └── utils.pyx │ ├── _iforest.py │ ├── _stacking.py │ ├── _voting.py │ ├── _weight_boosting.py │ ├── setup.py │ └── tests/ │ ├── __init__.py │ ├── test_bagging.py │ ├── test_base.py │ ├── test_common.py │ ├── test_forest.py │ ├── test_gradient_boosting.py │ ├── test_gradient_boosting_loss_functions.py │ ├── test_iforest.py │ ├── test_stacking.py │ ├── test_voting.py │ └── test_weight_boosting.py ├── exceptions.py ├── experimental/ │ ├── __init__.py │ ├── enable_halving_search_cv.py │ ├── enable_hist_gradient_boosting.py │ ├── enable_iterative_imputer.py │ └── tests/ │ ├── __init__.py │ ├── test_enable_hist_gradient_boosting.py │ ├── test_enable_iterative_imputer.py │ └── test_enable_successive_halving.py ├── externals/ │ ├── README │ ├── __init__.py │ ├── _arff.py │ ├── _lobpcg.py │ ├── _packaging/ │ │ ├── __init__.py │ │ ├── _structures.py │ │ └── version.py │ ├── _pilutil.py │ └── conftest.py ├── feature_extraction/ │ ├── __init__.py │ ├── _dict_vectorizer.py │ ├── _hash.py │ ├── _hashing_fast.pyx │ ├── _stop_words.py │ ├── image.py │ ├── setup.py │ ├── tests/ │ │ ├── __init__.py │ │ ├── test_dict_vectorizer.py │ │ ├── test_feature_hasher.py │ │ ├── test_image.py │ │ └── test_text.py │ └── text.py ├── feature_selection/ │ ├── __init__.py │ ├── _base.py │ ├── _from_model.py │ ├── _mutual_info.py │ ├── _rfe.py │ ├── _sequential.py │ ├── _univariate_selection.py │ ├── _variance_threshold.py │ └── tests/ │ ├── __init__.py │ ├── test_base.py │ ├── test_chi2.py │ ├── test_feature_select.py │ ├── test_from_model.py │ ├── test_mutual_info.py │ ├── test_rfe.py │ ├── test_sequential.py │ └── test_variance_threshold.py ├── gaussian_process/ │ ├── __init__.py │ ├── _gpc.py │ ├── _gpr.py │ ├── kernels.py │ └── tests/ │ ├── __init__.py │ ├── _mini_sequence_kernel.py │ ├── test_gpc.py │ ├── test_gpr.py │ └── test_kernels.py ├── impute/ │ ├── __init__.py │ ├── _base.py │ ├── _iterative.py │ ├── _knn.py │ └── tests/ │ ├── __init__.py │ ├── test_base.py │ ├── test_common.py │ ├── test_impute.py │ └── test_knn.py ├── inspection/ │ ├── __init__.py │ ├── _partial_dependence.py │ ├── _permutation_importance.py │ ├── _plot/ │ │ ├── __init__.py │ │ ├── partial_dependence.py │ │ └── tests/ │ │ ├── __init__.py │ │ └── test_plot_partial_dependence.py │ ├── setup.py │ └── tests/ │ ├── __init__.py │ ├── test_partial_dependence.py │ └── test_permutation_importance.py ├── isotonic.py ├── kernel_approximation.py ├── kernel_ridge.py ├── linear_model/ │ ├── __init__.py │ ├── _base.py │ ├── _bayes.py │ ├── _cd_fast.pyx │ ├── _coordinate_descent.py │ ├── _glm/ │ │ ├── __init__.py │ │ ├── glm.py │ │ ├── link.py │ │ └── tests/ │ │ ├── __init__.py │ │ ├── test_glm.py │ │ └── test_link.py │ ├── _huber.py │ ├── _least_angle.py │ ├── _logistic.py │ ├── _omp.py │ ├── _passive_aggressive.py │ ├── _perceptron.py │ ├── _quantile.py │ ├── _ransac.py │ ├── _ridge.py │ ├── _sag.py │ ├── _sag_fast.pyx.tp │ ├── _sgd_fast.pxd │ ├── _sgd_fast.pyx │ ├── _sgd_fast_helpers.h │ ├── _stochastic_gradient.py │ ├── _theil_sen.py │ ├── setup.py │ └── tests/ │ ├── __init__.py │ ├── test_base.py │ ├── test_bayes.py │ ├── test_common.py │ ├── test_coordinate_descent.py │ ├── test_huber.py │ ├── test_least_angle.py │ ├── test_logistic.py │ ├── test_omp.py │ ├── test_passive_aggressive.py │ ├── test_perceptron.py │ ├── test_quantile.py │ ├── test_ransac.py │ ├── test_ridge.py │ ├── test_sag.py │ ├── test_sgd.py │ ├── test_sparse_coordinate_descent.py │ └── test_theil_sen.py ├── manifold/ │ ├── __init__.py │ ├── _barnes_hut_tsne.pyx │ ├── _isomap.py │ ├── _locally_linear.py │ ├── _mds.py │ ├── _spectral_embedding.py │ ├── _t_sne.py │ ├── _utils.pyx │ ├── setup.py │ └── tests/ │ ├── __init__.py │ ├── test_isomap.py │ ├── test_locally_linear.py │ ├── test_mds.py │ ├── test_spectral_embedding.py │ └── test_t_sne.py ├── metrics/ │ ├── __init__.py │ ├── _base.py │ ├── _classification.py │ ├── _dist_metrics.pxd │ ├── _dist_metrics.pyx │ ├── _pairwise_fast.pyx │ ├── _plot/ │ │ ├── __init__.py │ │ ├── base.py │ │ ├── confusion_matrix.py │ │ ├── det_curve.py │ │ ├── precision_recall_curve.py │ │ ├── roc_curve.py │ │ └── tests/ │ │ ├── __init__.py │ │ ├── test_base.py │ │ ├── test_common_curve_display.py │ │ ├── test_confusion_matrix_display.py │ │ ├── test_det_curve_display.py │ │ ├── test_plot_confusion_matrix.py │ │ ├── test_plot_curve_common.py │ │ ├── test_plot_det_curve.py │ │ ├── test_plot_precision_recall.py │ │ ├── test_plot_roc_curve.py │ │ ├── test_precision_recall_display.py │ │ └── test_roc_curve_display.py │ ├── _ranking.py │ ├── _regression.py │ ├── _scorer.py │ ├── cluster/ │ │ ├── __init__.py │ │ ├── _bicluster.py │ │ ├── _expected_mutual_info_fast.pyx │ │ ├── _supervised.py │ │ ├── _unsupervised.py │ │ ├── setup.py │ │ └── tests/ │ │ ├── __init__.py │ │ ├── test_bicluster.py │ │ ├── test_common.py │ │ ├── test_supervised.py │ │ └── test_unsupervised.py │ ├── pairwise.py │ ├── setup.py │ └── tests/ │ ├── __init__.py │ ├── test_classification.py │ ├── test_common.py │ ├── test_dist_metrics.py │ ├── test_pairwise.py │ ├── test_ranking.py │ ├── test_regression.py │ └── test_score_objects.py ├── mixture/ │ ├── __init__.py │ ├── _base.py │ ├── _bayesian_mixture.py │ ├── _gaussian_mixture.py │ └── tests/ │ ├── __init__.py │ ├── test_bayesian_mixture.py │ ├── test_gaussian_mixture.py │ └── test_mixture.py ├── model_selection/ │ ├── __init__.py │ ├── _search.py │ ├── _search_successive_halving.py │ ├── _split.py │ ├── _validation.py │ └── tests/ │ ├── __init__.py │ ├── common.py │ ├── test_search.py │ ├── test_split.py │ ├── test_successive_halving.py │ └── test_validation.py ├── multiclass.py ├── multioutput.py ├── naive_bayes.py ├── neighbors/ │ ├── __init__.py │ ├── _ball_tree.pyx │ ├── _base.py │ ├── _binary_tree.pxi │ ├── _classification.py │ ├── _distance_metric.py │ ├── _graph.py │ ├── _kd_tree.pyx │ ├── _kde.py │ ├── _lof.py │ ├── _nca.py │ ├── _nearest_centroid.py │ ├── _partition_nodes.pxd │ ├── _partition_nodes.pyx │ ├── _quad_tree.pxd │ ├── _quad_tree.pyx │ ├── _regression.py │ ├── _unsupervised.py │ ├── setup.py │ └── tests/ │ ├── __init__.py │ ├── test_ball_tree.py │ ├── test_graph.py │ ├── test_kd_tree.py │ ├── test_kde.py │ ├── test_lof.py │ ├── test_nca.py │ ├── test_nearest_centroid.py │ ├── test_neighbors.py │ ├── test_neighbors_pipeline.py │ ├── test_neighbors_tree.py │ └── test_quad_tree.py ├── neural_network/ │ ├── __init__.py │ ├── _base.py │ ├── _multilayer_perceptron.py │ ├── _rbm.py │ ├── _stochastic_optimizers.py │ └── tests/ │ ├── __init__.py │ ├── test_base.py │ ├── test_mlp.py │ ├── test_rbm.py │ └── test_stochastic_optimizers.py ├── pipeline.py ├── preprocessing/ │ ├── __init__.py │ ├── _csr_polynomial_expansion.pyx │ ├── _data.py │ ├── _discretization.py │ ├── _encoders.py │ ├── _function_transformer.py │ ├── _label.py │ ├── _polynomial.py │ ├── setup.py │ └── tests/ │ ├── __init__.py │ ├── test_common.py │ ├── test_data.py │ ├── test_discretization.py │ ├── test_encoders.py │ ├── test_function_transformer.py │ ├── test_label.py │ └── test_polynomial.py ├── random_projection.py ├── semi_supervised/ │ ├── __init__.py │ ├── _label_propagation.py │ ├── _self_training.py │ └── tests/ │ ├── __init__.py │ ├── test_label_propagation.py │ └── test_self_training.py ├── setup.py ├── svm/ │ ├── __init__.py │ ├── _base.py │ ├── _bounds.py │ ├── _classes.py │ ├── _liblinear.pxi │ ├── _liblinear.pyx │ ├── _libsvm.pxi │ ├── _libsvm.pyx │ ├── _libsvm_sparse.pyx │ ├── _newrand.pyx │ ├── setup.py │ ├── src/ │ │ ├── liblinear/ │ │ │ ├── COPYRIGHT │ │ │ ├── _cython_blas_helpers.h │ │ │ ├── liblinear_helper.c │ │ │ ├── linear.cpp │ │ │ ├── linear.h │ │ │ ├── tron.cpp │ │ │ └── tron.h │ │ ├── libsvm/ │ │ │ ├── LIBSVM_CHANGES │ │ │ ├── _svm_cython_blas_helpers.h │ │ │ ├── libsvm_helper.c │ │ │ ├── libsvm_sparse_helper.c │ │ │ ├── libsvm_template.cpp │ │ │ ├── svm.cpp │ │ │ └── svm.h │ │ └── newrand/ │ │ └── newrand.h │ └── tests/ │ ├── __init__.py │ ├── test_bounds.py │ ├── test_sparse.py │ └── test_svm.py ├── tests/ │ ├── __init__.py │ ├── test_base.py │ ├── test_build.py │ ├── test_calibration.py │ ├── test_check_build.py │ ├── test_common.py │ ├── test_config.py │ ├── test_discriminant_analysis.py │ ├── test_docstring_parameters.py │ ├── test_dummy.py │ ├── test_init.py │ ├── test_isotonic.py │ ├── test_kernel_approximation.py │ ├── test_kernel_ridge.py │ ├── test_metaestimators.py │ ├── test_min_dependencies_readme.py │ ├── test_multiclass.py │ ├── test_multioutput.py │ ├── test_naive_bayes.py │ ├── test_pipeline.py │ └── test_random_projection.py ├── tree/ │ ├── __init__.py │ ├── _classes.py │ ├── _criterion.pxd │ ├── _criterion.pyx │ ├── _export.py │ ├── _reingold_tilford.py │ ├── _splitter.pxd │ ├── _splitter.pyx │ ├── _tree.pxd │ ├── _tree.pyx │ ├── _utils.pxd │ ├── _utils.pyx │ ├── setup.py │ └── tests/ │ ├── __init__.py │ ├── test_export.py │ ├── test_reingold_tilford.py │ └── test_tree.py └── utils/ ├── __init__.py ├── _arpack.py ├── _cython_blas.pxd ├── _cython_blas.pyx ├── _encode.py ├── _estimator_html_repr.py ├── _fast_dict.pxd ├── _fast_dict.pyx ├── _joblib.py ├── _logistic_sigmoid.pyx ├── _mask.py ├── _mocking.py ├── _openmp_helpers.pyx ├── _pprint.py ├── _random.pxd ├── _random.pyx ├── _readonly_array_wrapper.pyx ├── _seq_dataset.pxd.tp ├── _seq_dataset.pyx.tp ├── _show_versions.py ├── _tags.py ├── _testing.py ├── _typedefs.pxd ├── _typedefs.pyx ├── _weight_vector.pxd.tp ├── _weight_vector.pyx.tp ├── arrayfuncs.pyx ├── class_weight.py ├── deprecation.py ├── estimator_checks.py ├── extmath.py ├── fixes.py ├── graph.py ├── metaestimators.py ├── multiclass.py ├── murmurhash.pxd ├── murmurhash.pyx ├── optimize.py ├── random.py ├── setup.py ├── sparsefuncs.py ├── sparsefuncs_fast.pyx ├── src/ │ ├── MurmurHash3.cpp │ └── MurmurHash3.h ├── stats.py ├── tests/ │ ├── __init__.py │ ├── conftest.py │ ├── test_arpack.py │ ├── test_arrayfuncs.py │ ├── test_class_weight.py │ ├── test_cython_blas.py │ ├── test_cython_templating.py │ ├── test_deprecation.py │ ├── test_encode.py │ ├── test_estimator_checks.py │ ├── test_estimator_html_repr.py │ ├── test_extmath.py │ ├── test_fast_dict.py │ ├── test_fixes.py │ ├── test_graph.py │ ├── test_metaestimators.py │ ├── test_mocking.py │ ├── test_multiclass.py │ ├── test_murmurhash.py │ ├── test_optimize.py │ ├── test_parallel.py │ ├── test_pprint.py │ ├── test_random.py │ ├── test_readonly_wrapper.py │ ├── test_seq_dataset.py │ ├── test_shortest_path.py │ ├── test_show_versions.py │ ├── test_sparsefuncs.py │ ├── test_stats.py │ ├── test_tags.py │ ├── test_testing.py │ ├── test_utils.py │ ├── test_validation.py │ └── test_weight_vector.py └── validation.py