gitextract_kz0ipva0/ ├── .git-blame-ignore-revs ├── .gitattributes ├── .gitignore ├── .gitlab-ci.yml ├── BUILD.md ├── CHANGELOG.md ├── Dockerfile ├── INSTALL.md ├── LICENSE.txt ├── README.md ├── VERSION ├── benchmarks/ │ ├── Dockerfile │ ├── README.md │ ├── benchmark_plots.ipynb │ ├── benchmarks/ │ │ ├── __init__.py │ │ ├── benchmarks.py │ │ ├── demo/ │ │ │ ├── __init__.py │ │ │ ├── add_original_columns.py │ │ │ ├── benchmark.py │ │ │ ├── cesiumml_builder.py │ │ │ ├── ft_time_series_builder.py │ │ │ ├── kats_builder.py │ │ │ ├── load.py │ │ │ ├── print_time_taken.py │ │ │ ├── remove_target_column.py │ │ │ ├── rolling.py │ │ │ ├── tsfel_builder.py │ │ │ ├── tsfel_builder_roll.py │ │ │ ├── tsflex_aggregations.py │ │ │ ├── tsflex_builder.py │ │ │ └── tsfresh_builder.py │ │ ├── drivers/ │ │ │ ├── __init__.py │ │ │ ├── drive_getml.py │ │ │ └── drive_wrappers.py │ │ ├── pyproject.toml │ │ ├── run_all.py │ │ └── utils.py │ ├── docker-compose.yml │ ├── paper_data.txt │ ├── requirements.for-fbprophet.txt │ ├── requirements.for-kats.txt │ ├── requirements.for-pystan.txt │ ├── requirements.txt │ ├── run_benchmarks.py │ └── run_benchmarks.sh ├── demo-notebooks/ │ ├── Dockerfile │ ├── README.md │ ├── adventure_works.ipynb │ ├── docker-compose.yml │ ├── formula1.ipynb │ ├── interstate94.ipynb │ ├── loans.ipynb │ ├── requirements.txt │ ├── robot.ipynb │ └── seznam.ipynb ├── docker-bake.hcl ├── mise.toml ├── runtime/ │ ├── Dockerfile │ ├── README.md │ ├── docker-compose.yml │ └── entrypoint.sh ├── scripts/ │ └── build └── src/ ├── getml-app/ │ ├── README.md │ ├── format.sh │ ├── setup.sh │ └── src/ │ ├── changeToResourceDir.go │ ├── commands/ │ │ ├── Parse.go │ │ ├── addHomeDirFlag.go │ │ ├── loadConfig.go │ │ ├── makeInstallCommand.go │ │ ├── makeRunCommand.go │ │ ├── makeStopCommand.go │ │ ├── makeUninstallCommand.go │ │ ├── parseHomeDirFlag.go │ │ └── printHelpMenu.go │ ├── config/ │ │ ├── CommandLine.go │ │ ├── Config.go │ │ ├── Load.go │ │ ├── MonitorConfig.go │ │ └── parseHomeDirFlag.go │ ├── createConnectionToEngine.go │ ├── data/ │ │ ├── Projects.go │ │ └── StandardVariables.go │ ├── go.mod │ ├── install/ │ │ ├── All.go │ │ ├── FileExists.go │ │ ├── GetBinDir.go │ │ ├── GetConfigPath.go │ │ ├── GetHomeDir.go │ │ ├── GetMainDir.go │ │ ├── UsrLocal.go │ │ ├── copyDir.go │ │ ├── copyFile.go │ │ ├── copyResources.go │ │ └── filesExists.go │ ├── main.go │ ├── makePackageName.go │ ├── printStartMessage.go │ ├── stopExistingProcess.go │ ├── tcp/ │ │ ├── MainHandler.go │ │ ├── Server.go │ │ ├── basicCommand.go │ │ ├── cmd.go │ │ ├── command.go │ │ ├── createConnectionToEngine.go │ │ ├── isAlive.go │ │ ├── loadPipelineFromDisc.go │ │ ├── logger.go │ │ ├── makeUniqueProjectName.go │ │ ├── marshalCommand.go │ │ ├── portIsOccupied.go │ │ ├── progressLogger.go │ │ ├── recvBytes.go │ │ ├── recvCmd.go │ │ ├── recvString.go │ │ ├── sendBytes.go │ │ ├── sendCommand.go │ │ ├── sendString.go │ │ └── startProcess.go │ └── uninstall.go ├── package-build-imports/ │ ├── config.json │ ├── environment.json │ ├── jwks.pub.json │ └── tests/ │ ├── test1/ │ │ ├── PERIPHERAL.CSV │ │ └── POPULATION.CSV │ └── test2/ │ ├── PERIPHERAL.CSV │ └── POPULATION.CSV └── python-api/ ├── LICENSE ├── README.md ├── getml/ │ ├── __init__.py │ ├── communication.py │ ├── constants.py │ ├── cross_validation.py │ ├── data/ │ │ ├── __init__.py │ │ ├── _io/ │ │ │ ├── arrow.py │ │ │ ├── csv.py │ │ │ └── parquet.py │ │ ├── access.py │ │ ├── columns/ │ │ │ ├── __init__.py │ │ │ ├── aggregation.py │ │ │ ├── collect_footer_data.py │ │ │ ├── column.py │ │ │ ├── columns.py │ │ │ ├── constants.py │ │ │ ├── format.py │ │ │ ├── from_value.py │ │ │ ├── get_scalar.py │ │ │ ├── last_change.py │ │ │ ├── last_change_from_col.py │ │ │ ├── length.py │ │ │ ├── length_property.py │ │ │ ├── make_iter.py │ │ │ ├── parse.py │ │ │ ├── random.py │ │ │ ├── repr.py │ │ │ ├── repr_html.py │ │ │ ├── subroles.py │ │ │ ├── to_arrow.py │ │ │ ├── to_numpy.py │ │ │ ├── unique.py │ │ │ └── unit.py │ │ ├── concat.py │ │ ├── container.py │ │ ├── data_frame.py │ │ ├── data_model.py │ │ ├── diagram.py │ │ ├── helpers.py │ │ ├── helpers2.py │ │ ├── load_container.py │ │ ├── placeholder.py │ │ ├── relationship.py │ │ ├── roles/ │ │ │ ├── __init__.py │ │ │ ├── container.py │ │ │ ├── roles.py │ │ │ ├── sets.py │ │ │ └── types.py │ │ ├── split/ │ │ │ ├── __init__.py │ │ │ ├── concat.py │ │ │ ├── random.py │ │ │ └── time.py │ │ ├── staging.py │ │ ├── star_schema.py │ │ ├── subroles/ │ │ │ ├── __init__.py │ │ │ ├── exclude.py │ │ │ ├── include.py │ │ │ ├── only.py │ │ │ ├── sets.py │ │ │ └── types.py │ │ ├── subset.py │ │ ├── time.py │ │ ├── time_series.py │ │ └── view.py │ ├── database/ │ │ ├── __init__.py │ │ ├── connect_bigquery.py │ │ ├── connect_duckdb.py │ │ ├── connect_greenplum.py │ │ ├── connect_hana.py │ │ ├── connect_mariadb.py │ │ ├── connect_mysql.py │ │ ├── connect_odbc.py │ │ ├── connect_postgres.py │ │ ├── connect_sqlite3.py │ │ ├── connection.py │ │ ├── copy_table.py │ │ ├── drop_table.py │ │ ├── exceptions.py │ │ ├── execute.py │ │ ├── get.py │ │ ├── get_colnames.py │ │ ├── helpers.py │ │ ├── list_connections.py │ │ ├── list_tables.py │ │ ├── read_csv.py │ │ ├── read_s3.py │ │ ├── sniff_csv.py │ │ └── sniff_s3.py │ ├── datasets/ │ │ ├── __init__.py │ │ ├── base.py │ │ └── samples_generator.py │ ├── engine/ │ │ ├── __init__.py │ │ ├── _launch.py │ │ └── helpers.py │ ├── events/ │ │ ├── __init__.py │ │ ├── dispatchers.py │ │ ├── emitters.py │ │ ├── handlers.py │ │ ├── parsers.py │ │ ├── regex.py │ │ └── types.py │ ├── exceptions.py │ ├── feature_learning/ │ │ ├── __init__.py │ │ ├── aggregations/ │ │ │ ├── __init__.py │ │ │ ├── aggregations.py │ │ │ ├── sets.py │ │ │ └── types.py │ │ ├── fastboost.py │ │ ├── fastprop.py │ │ ├── feature_learner.py │ │ ├── loss_functions.py │ │ ├── multirel.py │ │ ├── relboost.py │ │ ├── relmt.py │ │ └── validation.py │ ├── helpers.py │ ├── hyperopt/ │ │ ├── __init__.py │ │ ├── burn_in.py │ │ ├── helpers.py │ │ ├── hyperopt.py │ │ ├── kernels.py │ │ ├── load_hyperopt.py │ │ ├── optimization.py │ │ ├── tuning.py │ │ └── validation.py │ ├── log.py │ ├── pipeline/ │ │ ├── __init__.py │ │ ├── column.py │ │ ├── columns.py │ │ ├── dialect.py │ │ ├── feature.py │ │ ├── features.py │ │ ├── helpers.py │ │ ├── helpers2.py │ │ ├── issues.py │ │ ├── metadata.py │ │ ├── metrics.py │ │ ├── pipeline.py │ │ ├── plots.py │ │ ├── score.py │ │ ├── scores_container.py │ │ ├── sql_code.py │ │ ├── sql_string.py │ │ ├── table.py │ │ ├── tables.py │ │ └── tags.py │ ├── predictors/ │ │ ├── __init__.py │ │ ├── linear_regression.py │ │ ├── logistic_regression.py │ │ ├── predictor.py │ │ ├── scale_gbm_classifier.py │ │ ├── scale_gbm_regressor.py │ │ ├── xgboost_classifier.py │ │ └── xgboost_regressor.py │ ├── preprocessors/ │ │ ├── __init__.py │ │ ├── category_trimmer.py │ │ ├── email_domain.py │ │ ├── imputation.py │ │ ├── mapping.py │ │ ├── preprocessor.py │ │ ├── seasonal.py │ │ ├── substring.py │ │ ├── text_field_splitter.py │ │ └── validate.py │ ├── project/ │ │ ├── __init__.py │ │ ├── attrs.py │ │ └── containers/ │ │ ├── __init__.py │ │ ├── data_frames.py │ │ ├── hyperopts.py │ │ └── pipelines.py │ ├── spark.py │ ├── sqlite3/ │ │ ├── __init__.py │ │ ├── connect.py │ │ ├── contains.py │ │ ├── count_above_mean.py │ │ ├── count_below_mean.py │ │ ├── count_distinct_over_count.py │ │ ├── email_domain.py │ │ ├── ewma.py │ │ ├── ewma_trend.py │ │ ├── execute.py │ │ ├── first.py │ │ ├── get_word.py │ │ ├── helpers.py │ │ ├── kurtosis.py │ │ ├── last.py │ │ ├── median.py │ │ ├── mode.py │ │ ├── num_max.py │ │ ├── num_min.py │ │ ├── num_words.py │ │ ├── quantiles.py │ │ ├── read_csv.py │ │ ├── read_list.py │ │ ├── read_pandas.py │ │ ├── skew.py │ │ ├── sniff_csv.py │ │ ├── sniff_pandas.py │ │ ├── split_text_field.py │ │ ├── stddev.py │ │ ├── time_since_first_maximum.py │ │ ├── time_since_first_minimum.py │ │ ├── time_since_last_maximum.py │ │ ├── time_since_last_minimum.py │ │ ├── to_list.py │ │ ├── to_pandas.py │ │ ├── trend.py │ │ ├── var.py │ │ └── variation_coefficient.py │ ├── utilities/ │ │ ├── __init__.py │ │ ├── formatting/ │ │ │ ├── __init__.py │ │ │ ├── cell_formatter.py │ │ │ ├── column_formatter.py │ │ │ ├── data_frame_formatter.py │ │ │ ├── ellipsis.py │ │ │ ├── formatter.py │ │ │ ├── helpers.py │ │ │ ├── signature_formatter.py │ │ │ └── view_formatter.py │ │ ├── progress.py │ │ └── templates/ │ │ ├── __init__.py │ │ ├── column.jinja2 │ │ ├── container.jinja2 │ │ └── data_frame.jinja2 │ └── version.py ├── hatch_build.py ├── pyproject.toml └── tests/ ├── __init__.py ├── conftest.py ├── data/ │ ├── __init__.py │ ├── conftest.py │ ├── test_arrow_type_casts.py │ ├── test_columns.py │ ├── test_concat.py │ ├── test_data_frame.py │ ├── test_data_frames.py │ ├── test_from_query.py │ ├── test_io_read.py │ ├── test_io_stream.py │ ├── test_io_write.py │ ├── test_save_and_load.py │ └── test_subsetting.py ├── datasets/ │ ├── __init__.py │ └── test_base.py ├── engine/ │ ├── test_launch.py │ ├── test_set_project.py │ └── test_shutdown.py ├── pipeline/ │ ├── __init__.py │ ├── test_adventure_works.py │ ├── test_interstate94.py │ ├── test_loans.py │ ├── test_pipelines_save_load.py │ └── test_robot.py ├── project/ │ └── test_project_save_load.py └── unit/ ├── __init__.py ├── conftest.py ├── data/ │ ├── test_arrow_schema_processors.py │ ├── test_data_frame_init.py │ └── test_subsetting.py ├── test_events.py ├── test_exceptions.py ├── test_import_all.py ├── test_locate.py └── test_progress_bar.py