gitextract_l1ifb68j/ ├── .actrc ├── .deepsource.toml ├── .devcontainer/ │ ├── Dockerfile │ └── devcontainer.json ├── .github/ │ ├── ISSUE_TEMPLATE/ │ │ ├── bug_report.md │ │ └── feature_request.md │ ├── pull_request_template.md │ └── workflows/ │ ├── docker.yml │ ├── pytest.yml │ ├── pytest_slow.yml │ ├── schema.yml │ ├── test-results.yml │ └── upload-pypi.yml ├── .gitignore ├── .nojekyll ├── .pre-commit-config.yaml ├── .protolint.yaml ├── .vscode/ │ └── settings.json ├── CODEOWNERS ├── CODE_OF_CONDUCT.md ├── CONTRIBUTING.md ├── LICENSE ├── MANIFEST.in ├── NOTICE ├── README.md ├── README_KR.md ├── RELEASES.md ├── docker/ │ ├── README.md │ ├── ludwig/ │ │ └── Dockerfile │ ├── ludwig-gpu/ │ │ └── Dockerfile │ ├── ludwig-ray/ │ │ └── Dockerfile │ └── ludwig-ray-gpu/ │ └── Dockerfile ├── examples/ │ ├── README.md │ ├── calibration/ │ │ ├── README.md │ │ ├── train_forest_cover_calibrated.py │ │ └── train_mushroom_edibility_calibrated.py │ ├── class_imbalance/ │ │ ├── README.md │ │ ├── balanced_model_config.yaml │ │ ├── model_training.py │ │ ├── model_training_results.ipynb │ │ └── standard_model_config.yaml │ ├── forecasting/ │ │ ├── README.md │ │ └── config.yaml │ ├── getting_started/ │ │ ├── rotten_tomatoes.yaml │ │ └── run.sh │ ├── hyperopt/ │ │ ├── README.md │ │ └── model_hyperopt_example.ipynb │ ├── insurance_lite/ │ │ ├── config.yaml │ │ └── train.py │ ├── kfold_cv/ │ │ ├── README.md │ │ ├── display_kfold_cv_results.py │ │ ├── k-fold_cv_classification.sh │ │ ├── prepare_classification_data_set.py │ │ └── regression_example.ipynb │ ├── lbfgs/ │ │ ├── config.yaml │ │ └── model.py │ ├── llama2_7b_finetuning_4bit/ │ │ ├── README.md │ │ ├── llama2_7b_4bit.yaml │ │ ├── run_train.sh │ │ └── train_alpaca.py │ ├── llm_base_model_dequantization/ │ │ ├── README.md │ │ └── phi_2_dequantization.py │ ├── llm_few_shot_learning/ │ │ └── simple_model_training.py │ ├── llm_finetuning/ │ │ ├── README.md │ │ ├── imdb_deepspeed_zero3.yaml │ │ ├── imdb_deepspeed_zero3_ray.yaml │ │ ├── run_train_dsz3.sh │ │ ├── run_train_dsz3_ray.sh │ │ └── train_imdb_ray.py │ ├── llm_instruction_tuning/ │ │ └── train_alpaca_ray.py │ ├── llm_text_generation/ │ │ └── simple_model_training.py │ ├── llm_zero_shot_learning/ │ │ └── simple_model_training.py │ ├── mnist/ │ │ ├── README.md │ │ ├── advanced_model_training.py │ │ ├── assess_model_performance.py │ │ ├── config.yaml │ │ ├── simple_model_training.py │ │ └── visualize_model_test_results.ipynb │ ├── ray/ │ │ └── kubernetes/ │ │ ├── README.md │ │ ├── clusters/ │ │ │ ├── ludwig-ray-cpu-cluster.yaml │ │ │ └── ludwig-ray-gpu-cluster.yaml │ │ └── utils/ │ │ ├── attach.sh │ │ ├── dashboard.sh │ │ ├── krsync.sh │ │ ├── ray_down.sh │ │ ├── ray_up.sh │ │ ├── rsync_up.sh │ │ ├── submit.sh │ │ └── upload.sh │ ├── regex_freezing/ │ │ ├── ecd_freezing_with_regex_training.py │ │ └── llm_freezing_with_regex_training.py │ ├── semantic_segmentation/ │ │ ├── camseq.py │ │ └── config_camseq.yaml │ ├── serve/ │ │ ├── README.md │ │ └── client_program.py │ ├── synthetic/ │ │ └── train.py │ ├── tabnet/ │ │ └── higgs/ │ │ ├── medium_config.yaml │ │ ├── small_config.yaml │ │ ├── train_higgs_medium.py │ │ └── train_higgs_small.py │ ├── titanic/ │ │ ├── README.md │ │ ├── model1_config.yaml │ │ ├── model2_config.yaml │ │ ├── model_training_results.ipynb │ │ ├── multiple_model_training.py │ │ └── simple_model_training.py │ ├── twitter_bots/ │ │ ├── README.md │ │ ├── train_twitter_bots.py │ │ └── train_twitter_bots_text_only.py │ ├── wine_quality/ │ │ ├── README.md │ │ └── model_defaults_example.ipynb │ └── wmt15/ │ ├── config_large.yaml │ ├── config_small.yaml │ └── train_nmt.py ├── ludwig/ │ ├── __init__.py │ ├── accounting/ │ │ ├── __init__.py │ │ └── used_tokens.py │ ├── api.py │ ├── api_annotations.py │ ├── automl/ │ │ ├── __init__.py │ │ ├── auto_tune_config.py │ │ ├── automl.py │ │ ├── base_config.py │ │ └── defaults/ │ │ ├── base_automl_config.yaml │ │ ├── combiner/ │ │ │ ├── concat_config.yaml │ │ │ ├── tabnet_config.yaml │ │ │ └── transformer_config.yaml │ │ ├── reference_configs.yaml │ │ └── text/ │ │ └── bert_config.yaml │ ├── backend/ │ │ ├── __init__.py │ │ ├── base.py │ │ ├── datasource.py │ │ ├── deepspeed.py │ │ ├── ray.py │ │ └── utils/ │ │ ├── __init__.py │ │ └── storage.py │ ├── benchmarking/ │ │ ├── README.md │ │ ├── __init__.py │ │ ├── artifacts.py │ │ ├── benchmark.py │ │ ├── examples/ │ │ │ ├── benchmarking_config.yaml │ │ │ └── process_config.py │ │ ├── profiler.py │ │ ├── profiler_callbacks.py │ │ ├── profiler_dataclasses.py │ │ ├── reporting.py │ │ ├── summarize.py │ │ ├── summary_dataclasses.py │ │ └── utils.py │ ├── callbacks.py │ ├── check.py │ ├── cli.py │ ├── collect.py │ ├── combiners/ │ │ ├── __init__.py │ │ └── combiners.py │ ├── config_sampling/ │ │ ├── __init__.py │ │ ├── explore_schema.py │ │ └── parameter_sampling.py │ ├── config_validation/ │ │ ├── __init__.py │ │ ├── checks.py │ │ ├── preprocessing.py │ │ └── validation.py │ ├── constants.py │ ├── contrib.py │ ├── contribs/ │ │ ├── __init__.py │ │ ├── aim.py │ │ ├── comet.py │ │ ├── mlflow/ │ │ │ ├── __init__.py │ │ │ └── model.py │ │ └── wandb.py │ ├── data/ │ │ ├── __init__.py │ │ ├── batcher/ │ │ │ ├── __init__.py │ │ │ ├── base.py │ │ │ ├── bucketed.py │ │ │ ├── iterable.py │ │ │ ├── random_access.py │ │ │ └── test_batcher.py │ │ ├── cache/ │ │ │ ├── __init__.py │ │ │ ├── manager.py │ │ │ ├── types.py │ │ │ └── util.py │ │ ├── concatenate_datasets.py │ │ ├── dataframe/ │ │ │ ├── __init__.py │ │ │ ├── base.py │ │ │ ├── dask.py │ │ │ ├── modin.py │ │ │ └── pandas.py │ │ ├── dataset/ │ │ │ ├── __init__.py │ │ │ ├── base.py │ │ │ ├── pandas.py │ │ │ └── ray.py │ │ ├── dataset_synthesizer.py │ │ ├── negative_sampling.py │ │ ├── postprocessing.py │ │ ├── preprocessing.py │ │ ├── prompt.py │ │ ├── sampler.py │ │ ├── split.py │ │ ├── split_dataset.py │ │ └── utils.py │ ├── datasets/ │ │ ├── README.md │ │ ├── __init__.py │ │ ├── archives.py │ │ ├── configs/ │ │ │ ├── __init__.py │ │ │ ├── adult_census_income.yaml │ │ │ ├── ae_price_prediction.yaml │ │ │ ├── agnews.yaml │ │ │ ├── allstate_claims_severity.yaml │ │ │ ├── alpaca.yaml │ │ │ ├── amazon_employee_access_challenge.yaml │ │ │ ├── amazon_review_polarity.yaml │ │ │ ├── amazon_reviews.yaml │ │ │ ├── ames_housing.yaml │ │ │ ├── bbcnews.yaml │ │ │ ├── bnp_claims_management.yaml │ │ │ ├── bookprice_prediction.yaml │ │ │ ├── california_house_price.yaml │ │ │ ├── camseq.yaml │ │ │ ├── code_alpaca.yaml │ │ │ ├── connect4.yaml │ │ │ ├── consumer_complaints.yaml │ │ │ ├── consumer_complaints_generation.yaml │ │ │ ├── creditcard_fraud.yaml │ │ │ ├── customer_churn_prediction.yaml │ │ │ ├── data_scientist_salary.yaml │ │ │ ├── dbpedia.yaml │ │ │ ├── electricity.yaml │ │ │ ├── ethos_binary.yaml │ │ │ ├── fake_job_postings2.yaml │ │ │ ├── fever.yaml │ │ │ ├── flickr8k.yaml │ │ │ ├── forest_cover.yaml │ │ │ ├── goemotions.yaml │ │ │ ├── goodbooks_books.yaml │ │ │ ├── google_qa_answer_type_reason_explanation.yaml │ │ │ ├── google_qa_question_type_reason_explanation.yaml │ │ │ ├── google_quest_qa.yaml │ │ │ ├── higgs.yaml │ │ │ ├── hugging_face.yaml │ │ │ ├── ieee_fraud.yaml │ │ │ ├── imbalanced_insurance.yaml │ │ │ ├── imdb.yaml │ │ │ ├── imdb_genre_prediction.yaml │ │ │ ├── insurance_lite.yaml │ │ │ ├── iris.yaml │ │ │ ├── irony.yaml │ │ │ ├── jc_penney_products.yaml │ │ │ ├── jigsaw_unintended_bias.yaml │ │ │ ├── jigsaw_unintended_bias100k.yaml │ │ │ ├── kdd_appetency.yaml │ │ │ ├── kdd_churn.yaml │ │ │ ├── kdd_upselling.yaml │ │ │ ├── kick_starter_funding.yaml │ │ │ ├── melbourne_airbnb.yaml │ │ │ ├── mercari_price_suggestion.yaml │ │ │ ├── mercari_price_suggestion100K.yaml │ │ │ ├── mercedes_benz_greener.yaml │ │ │ ├── mnist.yaml │ │ │ ├── mushroom_edibility.yaml │ │ │ ├── naval.yaml │ │ │ ├── news_channel.yaml │ │ │ ├── news_popularity2.yaml │ │ │ ├── noshow_appointments.yaml │ │ │ ├── numerai28pt6.yaml │ │ │ ├── ohsumed_7400.yaml │ │ │ ├── ohsumed_cmu.yaml │ │ │ ├── otto_group_product.yaml │ │ │ ├── poker_hand.yaml │ │ │ ├── porto_seguro_safe_driver.yaml │ │ │ ├── product_sentiment_machine_hack.yaml │ │ │ ├── protein.yaml │ │ │ ├── reuters_cmu.yaml │ │ │ ├── reuters_r8.yaml │ │ │ ├── rossman_store_sales.yaml │ │ │ ├── santander_customer_satisfaction.yaml │ │ │ ├── santander_customer_transaction.yaml │ │ │ ├── santander_value_prediction.yaml │ │ │ ├── sarcastic_headlines.yaml │ │ │ ├── sarcos.yaml │ │ │ ├── sst2.yaml │ │ │ ├── sst3.yaml │ │ │ ├── sst5.yaml │ │ │ ├── synthetic_fraud.yaml │ │ │ ├── talkingdata_adtrack_fraud.yaml │ │ │ ├── telco_customer_churn.yaml │ │ │ ├── temperature.yaml │ │ │ ├── titanic.yaml │ │ │ ├── twitter_bots.yaml │ │ │ ├── walmart_recruiting.yaml │ │ │ ├── wine_reviews.yaml │ │ │ ├── wmt15.yaml │ │ │ ├── women_clothing_review.yaml │ │ │ ├── yahoo_answers.yaml │ │ │ ├── yelp_review_polarity.yaml │ │ │ ├── yelp_reviews.yaml │ │ │ └── yosemite.yaml │ │ ├── dataset_config.py │ │ ├── kaggle.py │ │ ├── loaders/ │ │ │ ├── __init__.py │ │ │ ├── adult_census_income.py │ │ │ ├── agnews.py │ │ │ ├── allstate_claims_severity.py │ │ │ ├── camseq.py │ │ │ ├── code_alpaca_loader.py │ │ │ ├── consumer_complaints_loader.py │ │ │ ├── creditcard_fraud.py │ │ │ ├── dataset_loader.py │ │ │ ├── ethos_binary.py │ │ │ ├── flickr8k.py │ │ │ ├── forest_cover.py │ │ │ ├── goemotions.py │ │ │ ├── higgs.py │ │ │ ├── hugging_face.py │ │ │ ├── ieee_fraud.py │ │ │ ├── insurance_lite.py │ │ │ ├── kdd_loader.py │ │ │ ├── mnist.py │ │ │ ├── naval.py │ │ │ ├── rossman_store_sales.py │ │ │ ├── santander_value_prediction.py │ │ │ ├── sarcastic_headlines.py │ │ │ ├── sarcos.py │ │ │ ├── split_loaders.py │ │ │ └── sst.py │ │ ├── model_configs/ │ │ │ ├── __init__.py │ │ │ ├── adult_census_income_default.yaml │ │ │ ├── allstate_claims_severity_default.yaml │ │ │ ├── ames_housing_default.yaml │ │ │ ├── bnp_claims_management_default.yaml │ │ │ ├── forest_cover_default.yaml │ │ │ ├── higgs_best.yaml │ │ │ ├── higgs_default.yaml │ │ │ ├── ieee_fraud_default.yaml │ │ │ ├── mercedes_benz_greener_default.yaml │ │ │ ├── mnist_default.yaml │ │ │ ├── mushroom_edibility_default.yaml │ │ │ ├── otto_group_product_default.yaml │ │ │ ├── poker_hand_default.yaml │ │ │ ├── porto_seguro_safe_driver_default.yaml │ │ │ ├── synthetic_fraud_default.yaml │ │ │ └── titanic_default.yaml │ │ └── utils.py │ ├── decoders/ │ │ ├── __init__.py │ │ ├── base.py │ │ ├── generic_decoders.py │ │ ├── image_decoders.py │ │ ├── llm_decoders.py │ │ ├── registry.py │ │ ├── sequence_decoder_utils.py │ │ ├── sequence_decoders.py │ │ ├── sequence_tagger.py │ │ └── utils.py │ ├── distributed/ │ │ ├── __init__.py │ │ ├── base.py │ │ ├── ddp.py │ │ ├── deepspeed.py │ │ └── fsdp.py │ ├── encoders/ │ │ ├── __init__.py │ │ ├── bag_encoders.py │ │ ├── base.py │ │ ├── category_encoders.py │ │ ├── date_encoders.py │ │ ├── generic_encoders.py │ │ ├── h3_encoders.py │ │ ├── image/ │ │ │ ├── __init__.py │ │ │ ├── base.py │ │ │ ├── timm.py │ │ │ └── torchvision.py │ │ ├── registry.py │ │ ├── sequence_encoders.py │ │ ├── set_encoders.py │ │ ├── text_encoders.py │ │ └── types.py │ ├── error.py │ ├── evaluate.py │ ├── experiment.py │ ├── explain/ │ │ ├── __init__.py │ │ ├── captum.py │ │ ├── captum_ray.py │ │ ├── explainer.py │ │ ├── explanation.py │ │ └── util.py │ ├── export.py │ ├── features/ │ │ ├── __init__.py │ │ ├── audio_feature.py │ │ ├── bag_feature.py │ │ ├── base_feature.py │ │ ├── binary_feature.py │ │ ├── category_feature.py │ │ ├── date_feature.py │ │ ├── feature_registries.py │ │ ├── feature_utils.py │ │ ├── h3_feature.py │ │ ├── image_feature.py │ │ ├── number_feature.py │ │ ├── sequence_feature.py │ │ ├── set_feature.py │ │ ├── text_feature.py │ │ ├── timeseries_feature.py │ │ └── vector_feature.py │ ├── forecast.py │ ├── globals.py │ ├── hyperopt/ │ │ ├── __init__.py │ │ ├── execution.py │ │ ├── results.py │ │ ├── run.py │ │ ├── search_algos.py │ │ └── utils.py │ ├── hyperopt_cli.py │ ├── model_export/ │ │ ├── base_model_exporter.py │ │ └── onnx_exporter.py │ ├── models/ │ │ ├── __init__.py │ │ ├── base.py │ │ ├── calibrator.py │ │ ├── ecd.py │ │ ├── embedder.py │ │ ├── inference.py │ │ ├── llm.py │ │ ├── predictor.py │ │ ├── registry.py │ │ └── retrieval.py │ ├── modules/ │ │ ├── __init__.py │ │ ├── attention_modules.py │ │ ├── convolutional_modules.py │ │ ├── embedding_modules.py │ │ ├── fully_connected_modules.py │ │ ├── initializer_modules.py │ │ ├── loss_implementations/ │ │ │ ├── __init__.py │ │ │ └── corn.py │ │ ├── loss_modules.py │ │ ├── lr_scheduler.py │ │ ├── metric_modules.py │ │ ├── metric_registry.py │ │ ├── mlp_mixer_modules.py │ │ ├── normalization_modules.py │ │ ├── optimization_modules.py │ │ ├── recurrent_modules.py │ │ ├── reduction_modules.py │ │ ├── tabnet_modules.py │ │ └── training_hooks.py │ ├── predict.py │ ├── preprocess.py │ ├── progress_bar.py │ ├── schema/ │ │ ├── __init__.py │ │ ├── combiners/ │ │ │ ├── __init__.py │ │ │ ├── base.py │ │ │ ├── common_transformer_options.py │ │ │ ├── comparator.py │ │ │ ├── concat.py │ │ │ ├── project_aggregate.py │ │ │ ├── sequence.py │ │ │ ├── sequence_concat.py │ │ │ ├── tab_transformer.py │ │ │ ├── tabnet.py │ │ │ ├── transformer.py │ │ │ └── utils.py │ │ ├── common_fields.py │ │ ├── decoders/ │ │ │ ├── __init__.py │ │ │ ├── base.py │ │ │ ├── image_decoders.py │ │ │ ├── llm_decoders.py │ │ │ ├── sequence_decoders.py │ │ │ └── utils.py │ │ ├── defaults/ │ │ │ ├── __init__.py │ │ │ ├── base.py │ │ │ ├── ecd.py │ │ │ ├── llm.py │ │ │ └── utils.py │ │ ├── encoders/ │ │ │ ├── __init__.py │ │ │ ├── bag_encoders.py │ │ │ ├── base.py │ │ │ ├── category_encoders.py │ │ │ ├── date_encoders.py │ │ │ ├── h3_encoders.py │ │ │ ├── image/ │ │ │ │ ├── __init__.py │ │ │ │ ├── base.py │ │ │ │ ├── timm.py │ │ │ │ └── torchvision.py │ │ │ ├── sequence_encoders.py │ │ │ ├── set_encoders.py │ │ │ ├── text/ │ │ │ │ ├── __init__.py │ │ │ │ ├── encoders.py │ │ │ │ └── hf_model_params.py │ │ │ ├── text_encoders.py │ │ │ └── utils.py │ │ ├── export_schema.py │ │ ├── features/ │ │ │ ├── __init__.py │ │ │ ├── audio_feature.py │ │ │ ├── augmentation/ │ │ │ │ ├── __init__.py │ │ │ │ ├── base.py │ │ │ │ ├── image.py │ │ │ │ └── utils.py │ │ │ ├── bag_feature.py │ │ │ ├── base.py │ │ │ ├── binary_feature.py │ │ │ ├── category_feature.py │ │ │ ├── date_feature.py │ │ │ ├── h3_feature.py │ │ │ ├── image_feature.py │ │ │ ├── loss/ │ │ │ │ ├── __init__.py │ │ │ │ ├── loss.py │ │ │ │ └── utils.py │ │ │ ├── number_feature.py │ │ │ ├── preprocessing/ │ │ │ │ ├── __init__.py │ │ │ │ ├── audio.py │ │ │ │ ├── bag.py │ │ │ │ ├── base.py │ │ │ │ ├── binary.py │ │ │ │ ├── category.py │ │ │ │ ├── date.py │ │ │ │ ├── h3.py │ │ │ │ ├── image.py │ │ │ │ ├── number.py │ │ │ │ ├── sequence.py │ │ │ │ ├── set.py │ │ │ │ ├── text.py │ │ │ │ ├── timeseries.py │ │ │ │ ├── utils.py │ │ │ │ └── vector.py │ │ │ ├── sequence_feature.py │ │ │ ├── set_feature.py │ │ │ ├── text_feature.py │ │ │ ├── timeseries_feature.py │ │ │ ├── utils.py │ │ │ └── vector_feature.py │ │ ├── hyperopt/ │ │ │ ├── __init__.py │ │ │ ├── executor.py │ │ │ ├── parameter.py │ │ │ ├── scheduler.py │ │ │ ├── search_algorithm.py │ │ │ └── utils.py │ │ ├── jsonschema.py │ │ ├── llms/ │ │ │ ├── __init__.py │ │ │ ├── base_model.py │ │ │ ├── generation.py │ │ │ ├── model_parameters.py │ │ │ ├── peft.py │ │ │ ├── prompt.py │ │ │ └── quantization.py │ │ ├── lr_scheduler.py │ │ ├── metadata/ │ │ │ ├── __init__.py │ │ │ ├── configs/ │ │ │ │ ├── combiners.yaml │ │ │ │ ├── common.yaml │ │ │ │ ├── decoders.yaml │ │ │ │ ├── encoders.yaml │ │ │ │ ├── features.yaml │ │ │ │ ├── llm.yaml │ │ │ │ ├── loss.yaml │ │ │ │ ├── optimizers.yaml │ │ │ │ ├── preprocessing.yaml │ │ │ │ └── trainer.yaml │ │ │ ├── feature_metadata.py │ │ │ └── parameter_metadata.py │ │ ├── model_config.py │ │ ├── model_types/ │ │ │ ├── __init__.py │ │ │ ├── base.py │ │ │ ├── ecd.py │ │ │ ├── llm.py │ │ │ └── utils.py │ │ ├── optimizers.py │ │ ├── preprocessing.py │ │ ├── profiler.py │ │ ├── split.py │ │ ├── trainer.py │ │ └── utils.py │ ├── serve.py │ ├── train.py │ ├── trainers/ │ │ ├── __init__.py │ │ ├── base.py │ │ ├── registry.py │ │ ├── trainer.py │ │ └── trainer_llm.py │ ├── types.py │ ├── upload.py │ ├── utils/ │ │ ├── __init__.py │ │ ├── algorithms_utils.py │ │ ├── audio_utils.py │ │ ├── augmentation_utils.py │ │ ├── automl/ │ │ │ ├── __init__.py │ │ │ ├── data_source.py │ │ │ ├── field_info.py │ │ │ ├── ray_utils.py │ │ │ ├── type_inference.py │ │ │ └── utils.py │ │ ├── backward_compatibility.py │ │ ├── batch_size_tuner.py │ │ ├── calibration.py │ │ ├── carton_utils.py │ │ ├── checkpoint_utils.py │ │ ├── config_utils.py │ │ ├── data_utils.py │ │ ├── dataframe_utils.py │ │ ├── dataset_utils.py │ │ ├── date_utils.py │ │ ├── defaults.py │ │ ├── entmax/ │ │ │ ├── LICENSE │ │ │ ├── README.md │ │ │ ├── __init__.py │ │ │ ├── activations.py │ │ │ ├── losses.py │ │ │ └── root_finding.py │ │ ├── error_handling_utils.py │ │ ├── eval_utils.py │ │ ├── fs_utils.py │ │ ├── h3_util.py │ │ ├── heuristics.py │ │ ├── hf_utils.py │ │ ├── html_utils.py │ │ ├── image_utils.py │ │ ├── inference_utils.py │ │ ├── llm_quantization_utils.py │ │ ├── llm_utils.py │ │ ├── logging_utils.py │ │ ├── loss_utils.py │ │ ├── math_utils.py │ │ ├── metric_utils.py │ │ ├── metrics_printed_table.py │ │ ├── misc_utils.py │ │ ├── model_utils.py │ │ ├── nlp_utils.py │ │ ├── numerical_test_utils.py │ │ ├── output_feature_utils.py │ │ ├── package_utils.py │ │ ├── print_utils.py │ │ ├── registry.py │ │ ├── server_utils.py │ │ ├── state_dict_backward_compatibility.py │ │ ├── strings_utils.py │ │ ├── structural_warning.py │ │ ├── system_utils.py │ │ ├── time_utils.py │ │ ├── tokenizers.py │ │ ├── torch_utils.py │ │ ├── trainer_utils.py │ │ ├── triton_utils.py │ │ ├── types.py │ │ ├── upload_utils.py │ │ ├── version_transformation.py │ │ └── visualization_utils.py │ ├── vector_index/ │ │ ├── __init__.py │ │ ├── base.py │ │ └── faiss.py │ └── visualize.py ├── pyproject.toml ├── pytest.ini ├── requirements.txt ├── requirements_benchmarking.txt ├── requirements_distributed.txt ├── requirements_explain.txt ├── requirements_extra.txt ├── requirements_hyperopt.txt ├── requirements_llm.txt ├── requirements_serve.txt ├── requirements_test.txt ├── requirements_viz.txt ├── schemastore/ │ ├── README.md │ ├── catalog-entry.json │ └── test/ │ ├── ludwig.yaml │ └── ludwig_config.yaml ├── setup.cfg ├── setup.py └── tests/ ├── README.md ├── __init__.py ├── conftest.py ├── docker-compose.yml ├── integration_tests/ │ ├── __init__.py │ ├── parameter_update_utils.py │ ├── scripts/ │ │ ├── run_train_aim.py │ │ ├── run_train_comet.py │ │ └── run_train_wandb.py │ ├── synthetic_test_data.py │ ├── test_api.py │ ├── test_audio_feature.py │ ├── test_automl.py │ ├── test_cache_manager.py │ ├── test_cached_preprocessing.py │ ├── test_carton.py │ ├── test_class_imbalance_feature.py │ ├── test_cli.py │ ├── test_collect.py │ ├── test_config_global_defaults.py │ ├── test_contrib_aim.py │ ├── test_contrib_comet.py │ ├── test_contrib_wandb.py │ ├── test_custom_components.py │ ├── test_date_feature.py │ ├── test_dependencies.py │ ├── test_experiment.py │ ├── test_explain.py │ ├── test_graph_execution.py │ ├── test_hyperopt.py │ ├── test_hyperopt_ray.py │ ├── test_input_feature_tied.py │ ├── test_kfold_cv.py │ ├── test_llm.py │ ├── test_missing_value_strategy.py │ ├── test_mlflow.py │ ├── test_model_save_and_load.py │ ├── test_model_training_options.py │ ├── test_number_feature.py │ ├── test_peft.py │ ├── test_postprocessing.py │ ├── test_preprocessing.py │ ├── test_ray.py │ ├── test_reducers.py │ ├── test_regularizers.py │ ├── test_remote.py │ ├── test_reproducibility.py │ ├── test_sequence_decoders.py │ ├── test_sequence_encoders.py │ ├── test_sequence_features.py │ ├── test_server.py │ ├── test_simple_features.py │ ├── test_timeseries_feature.py │ ├── test_torchscript.py │ ├── test_trainer.py │ ├── test_triton.py │ ├── test_triton_configs/ │ │ └── transformer_combiner_with_attention_reduce.yaml │ ├── test_visualization.py │ ├── test_visualization_api.py │ └── utils.py ├── ludwig/ │ ├── __init__.py │ ├── accounting/ │ │ └── test_used_tokens.py │ ├── augmentation/ │ │ ├── test_augmentation_pipeline.py │ │ ├── test_auto_augmentation.py │ │ └── test_image_augmentation.py │ ├── automl/ │ │ ├── __init__.py │ │ ├── test_base_config.py │ │ ├── test_data_source.py │ │ ├── test_tune_config.py │ │ └── test_utils.py │ ├── backend/ │ │ └── test_ray.py │ ├── benchmarking/ │ │ ├── example_files/ │ │ │ ├── invalid/ │ │ │ │ ├── benchmarking_config_1.yaml │ │ │ │ ├── benchmarking_config_2.yaml │ │ │ │ └── benchmarking_config_3.yaml │ │ │ ├── process_config.py │ │ │ └── valid/ │ │ │ ├── benchmarking_config_1.yaml │ │ │ ├── benchmarking_config_2.yaml │ │ │ └── benchmarking_config_3.yaml │ │ ├── test_benchmarking.py │ │ └── test_profiler.py │ ├── combiners/ │ │ └── test_combiners.py │ ├── config_sampling/ │ │ ├── static_schema.json │ │ └── test_config_sampling.py │ ├── config_validation/ │ │ ├── test_checks.py │ │ ├── test_validate_config_combiner.py │ │ ├── test_validate_config_encoder.py │ │ ├── test_validate_config_features.py │ │ ├── test_validate_config_hyperopt.py │ │ ├── test_validate_config_misc.py │ │ ├── test_validate_config_preprocessing.py │ │ └── test_validate_config_trainer.py │ ├── contrib/ │ │ └── test_contrib.py │ ├── data/ │ │ ├── dataframe/ │ │ │ └── test_dask.py │ │ ├── test_cache_util.py │ │ ├── test_dataset_synthesizer.py │ │ ├── test_negative_sampling.py │ │ ├── test_postprocessing.py │ │ ├── test_preprocessing.py │ │ ├── test_ray_data.py │ │ └── test_split.py │ ├── datasets/ │ │ ├── __init__.py │ │ ├── download_all_datasets.py │ │ ├── mnist/ │ │ │ └── test_mnist_workflow.py │ │ ├── model_configs/ │ │ │ └── train_all_model_configs.py │ │ ├── test_dataset_configs.py │ │ ├── test_dataset_links.py │ │ ├── test_datasets.py │ │ ├── test_model_configs.py │ │ └── titanic/ │ │ └── test_titanic_workflow.py │ ├── decoders/ │ │ ├── test_image_decoder.py │ │ ├── test_llm_decoders.py │ │ ├── test_sequence_decoder.py │ │ ├── test_sequence_decoder_utils.py │ │ └── test_sequence_tagger.py │ ├── encoders/ │ │ ├── __init__.py │ │ ├── test_bag_encoders.py │ │ ├── test_category_encoders.py │ │ ├── test_date_encoders.py │ │ ├── test_generic_encoders.py │ │ ├── test_h3_encoders.py │ │ ├── test_image_encoders.py │ │ ├── test_llm_encoders.py │ │ ├── test_sequence_encoders.py │ │ ├── test_set_encoders.py │ │ ├── test_text_encoders.py │ │ └── test_timm_encoder.py │ ├── evaluation/ │ │ └── test_evaluation.py │ ├── explain/ │ │ ├── test_captum.py │ │ └── test_util.py │ ├── features/ │ │ ├── __init__.py │ │ ├── test_audio_feature.py │ │ ├── test_bag_feature.py │ │ ├── test_binary_feature.py │ │ ├── test_category_feature.py │ │ ├── test_date_feature.py │ │ ├── test_feature_utils.py │ │ ├── test_h3_feature.py │ │ ├── test_image_feature.py │ │ ├── test_number_feature.py │ │ ├── test_sequence_features.py │ │ ├── test_set_feature.py │ │ ├── test_text_feature.py │ │ └── test_timeseries_feature.py │ ├── hyperopt/ │ │ └── test_hyperopt.py │ ├── model_export/ │ │ └── test_onnx_exporter.py │ ├── models/ │ │ ├── __init__.py │ │ ├── test_trainable_image_layers.py │ │ ├── test_training_determinism.py │ │ └── test_training_success.py │ ├── modules/ │ │ ├── __init__.py │ │ ├── test_attention.py │ │ ├── test_convolutional_modules.py │ │ ├── test_embedding_modules.py │ │ ├── test_encoder.py │ │ ├── test_fully_connected_modules.py │ │ ├── test_initializer_modules.py │ │ ├── test_loss_modules.py │ │ ├── test_lr_scheduler.py │ │ ├── test_metric_modules.py │ │ ├── test_mlp_mixer_modules.py │ │ ├── test_normalization_modules.py │ │ ├── test_recurrent_modules.py │ │ ├── test_reduction_modules.py │ │ ├── test_regex_freezing.py │ │ ├── test_tabnet_modules.py │ │ └── test_utils.py │ ├── schema/ │ │ ├── hyperopt/ │ │ │ ├── test_scheduler.py │ │ │ └── test_search_algorithm.py │ │ ├── test_model_config.py │ │ └── test_schema_utils.py │ ├── schema_fields/ │ │ ├── test_fields_misc.py │ │ ├── test_fields_optimization.py │ │ ├── test_fields_preprocessing.py │ │ └── test_marshmallow_misc.py │ └── utils/ │ ├── __init__.py │ ├── automl/ │ │ ├── test_type_inference.py │ │ └── test_utils.py │ ├── entmax/ │ │ ├── test_losses.py │ │ ├── test_mask.py │ │ ├── test_root_finding.py │ │ └── test_topk.py │ ├── test_algorithm_utils.py │ ├── test_audio_utils.py │ ├── test_backward_compatibility.py │ ├── test_calibration.py │ ├── test_class_balancing.py │ ├── test_config_utils.py │ ├── test_data_utils.py │ ├── test_dataframe_utils.py │ ├── test_dataset_utils.py │ ├── test_date_utils.py │ ├── test_defaults.py │ ├── test_error_handling_utils.py │ ├── test_errors.py │ ├── test_fs_utils.py │ ├── test_heuristics.py │ ├── test_hf_utils.py │ ├── test_hyperopt_ray_utils.py │ ├── test_image_utils.py │ ├── test_llm_utils.py │ ├── test_metric_utils.py │ ├── test_model_utils.py │ ├── test_normalization.py │ ├── test_numerical_test_utils.py │ ├── test_output_feature_utils.py │ ├── test_server_utils.py │ ├── test_state_dict_backward_compatibility.py │ ├── test_strings_utils.py │ ├── test_tokenizers.py │ ├── test_torch_utils.py │ ├── test_trainer_utils.py │ ├── test_upload_utils.py │ └── test_version_transformation.py ├── regression_tests/ │ ├── automl/ │ │ ├── golden/ │ │ │ ├── adult_census_income.types.json │ │ │ └── mnist.types.json │ │ ├── scripts/ │ │ │ └── update_golden_types.py │ │ ├── test_auto_type_inference.py │ │ └── utils.py │ ├── benchmark/ │ │ ├── configs/ │ │ │ ├── adult_census_income.ecd.yaml │ │ │ ├── ames_housing.ecd.yaml │ │ │ ├── mercedes_benz_greener.ecd.yaml │ │ │ └── sarcos.ecd.yaml │ │ ├── expected_metric.py │ │ ├── expected_metrics/ │ │ │ ├── adult_census_income.ecd.yaml │ │ │ ├── ames_housing.ecd.yaml │ │ │ ├── mercedes_benz_greener.ecd.yaml │ │ │ └── sarcos.ecd.yaml │ │ └── test_model_performance.py │ └── model/ │ └── test_old_models.py └── training_success/ ├── __init__.py ├── configs.py └── test_training_success.py