gitextract_eudtie4f/ ├── .gitattributes ├── .github/ │ ├── ISSUE_TEMPLATE/ │ │ ├── bug-report.yaml │ │ ├── feature_request.md │ │ └── question.md │ ├── PULL_REQUEST_TEMPLATE.md │ ├── actions/ │ │ ├── mamba-env/ │ │ │ └── action.yml │ │ ├── python-only/ │ │ │ └── action.yml │ │ ├── run-core-tests/ │ │ │ ├── action.yml │ │ │ ├── group_1/ │ │ │ │ └── action.yml │ │ │ ├── group_2/ │ │ │ │ └── action.yml │ │ │ ├── group_3/ │ │ │ │ └── action.yml │ │ │ └── group_4/ │ │ │ └── action.yml │ │ └── upload-coverage/ │ │ └── action.yml │ ├── dependabot.yaml │ ├── stale.yml │ └── workflows/ │ ├── ci-notebooks.yml │ ├── ci-required.yml │ ├── ci.yml │ ├── codeql/ │ │ └── codeql-config.yml │ ├── codeql.yml │ ├── fuzzydata-test.yml │ ├── publish-to-pypi.yml │ ├── push-to-main.yml │ └── sql_server/ │ └── set_up_sql_server.sh ├── .gitignore ├── .readthedocs.yaml ├── CODEOWNERS ├── CODE_OF_CONDUCT.md ├── LICENSE ├── LICENSE_HEADER ├── MANIFEST.in ├── NOTICE ├── README.md ├── asv_bench/ │ ├── README.md │ ├── asv.conf.dask.json │ ├── asv.conf.json │ ├── asv.conf.unidist.json │ ├── benchmarks/ │ │ ├── __init__.py │ │ ├── benchmarks.py │ │ ├── io/ │ │ │ ├── __init__.py │ │ │ ├── csv.py │ │ │ └── parquet.py │ │ ├── scalability/ │ │ │ ├── __init__.py │ │ │ └── scalability_benchmarks.py │ │ └── utils/ │ │ ├── __init__.py │ │ ├── common.py │ │ ├── compatibility.py │ │ └── data_shapes.py │ └── test/ │ ├── __init__.py │ └── test_utils.py ├── ci/ │ └── teamcity/ │ ├── Dockerfile.teamcity-ci │ ├── build-docker.py │ └── comment_on_pr.py ├── codecov.yml ├── contributing/ │ ├── contributing.md │ └── pre-commit ├── docker/ │ └── Dockerfile ├── docs/ │ ├── _static/ │ │ └── custom.js │ ├── _templates/ │ │ └── layout.html │ ├── conf.py │ ├── contact.rst │ ├── development/ │ │ ├── architecture.rst │ │ ├── contributing.rst │ │ ├── index.rst │ │ ├── partition_api.rst │ │ ├── using_pandas_on_dask.rst │ │ ├── using_pandas_on_mpi.rst │ │ ├── using_pandas_on_python.rst │ │ └── using_pandas_on_ray.rst │ ├── ecosystem.rst │ ├── flow/ │ │ └── modin/ │ │ ├── config.rst │ │ ├── core/ │ │ │ ├── dataframe/ │ │ │ │ ├── algebra.rst │ │ │ │ ├── base/ │ │ │ │ │ ├── dataframe.rst │ │ │ │ │ ├── index.rst │ │ │ │ │ └── partitioning/ │ │ │ │ │ └── axis_partition.rst │ │ │ │ ├── index.rst │ │ │ │ └── pandas/ │ │ │ │ ├── dataframe.rst │ │ │ │ ├── index.rst │ │ │ │ ├── metadata/ │ │ │ │ │ ├── dtypes.rst │ │ │ │ │ └── index.rst │ │ │ │ └── partitioning/ │ │ │ │ ├── axis_partition.rst │ │ │ │ ├── partition.rst │ │ │ │ └── partition_manager.rst │ │ │ ├── execution/ │ │ │ │ ├── dask/ │ │ │ │ │ └── implementations/ │ │ │ │ │ └── pandas_on_dask/ │ │ │ │ │ ├── dataframe.rst │ │ │ │ │ ├── index.rst │ │ │ │ │ └── partitioning/ │ │ │ │ │ ├── partition.rst │ │ │ │ │ ├── partition_manager.rst │ │ │ │ │ └── virtual_partition.rst │ │ │ │ ├── dispatching.rst │ │ │ │ ├── python/ │ │ │ │ │ └── implementations/ │ │ │ │ │ └── pandas_on_python/ │ │ │ │ │ ├── dataframe.rst │ │ │ │ │ ├── index.rst │ │ │ │ │ └── partitioning/ │ │ │ │ │ ├── axis_partition.rst │ │ │ │ │ ├── partition.rst │ │ │ │ │ └── partition_manager.rst │ │ │ │ ├── ray/ │ │ │ │ │ ├── generic.rst │ │ │ │ │ └── implementations/ │ │ │ │ │ └── pandas_on_ray/ │ │ │ │ │ ├── dataframe.rst │ │ │ │ │ ├── index.rst │ │ │ │ │ └── partitioning/ │ │ │ │ │ ├── axis_partition.rst │ │ │ │ │ ├── partition.rst │ │ │ │ │ └── partition_manager.rst │ │ │ │ └── unidist/ │ │ │ │ ├── generic.rst │ │ │ │ └── implementations/ │ │ │ │ └── pandas_on_unidist/ │ │ │ │ ├── dataframe.rst │ │ │ │ ├── index.rst │ │ │ │ └── partitioning/ │ │ │ │ ├── axis_partition.rst │ │ │ │ ├── partition.rst │ │ │ │ └── partition_manager.rst │ │ │ ├── io/ │ │ │ │ └── index.rst │ │ │ └── storage_formats/ │ │ │ ├── base/ │ │ │ │ └── query_compiler.rst │ │ │ ├── index.rst │ │ │ └── pandas/ │ │ │ ├── index.rst │ │ │ ├── parsers.rst │ │ │ └── query_compiler.rst │ │ ├── distributed/ │ │ │ └── dataframe/ │ │ │ └── pandas.rst │ │ ├── experimental/ │ │ │ ├── batch.rst │ │ │ ├── core/ │ │ │ │ └── io/ │ │ │ │ └── index.rst │ │ │ ├── index.rst │ │ │ ├── pandas.rst │ │ │ ├── range_partitioning_groupby.rst │ │ │ ├── reshuffling_groupby.rst │ │ │ ├── sklearn.rst │ │ │ └── xgboost.rst │ │ ├── pandas/ │ │ │ ├── base.rst │ │ │ ├── dataframe.rst │ │ │ └── series.rst │ │ └── utils.rst │ ├── getting_started/ │ │ ├── examples.rst │ │ ├── faq.rst │ │ ├── installation.rst │ │ ├── quickstart.rst │ │ ├── troubleshooting.rst │ │ ├── using_modin/ │ │ │ ├── using_modin.rst │ │ │ ├── using_modin_cluster.rst │ │ │ └── using_modin_locally.rst │ │ └── why_modin/ │ │ ├── modin_vs_dask_vs_koalas.rst │ │ ├── out_of_core.rst │ │ ├── pandas.rst │ │ └── why_modin.rst │ ├── index.rst │ ├── release-procedure.md │ ├── release_notes/ │ │ ├── release_notes-0.14.0.rst │ │ ├── release_notes-0.15.0.rst │ │ ├── release_notes-0.16.0.rst │ │ └── release_notes-template.rst │ ├── requirements-doc.txt │ ├── supported_apis/ │ │ ├── dataframe_supported.rst │ │ ├── defaulting_to_pandas.rst │ │ ├── index.rst │ │ ├── io_supported.rst │ │ ├── older_pandas_compat.rst │ │ ├── series_supported.rst │ │ └── utilities_supported.rst │ └── usage_guide/ │ ├── advanced_usage/ │ │ ├── batch.rst │ │ ├── index.rst │ │ ├── modin_engines.rst │ │ ├── modin_logging.rst │ │ ├── modin_metrics.rst │ │ ├── modin_xgboost.rst │ │ ├── progress_bar.rst │ │ └── spreadsheets_api.rst │ ├── benchmarking.rst │ ├── examples/ │ │ └── index.rst │ ├── index.rst │ ├── integrations.rst │ └── optimization_notes/ │ ├── index.rst │ └── range_partitioning_ops.rst ├── environment-dev.yml ├── examples/ │ ├── data/ │ │ ├── boston_housing.csv │ │ ├── census_1k.csv │ │ ├── nyc-taxi_1k.csv │ │ ├── plasticc_test_set_1k.csv │ │ ├── plasticc_test_set_metadata_1k.csv │ │ ├── plasticc_training_set_1k.csv │ │ └── plasticc_training_set_metadata_1k.csv │ ├── docker/ │ │ └── modin-ray/ │ │ ├── Dockerfile │ │ ├── build-docker-image.sh │ │ ├── census.py │ │ ├── nyc-taxi.py │ │ ├── plasticc.py │ │ └── taxi.pstat │ ├── jupyter/ │ │ ├── Modin_Taxi.ipynb │ │ ├── Pandas_Taxi.ipynb │ │ └── integrations/ │ │ ├── NLTK.ipynb │ │ ├── altair.ipynb │ │ ├── bokeh.ipynb │ │ ├── huggingface.ipynb │ │ ├── matplotlib.ipynb │ │ ├── plotly.ipynb │ │ ├── seaborn.ipynb │ │ ├── sklearn.ipynb │ │ ├── statsmodels.ipynb │ │ ├── tensorflow.ipynb │ │ └── xgboost.ipynb │ ├── modin-scikit-learn-example.ipynb │ ├── quickstart.ipynb │ ├── spreadsheet/ │ │ ├── requirements.txt │ │ └── tutorial.ipynb │ └── tutorial/ │ ├── README.md │ └── jupyter/ │ ├── README.md │ └── execution/ │ ├── pandas_on_dask/ │ │ ├── Dockerfile │ │ ├── cluster/ │ │ │ └── exercise_5.ipynb │ │ ├── local/ │ │ │ ├── exercise_1.ipynb │ │ │ ├── exercise_2.ipynb │ │ │ ├── exercise_3.ipynb │ │ │ └── exercise_4.ipynb │ │ ├── requirements.txt │ │ └── test/ │ │ └── test_notebooks.py │ ├── pandas_on_ray/ │ │ ├── Dockerfile │ │ ├── cluster/ │ │ │ ├── README.md │ │ │ ├── exercise_5.py │ │ │ └── modin-cluster.yaml │ │ ├── local/ │ │ │ ├── exercise_1.ipynb │ │ │ ├── exercise_2.ipynb │ │ │ ├── exercise_3.ipynb │ │ │ └── exercise_4.ipynb │ │ ├── requirements.txt │ │ └── test/ │ │ └── test_notebooks.py │ ├── pandas_on_unidist/ │ │ ├── Dockerfile │ │ ├── README.md │ │ ├── jupyter_unidist_env.yml │ │ ├── local/ │ │ │ ├── exercise_1.ipynb │ │ │ ├── exercise_2.ipynb │ │ │ ├── exercise_3.ipynb │ │ │ └── exercise_4.ipynb │ │ ├── setup_kernel.py │ │ └── test/ │ │ └── test_notebooks.py │ └── test/ │ └── utils.py ├── modin/ │ ├── __init__.py │ ├── __main__.py │ ├── _version.py │ ├── config/ │ │ ├── __init__.py │ │ ├── __main__.py │ │ ├── envvars.py │ │ └── pubsub.py │ ├── conftest.py │ ├── core/ │ │ ├── __init__.py │ │ ├── computation/ │ │ │ ├── __init__.py │ │ │ ├── align.py │ │ │ ├── check.py │ │ │ ├── common.py │ │ │ ├── engines.py │ │ │ ├── eval.py │ │ │ ├── expr.py │ │ │ ├── ops.py │ │ │ ├── parsing.py │ │ │ └── scope.py │ │ ├── dataframe/ │ │ │ ├── __init__.py │ │ │ ├── algebra/ │ │ │ │ ├── __init__.py │ │ │ │ ├── binary.py │ │ │ │ ├── default2pandas/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ ├── binary.py │ │ │ │ │ ├── cat.py │ │ │ │ │ ├── dataframe.py │ │ │ │ │ ├── datetime.py │ │ │ │ │ ├── default.py │ │ │ │ │ ├── groupby.py │ │ │ │ │ ├── list.py │ │ │ │ │ ├── resample.py │ │ │ │ │ ├── rolling.py │ │ │ │ │ ├── series.py │ │ │ │ │ ├── str.py │ │ │ │ │ └── struct.py │ │ │ │ ├── fold.py │ │ │ │ ├── groupby.py │ │ │ │ ├── map.py │ │ │ │ ├── operator.py │ │ │ │ ├── reduce.py │ │ │ │ └── tree_reduce.py │ │ │ ├── base/ │ │ │ │ ├── __init__.py │ │ │ │ ├── dataframe/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ ├── dataframe.py │ │ │ │ │ └── utils.py │ │ │ │ ├── interchange/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ └── dataframe_protocol/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ ├── dataframe.py │ │ │ │ │ └── utils.py │ │ │ │ └── partitioning/ │ │ │ │ ├── __init__.py │ │ │ │ └── axis_partition.py │ │ │ └── pandas/ │ │ │ ├── __init__.py │ │ │ ├── dataframe/ │ │ │ │ ├── __init__.py │ │ │ │ ├── dataframe.py │ │ │ │ └── utils.py │ │ │ ├── interchange/ │ │ │ │ ├── __init__.py │ │ │ │ └── dataframe_protocol/ │ │ │ │ ├── __init__.py │ │ │ │ ├── buffer.py │ │ │ │ ├── column.py │ │ │ │ ├── dataframe.py │ │ │ │ ├── exception.py │ │ │ │ └── from_dataframe.py │ │ │ ├── metadata/ │ │ │ │ ├── __init__.py │ │ │ │ ├── dtypes.py │ │ │ │ └── index.py │ │ │ ├── partitioning/ │ │ │ │ ├── __init__.py │ │ │ │ ├── axis_partition.py │ │ │ │ ├── partition.py │ │ │ │ └── partition_manager.py │ │ │ └── utils.py │ │ ├── execution/ │ │ │ ├── __init__.py │ │ │ ├── dask/ │ │ │ │ ├── __init__.py │ │ │ │ ├── common/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ ├── engine_wrapper.py │ │ │ │ │ └── utils.py │ │ │ │ └── implementations/ │ │ │ │ ├── __init__.py │ │ │ │ └── pandas_on_dask/ │ │ │ │ ├── __init__.py │ │ │ │ ├── dataframe/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ └── dataframe.py │ │ │ │ ├── io/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ └── io.py │ │ │ │ └── partitioning/ │ │ │ │ ├── __init__.py │ │ │ │ ├── partition.py │ │ │ │ ├── partition_manager.py │ │ │ │ └── virtual_partition.py │ │ │ ├── dispatching/ │ │ │ │ ├── __init__.py │ │ │ │ └── factories/ │ │ │ │ ├── __init__.py │ │ │ │ ├── dispatcher.py │ │ │ │ └── factories.py │ │ │ ├── modin_aqp.py │ │ │ ├── python/ │ │ │ │ ├── __init__.py │ │ │ │ ├── common/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ └── engine_wrapper.py │ │ │ │ └── implementations/ │ │ │ │ ├── __init__.py │ │ │ │ └── pandas_on_python/ │ │ │ │ ├── __init__.py │ │ │ │ ├── dataframe/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ └── dataframe.py │ │ │ │ ├── io/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ └── io.py │ │ │ │ └── partitioning/ │ │ │ │ ├── __init__.py │ │ │ │ ├── partition.py │ │ │ │ ├── partition_manager.py │ │ │ │ └── virtual_partition.py │ │ │ ├── ray/ │ │ │ │ ├── __init__.py │ │ │ │ ├── common/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ ├── deferred_execution.py │ │ │ │ │ ├── engine_wrapper.py │ │ │ │ │ └── utils.py │ │ │ │ ├── generic/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ ├── io/ │ │ │ │ │ │ ├── __init__.py │ │ │ │ │ │ └── io.py │ │ │ │ │ └── partitioning/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ └── partition_manager.py │ │ │ │ └── implementations/ │ │ │ │ ├── __init__.py │ │ │ │ └── pandas_on_ray/ │ │ │ │ ├── __init__.py │ │ │ │ ├── dataframe/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ └── dataframe.py │ │ │ │ ├── io/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ └── io.py │ │ │ │ └── partitioning/ │ │ │ │ ├── __init__.py │ │ │ │ ├── partition.py │ │ │ │ ├── partition_manager.py │ │ │ │ └── virtual_partition.py │ │ │ ├── unidist/ │ │ │ │ ├── __init__.py │ │ │ │ ├── common/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ ├── engine_wrapper.py │ │ │ │ │ └── utils.py │ │ │ │ ├── generic/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ ├── io/ │ │ │ │ │ │ ├── __init__.py │ │ │ │ │ │ └── io.py │ │ │ │ │ └── partitioning/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ └── partition_manager.py │ │ │ │ └── implementations/ │ │ │ │ ├── __init__.py │ │ │ │ └── pandas_on_unidist/ │ │ │ │ ├── __init__.py │ │ │ │ ├── dataframe/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ └── dataframe.py │ │ │ │ ├── io/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ └── io.py │ │ │ │ └── partitioning/ │ │ │ │ ├── __init__.py │ │ │ │ ├── partition.py │ │ │ │ ├── partition_manager.py │ │ │ │ └── virtual_partition.py │ │ │ └── utils.py │ │ ├── io/ │ │ │ ├── __init__.py │ │ │ ├── column_stores/ │ │ │ │ ├── __init__.py │ │ │ │ ├── column_store_dispatcher.py │ │ │ │ ├── feather_dispatcher.py │ │ │ │ ├── hdf_dispatcher.py │ │ │ │ └── parquet_dispatcher.py │ │ │ ├── file_dispatcher.py │ │ │ ├── io.py │ │ │ ├── sql/ │ │ │ │ ├── __init__.py │ │ │ │ └── sql_dispatcher.py │ │ │ └── text/ │ │ │ ├── __init__.py │ │ │ ├── csv_dispatcher.py │ │ │ ├── excel_dispatcher.py │ │ │ ├── fwf_dispatcher.py │ │ │ ├── json_dispatcher.py │ │ │ ├── text_file_dispatcher.py │ │ │ └── utils.py │ │ └── storage_formats/ │ │ ├── __init__.py │ │ ├── base/ │ │ │ ├── __init__.py │ │ │ ├── doc_utils.py │ │ │ ├── query_compiler.py │ │ │ └── query_compiler_calculator.py │ │ └── pandas/ │ │ ├── __init__.py │ │ ├── aggregations.py │ │ ├── groupby.py │ │ ├── merge.py │ │ ├── native_query_compiler.py │ │ ├── parsers.py │ │ ├── query_compiler.py │ │ ├── query_compiler_caster.py │ │ └── utils.py │ ├── db_conn.py │ ├── distributed/ │ │ ├── __init__.py │ │ └── dataframe/ │ │ ├── __init__.py │ │ └── pandas/ │ │ ├── __init__.py │ │ └── partitions.py │ ├── error_message.py │ ├── experimental/ │ │ ├── __init__.py │ │ ├── batch/ │ │ │ ├── __init__.py │ │ │ └── pipeline.py │ │ ├── core/ │ │ │ ├── __init__.py │ │ │ ├── execution/ │ │ │ │ ├── __init__.py │ │ │ │ ├── dask/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ └── implementations/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ └── pandas_on_dask/ │ │ │ │ │ └── __init__.py │ │ │ │ ├── ray/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ └── implementations/ │ │ │ │ │ └── __init__.py │ │ │ │ └── unidist/ │ │ │ │ ├── __init__.py │ │ │ │ └── implementations/ │ │ │ │ ├── __init__.py │ │ │ │ └── pandas_on_unidist/ │ │ │ │ └── __init__.py │ │ │ ├── io/ │ │ │ │ ├── __init__.py │ │ │ │ ├── glob/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ └── glob_dispatcher.py │ │ │ │ ├── sql/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ ├── sql_dispatcher.py │ │ │ │ │ └── utils.py │ │ │ │ └── text/ │ │ │ │ ├── __init__.py │ │ │ │ ├── csv_glob_dispatcher.py │ │ │ │ └── custom_text_dispatcher.py │ │ │ └── storage_formats/ │ │ │ ├── __init__.py │ │ │ └── pandas/ │ │ │ ├── __init__.py │ │ │ └── parsers.py │ │ ├── fuzzydata/ │ │ │ └── __init__.py │ │ ├── pandas/ │ │ │ ├── __init__.py │ │ │ └── io.py │ │ ├── sklearn/ │ │ │ ├── __init__.py │ │ │ └── model_selection/ │ │ │ ├── __init__.py │ │ │ └── train_test_split.py │ │ ├── spreadsheet/ │ │ │ ├── __init__.py │ │ │ └── general.py │ │ ├── torch/ │ │ │ ├── __init__.py │ │ │ └── datasets.py │ │ └── xgboost/ │ │ ├── __init__.py │ │ ├── utils.py │ │ ├── xgboost.py │ │ └── xgboost_ray.py │ ├── logging/ │ │ ├── __init__.py │ │ ├── class_logger.py │ │ ├── config.py │ │ ├── logger_decorator.py │ │ └── metrics.py │ ├── numpy/ │ │ ├── __init__.py │ │ ├── arr.py │ │ ├── array_creation.py │ │ ├── array_shaping.py │ │ ├── constants.py │ │ ├── indexing.py │ │ ├── linalg.py │ │ ├── logic.py │ │ ├── math.py │ │ ├── trigonometry.py │ │ └── utils.py │ ├── pandas/ │ │ ├── __init__.py │ │ ├── accessor.py │ │ ├── api/ │ │ │ ├── __init__.py │ │ │ └── extensions/ │ │ │ ├── __init__.py │ │ │ └── extensions.py │ │ ├── arrays/ │ │ │ └── __init__.py │ │ ├── base.py │ │ ├── dataframe.py │ │ ├── errors/ │ │ │ └── __init__.py │ │ ├── general.py │ │ ├── groupby.py │ │ ├── indexing.py │ │ ├── io.py │ │ ├── iterator.py │ │ ├── plotting.py │ │ ├── resample.py │ │ ├── series.py │ │ ├── series_utils.py │ │ ├── testing/ │ │ │ └── __init__.py │ │ ├── utils.py │ │ └── window.py │ ├── polars/ │ │ ├── __init__.py │ │ ├── base.py │ │ ├── dataframe.py │ │ ├── groupby.py │ │ ├── lazyframe.py │ │ └── series.py │ ├── tests/ │ │ ├── __init__.py │ │ ├── config/ │ │ │ ├── __init__.py │ │ │ ├── docs_module/ │ │ │ │ ├── __init__.py │ │ │ │ ├── classes.py │ │ │ │ └── functions.py │ │ │ ├── docs_module_with_just_base/ │ │ │ │ ├── __init__.py │ │ │ │ └── classes.py │ │ │ ├── test_envvars.py │ │ │ └── test_parameter.py │ │ ├── core/ │ │ │ ├── __init__.py │ │ │ ├── storage_formats/ │ │ │ │ ├── base/ │ │ │ │ │ └── test_internals.py │ │ │ │ ├── cudf/ │ │ │ │ │ ├── test_gpu_managers.py │ │ │ │ │ └── test_internals.py │ │ │ │ └── pandas/ │ │ │ │ └── test_internals.py │ │ │ └── test_dispatcher.py │ │ ├── experimental/ │ │ │ ├── __init__.py │ │ │ ├── spreadsheet/ │ │ │ │ ├── __init__.py │ │ │ │ └── test_general.py │ │ │ ├── test_fuzzydata.py │ │ │ ├── test_io_exp.py │ │ │ ├── test_pipeline.py │ │ │ ├── torch/ │ │ │ │ ├── __init__.py │ │ │ │ └── test_dataloader.py │ │ │ └── xgboost/ │ │ │ ├── __init__.py │ │ │ ├── test_default.py │ │ │ ├── test_dmatrix.py │ │ │ └── test_xgboost.py │ │ ├── interchange/ │ │ │ ├── __init__.py │ │ │ └── dataframe_protocol/ │ │ │ ├── __init__.py │ │ │ ├── base/ │ │ │ │ ├── __init__.py │ │ │ │ ├── test_sanity.py │ │ │ │ └── test_utils.py │ │ │ ├── pandas/ │ │ │ │ ├── __init__.py │ │ │ │ └── test_protocol.py │ │ │ └── test_general.py │ │ ├── numpy/ │ │ │ ├── __init__.py │ │ │ ├── test_array.py │ │ │ ├── test_array_arithmetic.py │ │ │ ├── test_array_axis_functions.py │ │ │ ├── test_array_creation.py │ │ │ ├── test_array_indexing.py │ │ │ ├── test_array_linalg.py │ │ │ ├── test_array_logic.py │ │ │ ├── test_array_math.py │ │ │ ├── test_array_shaping.py │ │ │ └── utils.py │ │ ├── pandas/ │ │ │ ├── __init__.py │ │ │ ├── conftest.py │ │ │ ├── data/ │ │ │ │ ├── __init__.py │ │ │ │ ├── airline.sas7bdat │ │ │ │ ├── blah.csv │ │ │ │ ├── every_other_row_nan.xlsx │ │ │ │ ├── excel_sheetname_title.xlsx │ │ │ │ ├── hdfs.parquet/ │ │ │ │ │ ├── part-00000-a7bff54c-2ff4-4654-9783-626542bd3a90-c000.snappy.parquet │ │ │ │ │ ├── part-00001-a7bff54c-2ff4-4654-9783-626542bd3a90-c000.snappy.parquet │ │ │ │ │ └── part-00002-a7bff54c-2ff4-4654-9783-626542bd3a90-c000.snappy.parquet │ │ │ │ ├── issue5159.parquet/ │ │ │ │ │ └── part-0000.snappy.parquet/ │ │ │ │ │ ├── par=a/ │ │ │ │ │ │ └── 44c5b23d806c4dc8a97d70c4fb2219f5-0.parquet │ │ │ │ │ └── par=b/ │ │ │ │ │ └── 44c5b23d806c4dc8a97d70c4fb2219f5-0.parquet │ │ │ │ ├── issue_1930.csv │ │ │ │ ├── issue_2074.csv │ │ │ │ ├── issue_2239.csv │ │ │ │ ├── issue_3119.csv │ │ │ │ ├── issue_4543.csv │ │ │ │ ├── issue_976.csv │ │ │ │ ├── modin_error_book.xlsx │ │ │ │ ├── multiple_csv/ │ │ │ │ │ ├── test_data0.csv │ │ │ │ │ └── test_data1.csv │ │ │ │ ├── newlines.csv │ │ │ │ ├── test_border_rows.xlsx │ │ │ │ ├── test_categories.csv │ │ │ │ ├── test_categories.json │ │ │ │ ├── test_data.feather │ │ │ │ ├── test_data.fwf │ │ │ │ ├── test_data.json │ │ │ │ ├── test_data.parquet │ │ │ │ ├── test_data_dir.parquet/ │ │ │ │ │ ├── part_0.parquet │ │ │ │ │ ├── part_1.parquet │ │ │ │ │ ├── part_10.parquet │ │ │ │ │ ├── part_11.parquet │ │ │ │ │ ├── part_12.parquet │ │ │ │ │ ├── part_13.parquet │ │ │ │ │ ├── part_14.parquet │ │ │ │ │ ├── part_15.parquet │ │ │ │ │ ├── part_2.parquet │ │ │ │ │ ├── part_3.parquet │ │ │ │ │ ├── part_4.parquet │ │ │ │ │ ├── part_5.parquet │ │ │ │ │ ├── part_6.parquet │ │ │ │ │ ├── part_7.parquet │ │ │ │ │ ├── part_8.parquet │ │ │ │ │ └── part_9.parquet │ │ │ │ ├── test_delim.csv │ │ │ │ ├── test_different_columns_in_rows.json │ │ │ │ ├── test_empty_rows.xlsx │ │ │ │ ├── test_emptyline.xlsx │ │ │ │ ├── test_null_col.csv │ │ │ │ ├── test_time_parsing.csv │ │ │ │ └── test_usecols.csv │ │ │ ├── dataframe/ │ │ │ │ ├── __init__.py │ │ │ │ ├── test_binary.py │ │ │ │ ├── test_default.py │ │ │ │ ├── test_indexing.py │ │ │ │ ├── test_iter.py │ │ │ │ ├── test_join_sort.py │ │ │ │ ├── test_map_metadata.py │ │ │ │ ├── test_pickle.py │ │ │ │ ├── test_reduce.py │ │ │ │ ├── test_udf.py │ │ │ │ └── test_window.py │ │ │ ├── extensions/ │ │ │ │ ├── __init__.py │ │ │ │ ├── conftest.py │ │ │ │ ├── test_api_reexport.py │ │ │ │ ├── test_base_extensions.py │ │ │ │ ├── test_dataframe_extensions.py │ │ │ │ ├── test_groupby_extensions.py │ │ │ │ ├── test_pd_extensions.py │ │ │ │ └── test_series_extensions.py │ │ │ ├── integrations/ │ │ │ │ ├── __init__.py │ │ │ │ └── test_lazy_import.py │ │ │ ├── internals/ │ │ │ │ ├── __init__.py │ │ │ │ └── test_benchmark_mode.py │ │ │ ├── native_df_interoperability/ │ │ │ │ ├── __init__.py │ │ │ │ ├── conftest.py │ │ │ │ ├── test_binary.py │ │ │ │ ├── test_compiler_caster.py │ │ │ │ ├── test_copy_on_write.py │ │ │ │ ├── test_default.py │ │ │ │ ├── test_default_to_pandas_without_warnings.py │ │ │ │ ├── test_general.py │ │ │ │ ├── test_indexing.py │ │ │ │ ├── test_iter.py │ │ │ │ ├── test_join_sort.py │ │ │ │ ├── test_map_metadata.py │ │ │ │ ├── test_pickle.py │ │ │ │ ├── test_window.py │ │ │ │ └── utils.py │ │ │ ├── test_api.py │ │ │ ├── test_backend.py │ │ │ ├── test_concat.py │ │ │ ├── test_expanding.py │ │ │ ├── test_general.py │ │ │ ├── test_groupby.py │ │ │ ├── test_io.py │ │ │ ├── test_repartition.py │ │ │ ├── test_reshape.py │ │ │ ├── test_rolling.py │ │ │ ├── test_series.py │ │ │ └── utils.py │ │ ├── polars/ │ │ │ └── test_dataframe.py │ │ ├── test_dataframe_api_standard.py │ │ ├── test_docstring_urls.py │ │ ├── test_envvar_catcher.py │ │ ├── test_envvar_npartitions.py │ │ ├── test_executions_api.py │ │ ├── test_headers.py │ │ ├── test_logging.py │ │ ├── test_metrics.py │ │ ├── test_partition_api.py │ │ └── test_utils.py │ └── utils.py ├── modin-autoimport-pandas.pth ├── mypy.ini ├── requirements/ │ ├── env_unidist_linux.yml │ ├── env_unidist_win.yml │ └── requirements-no-engine.yml ├── requirements-dev.txt ├── scripts/ │ ├── __init__.py │ ├── doc_checker.py │ ├── release.py │ └── test/ │ ├── __init__.py │ ├── examples.py │ └── test_doc_checker.py ├── setup.cfg ├── setup.py ├── stress_tests/ │ ├── kaggle/ │ │ ├── kaggle10.py │ │ ├── kaggle12.py │ │ ├── kaggle13.py │ │ ├── kaggle14.py │ │ ├── kaggle17.py │ │ ├── kaggle18.py │ │ ├── kaggle19.py │ │ ├── kaggle20.py │ │ ├── kaggle22.py │ │ ├── kaggle3.py │ │ ├── kaggle4.py │ │ ├── kaggle5.py │ │ ├── kaggle6.py │ │ ├── kaggle7.py │ │ ├── kaggle8.py │ │ └── kaggle9.py │ ├── run_stress_tests.sh │ └── test_kaggle_ipynb.py └── versioneer.py