gitextract_0gdudwyh/ ├── .gitattributes ├── .github/ │ ├── FUNDING.yml │ └── workflows/ │ ├── check_size.yml │ ├── pypi_release.yml │ ├── style.yml │ ├── sync_to_hub.yml.backup │ └── sync_to_hub_debug.yml ├── .gitignore ├── CITATION.cff ├── Docker/ │ ├── Dockerfile │ ├── README.md │ └── build_docker.sh ├── LICENSE ├── Makefile ├── README.md ├── app/ │ ├── gradio/ │ │ ├── app.py │ │ └── backend.py │ └── streamlit/ │ ├── app.py │ └── backend.py ├── pyproject.toml ├── run_docker_image.sh ├── setup.cfg ├── setup.py ├── src/ │ └── dalle_mini/ │ ├── __init__.py │ ├── data.py │ └── model/ │ ├── __init__.py │ ├── configuration.py │ ├── modeling.py │ ├── partitions.py │ ├── processor.py │ ├── text.py │ ├── tokenizer.py │ └── utils.py └── tools/ ├── dataset/ │ └── encode_dataset.ipynb ├── inference/ │ ├── inference_pipeline.ipynb │ └── run_infer_notebook.sh └── train/ ├── config/ │ ├── mega/ │ │ └── config.json │ ├── micro/ │ │ └── config.json │ ├── mini/ │ │ └── config.json │ └── mini_glu/ │ └── config.json ├── embeddings_retrain_preparation.ipynb ├── scalable_shampoo/ │ ├── README.md │ ├── distributed_shampoo.py │ ├── quantization_utils.py │ ├── sm3.py │ └── symmetric_matrices/ │ └── symmetric_matrices.py ├── sweep.yaml └── train.py