Repository: mgg39/Quantum-tech-papers Branch: main Commit: 0854090cf16d Files: 39 Total size: 88.0 MB Directory structure: gitextract_xuh1h2o1/ ├── .devcontainer/ │ └── devcontainer.json ├── .gitignore ├── .streamlit/ │ └── config.toml ├── README.md ├── app/ │ ├── __init__.py │ ├── pages/ │ │ ├── __init__.py │ │ └── graph_visualization.py │ └── streamlit_app.py ├── config.yaml ├── data/ │ ├── enriched/ │ │ └── papers_data_enriched.csv │ ├── inputs/ │ │ └── papers_data.csv │ └── outputs/ │ ├── sbert_embeddings.pkl │ ├── sbert_model/ │ │ ├── 1_Pooling/ │ │ │ └── config.json │ │ ├── README.md │ │ ├── config.json │ │ ├── config_sentence_transformers.json │ │ ├── model.safetensors │ │ ├── modules.json │ │ ├── sentence_bert_config.json │ │ ├── special_tokens_map.json │ │ ├── tokenizer.json │ │ ├── tokenizer_config.json │ │ └── vocab.txt │ ├── tfidf_matrix.pkl │ ├── tfidf_vectorizer.pkl │ └── train_data_with_clean.csv ├── i18n/ │ └── en.json ├── instruction.md ├── main.py ├── packages.txt ├── pipelines.py ├── requirements.txt └── src/ ├── __init__.py ├── config_loader.py ├── enrich_papers_incremental.py ├── extract_papers_to_csv.py ├── inference.py ├── preprocessing.py └── training.py ================================================ FILE CONTENTS ================================================ ================================================ FILE: .devcontainer/devcontainer.json ================================================ { "name": "Python 3", // Or use a Dockerfile or Docker Compose file. More info: https://containers.dev/guide/dockerfile "image": "mcr.microsoft.com/devcontainers/python:1-3.11-bullseye", "customizations": { "codespaces": { "openFiles": [ "README.md", "main.py" ] }, "vscode": { "settings": {}, "extensions": [ "ms-python.python", "ms-python.vscode-pylance" ] } }, "updateContentCommand": "[ -f packages.txt ] && sudo apt update && sudo apt upgrade -y && sudo xargs apt install -y