gitextract_qq3udcpt/ ├── .gitignore ├── LICENSE ├── Makefile ├── NOTICE ├── README.md ├── bin/ │ └── calculon ├── calculon/ │ ├── __init__.py │ ├── command_line.py │ ├── io.py │ ├── llm/ │ │ ├── __init__.py │ │ ├── all_executions.py │ │ ├── layers.py │ │ ├── llm.py │ │ ├── optimal_execution.py │ │ ├── parameter_calculator.py │ │ ├── runner.py │ │ └── validation.py │ ├── memory.py │ ├── network.py │ ├── processor.py │ ├── system.py │ ├── util.py │ └── version.py ├── examples/ │ └── 3072_t4_p64_d12_mbs4_full.json ├── models/ │ ├── anthropic-52B.json │ ├── chinchilla.json │ ├── gopher-280B.json │ ├── gpt3-13B.json │ ├── gpt3-175B.json │ ├── lamda.json │ ├── megatron-126M.json │ ├── megatron-1T.json │ ├── megatron-22B.json │ ├── megatron-40B.json │ ├── megatron-5B.json │ ├── palm-540B.json │ └── turing-530B.json ├── pylintrc ├── pyproject.toml ├── scripts/ │ ├── 3dplot.py │ ├── find_huge.py │ ├── heatmap.py │ ├── install_hooks.sh │ └── json_to_csv.py ├── setup.py ├── systems/ │ ├── a100_80e.json │ ├── a100_80g.json │ └── h100_80g_nvl8.json ├── test/ │ ├── __init__.py │ ├── test.sh │ └── test_json_write_read.py └── validation/ └── seqsel/ ├── fig1/ │ ├── gpt3-175B_none.json │ ├── gpt3-175B_seqsel.json │ ├── megatron-1T_none.json │ ├── megatron-1T_seqsel.json │ ├── megatron-22B_none.json │ ├── megatron-22B_seqsel.json │ ├── turing-530B_none.json │ └── turing-530B_seqsel.json ├── fig7/ │ ├── gpt3-175B_full.json │ ├── gpt3-175B_none.json │ ├── gpt3-175B_sel.json │ ├── gpt3-175B_seq.json │ ├── gpt3-175B_seqsel.json │ ├── megatron-1T_full.json │ ├── megatron-1T_none.json │ ├── megatron-1T_sel.json │ ├── megatron-1T_seq.json │ ├── megatron-1T_seqsel.json │ ├── megatron-22B_full.json │ ├── megatron-22B_none.json │ ├── megatron-22B_sel.json │ ├── megatron-22B_seq.json │ ├── megatron-22B_seqsel.json │ ├── turing-530B_full.json │ ├── turing-530B_none.json │ ├── turing-530B_sel.json │ ├── turing-530B_seq.json │ └── turing-530B_seqsel.json └── tab5/ ├── gpt3-175B_full.json ├── gpt3-175B_seqsel.json ├── megatron-1T_full.json ├── megatron-1T_seqsel.json ├── megatron-22B_full.json ├── megatron-22B_seqsel.json ├── turing-530B_full.json └── turing-530B_seqsel.json