gitextract_2qpyp2vm/ ├── .clang-format ├── .gitignore ├── CMakeLists.txt ├── CONTRIBUTING.md ├── CONTRIBUTORS ├── LICENSE ├── NOTICE ├── README.md ├── cmake/ │ ├── LBANNv2DetectTorchNVIDIALibraries.cmake │ ├── LBANNv2DetermineMI300A.cmake │ ├── lbannv2Config.cmake.in │ └── lbannv2_config.h.in ├── pyproject.toml ├── python/ │ └── lbannv2/ │ ├── __init__.py │ └── _automigrate.py ├── src/ │ └── lbannv2/ │ ├── CMakeLists.txt │ ├── memory/ │ │ ├── CMakeLists.txt │ │ ├── allocator.cpp │ │ ├── allocator.hpp │ │ ├── h2_allocator_wrappers.cpp │ │ ├── h2_allocator_wrappers.hpp │ │ ├── memory_utils.hpp │ │ ├── mi300a_allocator.cpp │ │ ├── mi300a_allocator.hpp │ │ ├── registry.cpp │ │ └── registry.hpp │ ├── ops/ │ │ ├── CMakeLists.txt │ │ ├── migrate.cpp │ │ ├── migrate.hpp │ │ ├── nonzero.hip │ │ ├── nonzero.hpp │ │ ├── scalar.cpp │ │ └── scalar.hpp │ ├── python/ │ │ ├── CMakeLists.txt │ │ ├── register_lbannv2.cpp │ │ ├── register_memory_funcs.cpp │ │ └── register_mi300a_ops.cpp │ ├── types.hpp │ └── utils/ │ ├── CMakeLists.txt │ ├── debugging_helpers.hpp │ ├── errors.hpp │ ├── gpu_utils.cpp │ ├── gpu_utils.hpp │ ├── logging.cpp │ ├── logging.hpp │ └── tensor_helpers.hpp └── test/ ├── CMakeLists.txt └── cpp/ ├── test_empty_tensor.cpp ├── test_helpers.hpp ├── test_mi300a_allocator.cpp ├── test_pointer_registry.cpp └── test_tensor_helpers.cpp