gitextract_zn673rxz/ ├── .gitignore ├── CMakeLists.txt ├── DEBIAN/ │ ├── Binary/ │ │ ├── postinst.in │ │ └── prerm.in │ ├── Dev/ │ │ ├── postinst.in │ │ └── prerm.in │ └── preinst ├── LICENSE.txt ├── README.md ├── RPM/ │ ├── Binary/ │ │ ├── post.in │ │ └── postun.in │ ├── Dev/ │ │ ├── post.in │ │ └── postun.in │ ├── hsa-rocr.spec.in │ └── preinst ├── _clang-format ├── clang-format-diff.py ├── cmake_modules/ │ └── utils.cmake ├── format ├── libhsakmt/ │ ├── CMakeLists.txt │ ├── DEBIAN/ │ │ ├── postinst.in │ │ └── prerm.in │ ├── LICENSE.md │ ├── README.md │ ├── RPM/ │ │ ├── hsakmt-roct-devel.spec.in │ │ ├── libhsakmt.spec │ │ ├── post.in │ │ └── postun.in │ ├── cmake_modules/ │ │ └── utils.cmake │ ├── hsakmt-config.cmake.in │ ├── include/ │ │ └── hsakmt/ │ │ ├── hsakmt.h │ │ ├── hsakmt_virtio.h │ │ ├── hsakmtmodel.h │ │ ├── hsakmtmodeliface.h │ │ ├── hsakmttypes.h │ │ └── linux/ │ │ ├── kfd_ioctl.h │ │ └── udmabuf.h │ ├── libhsakmt.pc.in │ ├── src/ │ │ ├── debug.c │ │ ├── events.c │ │ ├── fmm.c │ │ ├── fmm.h │ │ ├── globals.c │ │ ├── hsakmtmodel.c │ │ ├── libhsakmt.c │ │ ├── libhsakmt.h │ │ ├── libhsakmt.ver │ │ ├── memory.c │ │ ├── openclose.c │ │ ├── pc_sampling.c │ │ ├── perfctr.c │ │ ├── pmc_table.c │ │ ├── pmc_table.h │ │ ├── queues.c │ │ ├── rbtree.c │ │ ├── rbtree.h │ │ ├── rbtree_amd.h │ │ ├── spm.c │ │ ├── svm.c │ │ ├── time.c │ │ ├── topology.c │ │ ├── version.c │ │ └── virtio/ │ │ ├── CMakeLists.txt │ │ ├── hsakmt_virtio_amdgpu.c │ │ ├── hsakmt_virtio_device.c │ │ ├── hsakmt_virtio_device.h │ │ ├── hsakmt_virtio_events.c │ │ ├── hsakmt_virtio_memory.c │ │ ├── hsakmt_virtio_openclose.c │ │ ├── hsakmt_virtio_proto.h │ │ ├── hsakmt_virtio_queues.c │ │ ├── hsakmt_virtio_topology.c │ │ ├── hsakmt_virtio_vm.c │ │ ├── include/ │ │ │ └── linux/ │ │ │ └── virtgpu_drm.h │ │ ├── libhsakmt_virtio.ver │ │ ├── virtio_gpu.c │ │ └── virtio_gpu.h │ └── tests/ │ ├── kfdtest/ │ │ ├── .gitignore │ │ ├── CMakeLists.txt │ │ ├── LICENSE.kfdtest │ │ ├── README.txt │ │ ├── gtest-1.6.0/ │ │ │ ├── gtest/ │ │ │ │ └── gtest.h │ │ │ └── gtest-all.cpp │ │ ├── include/ │ │ │ ├── amdp2ptest.h │ │ │ ├── asic_reg/ │ │ │ │ ├── gfx_7_2_d.h │ │ │ │ ├── gfx_7_2_enum.h │ │ │ │ └── gfx_7_2_sh_mask.h │ │ │ ├── kfd_pm4_opcodes.h │ │ │ ├── pm4_pkt_struct_ai.h │ │ │ ├── pm4_pkt_struct_ci.h │ │ │ ├── pm4_pkt_struct_common.h │ │ │ ├── pm4_pkt_struct_nv.h │ │ │ └── sdma_pkt_struct.h │ │ ├── scripts/ │ │ │ ├── kfdtest.exclude │ │ │ └── run_kfdtest.sh │ │ └── src/ │ │ ├── AqlQueue.cpp │ │ ├── AqlQueue.hpp │ │ ├── Assemble.cpp │ │ ├── Assemble.hpp │ │ ├── BaseDebug.cpp │ │ ├── BaseDebug.hpp │ │ ├── BasePacket.cpp │ │ ├── BasePacket.hpp │ │ ├── BaseQueue.cpp │ │ ├── BaseQueue.hpp │ │ ├── Dispatch.cpp │ │ ├── Dispatch.hpp │ │ ├── GoogleTestExtension.cpp │ │ ├── GoogleTestExtension.hpp │ │ ├── IndirectBuffer.cpp │ │ ├── IndirectBuffer.hpp │ │ ├── KFDASMTest.cpp │ │ ├── KFDASMTest.hpp │ │ ├── KFDBaseComponentTest.cpp │ │ ├── KFDBaseComponentTest.hpp │ │ ├── KFDCWSRTest.cpp │ │ ├── KFDCWSRTest.hpp │ │ ├── KFDDBGTest.cpp │ │ ├── KFDDBGTest.hpp │ │ ├── KFDEventTest.cpp │ │ ├── KFDEventTest.hpp │ │ ├── KFDEvictTest.cpp │ │ ├── KFDEvictTest.hpp │ │ ├── KFDExceptionTest.cpp │ │ ├── KFDExceptionTest.hpp │ │ ├── KFDGWSTest.cpp │ │ ├── KFDGWSTest.hpp │ │ ├── KFDGraphicsInterop.cpp │ │ ├── KFDGraphicsInterop.hpp │ │ ├── KFDHWSTest.cpp │ │ ├── KFDHWSTest.hpp │ │ ├── KFDIPCTest.cpp │ │ ├── KFDIPCTest.hpp │ │ ├── KFDLocalMemoryTest.cpp │ │ ├── KFDLocalMemoryTest.hpp │ │ ├── KFDMemoryTest.cpp │ │ ├── KFDMemoryTest.hpp │ │ ├── KFDMultiProcessTest.cpp │ │ ├── KFDMultiProcessTest.hpp │ │ ├── KFDNegativeTest.cpp │ │ ├── KFDNegativeTest.hpp │ │ ├── KFDOpenCloseKFDTest.cpp │ │ ├── KFDOpenCloseKFDTest.hpp │ │ ├── KFDPCSamplingTest.cpp │ │ ├── KFDPCSamplingTest.hpp │ │ ├── KFDPMTest.cpp │ │ ├── KFDPMTest.hpp │ │ ├── KFDPerfCounters.cpp │ │ ├── KFDPerfCounters.hpp │ │ ├── KFDPerformanceTest.cpp │ │ ├── KFDQMTest.cpp │ │ ├── KFDQMTest.hpp │ │ ├── KFDRASTest.cpp │ │ ├── KFDRASTest.hpp │ │ ├── KFDSVMEvictTest.cpp │ │ ├── KFDSVMEvictTest.hpp │ │ ├── KFDSVMRangeTest.cpp │ │ ├── KFDSVMRangeTest.hpp │ │ ├── KFDTestFlags.hpp │ │ ├── KFDTestMain.cpp │ │ ├── KFDTestUtil.cpp │ │ ├── KFDTestUtil.hpp │ │ ├── KFDTestUtilQueue.cpp │ │ ├── KFDTestUtilQueue.hpp │ │ ├── KFDTopologyTest.cpp │ │ ├── KFDTopologyTest.hpp │ │ ├── LinuxOSWrapper.cpp │ │ ├── OSWrapper.hpp │ │ ├── PM4Packet.cpp │ │ ├── PM4Packet.hpp │ │ ├── PM4Queue.cpp │ │ ├── PM4Queue.hpp │ │ ├── RDMATest.cpp │ │ ├── RDMATest.hpp │ │ ├── RDMAUtil.cpp │ │ ├── RDMAUtil.hpp │ │ ├── SDMAPacket.cpp │ │ ├── SDMAPacket.hpp │ │ ├── SDMAQueue.cpp │ │ ├── SDMAQueue.hpp │ │ ├── SDMAQueueByEngId.hpp │ │ ├── ShaderStore.cpp │ │ ├── ShaderStore.hpp │ │ └── XgmiOptimizedSDMAQueue.hpp │ ├── rdma/ │ │ └── simple/ │ │ ├── app/ │ │ │ ├── CMakeLists.txt │ │ │ └── rdma_test.cpp │ │ └── drv/ │ │ ├── amdp2ptest.c │ │ └── amdp2ptest.h │ └── reopen/ │ ├── CMakeLists.txt │ └── kmtreopen.c ├── rocrtst/ │ ├── .gitignore │ ├── Kernels/ │ │ ├── CMakeLists.txt │ │ ├── binary_search_kernel.cl │ │ ├── read_kernel.cl │ │ └── write_kernel.cl │ ├── README.md │ ├── common/ │ │ ├── base_rocr.cc │ │ ├── base_rocr.h │ │ ├── base_rocr_utils.cc │ │ ├── base_rocr_utils.h │ │ ├── common.cc │ │ ├── common.h │ │ ├── concurrent_utils.cc │ │ ├── concurrent_utils.h │ │ ├── helper_funcs.cc │ │ ├── helper_funcs.h │ │ ├── hsatimer.cc │ │ ├── hsatimer.h │ │ ├── os.cc │ │ ├── os.h │ │ ├── rocr.cc │ │ ├── rocr.h │ │ └── utils_test/ │ │ ├── CMakeLists.txt │ │ ├── utils_cpp11_gtest.cpp │ │ ├── utils_timer_gtest.cpp │ │ ├── utils_timer_test.cpp │ │ └── utils_timer_test.hpp │ ├── gtest/ │ │ ├── CMakeLists.txt │ │ ├── include/ │ │ │ └── gtest/ │ │ │ ├── gtest-death-test.h │ │ │ ├── gtest-message.h │ │ │ ├── gtest-param-test.h │ │ │ ├── gtest-printers.h │ │ │ ├── gtest-spi.h │ │ │ ├── gtest-test-part.h │ │ │ ├── gtest-typed-test.h │ │ │ ├── gtest.h │ │ │ ├── gtest_pred_impl.h │ │ │ ├── gtest_prod.h │ │ │ └── internal/ │ │ │ ├── gtest-death-test-internal.h │ │ │ ├── gtest-filepath.h │ │ │ ├── gtest-internal.h │ │ │ ├── gtest-linked_ptr.h │ │ │ ├── gtest-param-util-generated.h │ │ │ ├── gtest-param-util-generated.h.pump │ │ │ ├── gtest-param-util.h │ │ │ ├── gtest-port.h │ │ │ ├── gtest-string.h │ │ │ ├── gtest-tuple.h │ │ │ ├── gtest-tuple.h.pump │ │ │ ├── gtest-type-util.h │ │ │ └── gtest-type-util.h.pump │ │ └── src/ │ │ ├── gtest-all.cpp │ │ ├── gtest-death-test.cpp │ │ ├── gtest-filepath.cpp │ │ ├── gtest-internal-inl.h │ │ ├── gtest-port.cpp │ │ ├── gtest-printers.cpp │ │ ├── gtest-test-part.cpp │ │ ├── gtest-typed-test.cpp │ │ ├── gtest.cpp │ │ └── gtest_main.cpp │ ├── samples/ │ │ ├── CMakeLists.txt │ │ ├── README.txt │ │ ├── async_mem_copy/ │ │ │ └── async_mem_copy.cc │ │ ├── binary_search/ │ │ │ ├── binary_search.cc │ │ │ └── binary_search_kernels.cl │ │ ├── ipc/ │ │ │ └── ipc.cc │ │ ├── rocm_async/ │ │ │ ├── CMakeLists.txt │ │ │ ├── Readme.txt │ │ │ ├── base_test.cpp │ │ │ ├── base_test.hpp │ │ │ ├── common.cpp │ │ │ ├── common.hpp │ │ │ ├── hsatimer.cpp │ │ │ ├── hsatimer.hpp │ │ │ ├── main.cpp │ │ │ ├── os.cpp │ │ │ ├── os.hpp │ │ │ ├── rocm_async.cpp │ │ │ ├── rocm_async.hpp │ │ │ ├── rocm_async_io.cpp │ │ │ ├── rocm_async_parse.cpp │ │ │ ├── rocm_async_print.cpp │ │ │ ├── rocm_async_report.cpp │ │ │ ├── rocm_async_topology.cpp │ │ │ ├── rocm_async_trans.cpp │ │ │ └── rocm_async_validate.cpp │ │ └── rocrinfo/ │ │ └── rocrinfo.cc │ ├── suites/ │ │ ├── functional/ │ │ │ ├── agent_props.cc │ │ │ ├── agent_props.h │ │ │ ├── aql_barrier_bit.cc │ │ │ ├── aql_barrier_bit.h │ │ │ ├── concurrent_init.cc │ │ │ ├── concurrent_init.h │ │ │ ├── concurrent_init_shutdown.cc │ │ │ ├── concurrent_init_shutdown.h │ │ │ ├── concurrent_shutdown.cc │ │ │ ├── concurrent_shutdown.h │ │ │ ├── cu_masking.cc │ │ │ ├── cu_masking.h │ │ │ ├── deallocation_notifier.cc │ │ │ ├── deallocation_notifier.h │ │ │ ├── debug_basic.cc │ │ │ ├── debug_basic.h │ │ │ ├── ipc.cc │ │ │ ├── ipc.h │ │ │ ├── memory_access.cc │ │ │ ├── memory_access.h │ │ │ ├── memory_alignment.cc │ │ │ ├── memory_alignment.h │ │ │ ├── memory_allocation.cc │ │ │ ├── memory_allocation.h │ │ │ ├── memory_atomics.cc │ │ │ ├── memory_atomics.h │ │ │ ├── memory_basic.cc │ │ │ ├── memory_basic.h │ │ │ ├── reference_count.cc │ │ │ ├── reference_count.h │ │ │ ├── signal_concurrent.cc │ │ │ ├── signal_concurrent.h │ │ │ ├── signal_kernel.cc │ │ │ ├── signal_kernel.h │ │ │ ├── virtual_memory.cc │ │ │ └── virtual_memory.h │ │ ├── negative/ │ │ │ ├── memory_allocate_negative_tests.cc │ │ │ ├── memory_allocate_negative_tests.h │ │ │ ├── queue_validation.cc │ │ │ └── queue_validation.h │ │ ├── performance/ │ │ │ ├── dispatch_time.cc │ │ │ ├── dispatch_time.h │ │ │ ├── enqueueLatency.cc │ │ │ ├── enqueueLatency.h │ │ │ ├── memory_async_copy.cc │ │ │ ├── memory_async_copy.h │ │ │ ├── memory_async_copy_numa.cc │ │ │ └── memory_async_copy_numa.h │ │ ├── stress/ │ │ │ ├── memory_concurrent_tests.cc │ │ │ ├── memory_concurrent_tests.h │ │ │ ├── queue_write_index_concurrent_tests.cc │ │ │ └── queue_write_index_concurrent_tests.h │ │ └── test_common/ │ │ ├── CMakeLists.txt │ │ ├── kernels/ │ │ │ ├── atomicOperations_kernels.cl │ │ │ ├── cu_mask_kernels.cl │ │ │ ├── dispatch_time_kernels.cl │ │ │ ├── gpuReadWrite_kernels.cl │ │ │ ├── groupMemoryDynamic_kernels.cl │ │ │ ├── signal_operations.cl │ │ │ ├── test_case_template_kernels.cl │ │ │ ├── vector_add_debug_trap_kernel.cl │ │ │ └── vector_add_memory_fault_kernel.cl │ │ ├── main.cc │ │ ├── main.h │ │ ├── test_base.cc │ │ ├── test_base.h │ │ ├── test_case_template.cc │ │ ├── test_case_template.h │ │ ├── test_common.cc │ │ └── test_common.h │ └── thirdparty/ │ ├── include/ │ │ ├── LICENSE │ │ ├── hwloc/ │ │ │ ├── autogen/ │ │ │ │ └── config.h │ │ │ ├── bitmap.h │ │ │ ├── cpuset.h │ │ │ ├── cuda.h │ │ │ ├── cudart.h │ │ │ ├── deprecated.h │ │ │ ├── diff.h │ │ │ ├── gl.h │ │ │ ├── glibc-sched.h │ │ │ ├── helper.h │ │ │ ├── inlines.h │ │ │ ├── intel-mic.h │ │ │ ├── linux-libnuma.h │ │ │ ├── linux.h │ │ │ ├── myriexpress.h │ │ │ ├── nvml.h │ │ │ ├── opencl.h │ │ │ ├── openfabrics-verbs.h │ │ │ ├── plugins.h │ │ │ └── rename.h │ │ └── hwloc.h │ └── lib/ │ ├── LICENSE │ └── libhwloc.so.5 ├── runtime/ │ ├── cmake_modules/ │ │ ├── COPYING-CMAKE-SCRIPTS │ │ └── FindLibElf.cmake │ ├── docs/ │ │ ├── api-reference/ │ │ │ ├── api.rst │ │ │ ├── c-interface-adaptors.rst │ │ │ └── environment_variables.rst │ │ ├── conf.py │ │ ├── contribution/ │ │ │ └── contributing-to-rocr.rst │ │ ├── data/ │ │ │ └── env_variables.rst │ │ ├── index.rst │ │ ├── install/ │ │ │ └── installation.rst │ │ ├── license.rst │ │ ├── sphinx/ │ │ │ ├── _toc.yml.in │ │ │ ├── requirements.in │ │ │ └── requirements.txt │ │ └── what-is-rocr-runtime.rst │ ├── hsa-ext-finalize/ │ │ └── CMakeLists.txt │ ├── hsa-ext-image/ │ │ └── CMakeLists.txt │ ├── hsa-runtime/ │ │ ├── CMakeLists.txt │ │ ├── LICENSE.md │ │ ├── cmake_modules/ │ │ │ ├── COPYING-CMAKE-SCRIPTS │ │ │ ├── FindLibElf.cmake │ │ │ ├── hsa_common.cmake │ │ │ └── utils.cmake │ │ ├── core/ │ │ │ ├── common/ │ │ │ │ ├── hsa_table_interface.cpp │ │ │ │ └── shared.h │ │ │ ├── driver/ │ │ │ │ ├── driver.cpp │ │ │ │ ├── kfd/ │ │ │ │ │ └── amd_kfd_driver.cpp │ │ │ │ ├── virtio/ │ │ │ │ │ └── amd_kfd_virtio_driver.cpp │ │ │ │ └── xdna/ │ │ │ │ ├── amd_xdna_driver.cpp │ │ │ │ └── uapi/ │ │ │ │ └── amdxdna_accel.h │ │ │ ├── inc/ │ │ │ │ ├── agent.h │ │ │ │ ├── amd_aie_agent.h │ │ │ │ ├── amd_aie_aql_queue.h │ │ │ │ ├── amd_aql_queue.h │ │ │ │ ├── amd_available_drivers.h │ │ │ │ ├── amd_blit_kernel.h │ │ │ │ ├── amd_blit_sdma.h │ │ │ │ ├── amd_blit_shaders.h │ │ │ │ ├── amd_core_dump.hpp │ │ │ │ ├── amd_cpu_agent.h │ │ │ │ ├── amd_elf_image.hpp │ │ │ │ ├── amd_filter_device.h │ │ │ │ ├── amd_gpu_agent.h │ │ │ │ ├── amd_gpu_pm4.h │ │ │ │ ├── amd_hsa_code.hpp │ │ │ │ ├── amd_hsa_loader.hpp │ │ │ │ ├── amd_kfd_driver.h │ │ │ │ ├── amd_loader_context.hpp │ │ │ │ ├── amd_memory_region.h │ │ │ │ ├── amd_topology.h │ │ │ │ ├── amd_trap_handler_v1.h │ │ │ │ ├── amd_virtio_driver.h │ │ │ │ ├── amd_xdna_driver.h │ │ │ │ ├── blit.h │ │ │ │ ├── cache.h │ │ │ │ ├── checked.h │ │ │ │ ├── default_signal.h │ │ │ │ ├── driver.h │ │ │ │ ├── exceptions.h │ │ │ │ ├── host_queue.h │ │ │ │ ├── hsa_amd_tool_int.hpp │ │ │ │ ├── hsa_api_trace_int.h │ │ │ │ ├── hsa_ext_amd_impl.h │ │ │ │ ├── hsa_ext_interface.h │ │ │ │ ├── hsa_internal.h │ │ │ │ ├── hsa_table_interface.h │ │ │ │ ├── hsa_ven_amd_loader_impl.h │ │ │ │ ├── intercept_queue.h │ │ │ │ ├── interrupt_signal.h │ │ │ │ ├── ipc_signal.h │ │ │ │ ├── isa.h │ │ │ │ ├── memory_region.h │ │ │ │ ├── queue.h │ │ │ │ ├── registers.h │ │ │ │ ├── runtime.h │ │ │ │ ├── scratch_cache.h │ │ │ │ ├── sdma_registers.h │ │ │ │ ├── signal.h │ │ │ │ ├── svm_profiler.h │ │ │ │ └── thunk_loader.h │ │ │ ├── runtime/ │ │ │ │ ├── amd_aie_agent.cpp │ │ │ │ ├── amd_aie_aql_queue.cpp │ │ │ │ ├── amd_aql_queue.cpp │ │ │ │ ├── amd_blit_kernel.cpp │ │ │ │ ├── amd_blit_sdma.cpp │ │ │ │ ├── amd_cpu_agent.cpp │ │ │ │ ├── amd_filter_device.cpp │ │ │ │ ├── amd_gpu_agent.cpp │ │ │ │ ├── amd_hsa_loader.cpp │ │ │ │ ├── amd_loader_context.cpp │ │ │ │ ├── amd_memory_region.cpp │ │ │ │ ├── amd_topology.cpp │ │ │ │ ├── blit_shaders/ │ │ │ │ │ ├── CMakeLists.txt │ │ │ │ │ ├── blit_copyAligned.s │ │ │ │ │ ├── blit_copyMisaligned.s │ │ │ │ │ ├── blit_fill.s │ │ │ │ │ └── create_blit_shader_header.sh │ │ │ │ ├── cache.cpp │ │ │ │ ├── default_signal.cpp │ │ │ │ ├── host_queue.cpp │ │ │ │ ├── hsa.cpp │ │ │ │ ├── hsa_api_trace.cpp │ │ │ │ ├── hsa_ext_amd.cpp │ │ │ │ ├── hsa_ext_interface.cpp │ │ │ │ ├── hsa_ven_amd_loader.cpp │ │ │ │ ├── intercept_queue.cpp │ │ │ │ ├── interrupt_signal.cpp │ │ │ │ ├── ipc_signal.cpp │ │ │ │ ├── isa.cpp │ │ │ │ ├── queue.cpp │ │ │ │ ├── runtime.cpp │ │ │ │ ├── signal.cpp │ │ │ │ ├── svm_profiler.cpp │ │ │ │ ├── thunk_loader.cpp │ │ │ │ └── trap_handler/ │ │ │ │ ├── CMakeLists.txt │ │ │ │ ├── create_trap_handler_header.sh │ │ │ │ ├── trap_handler.s │ │ │ │ └── trap_handler_gfx12.s │ │ │ └── util/ │ │ │ ├── atomic_helpers.h │ │ │ ├── flag.cpp │ │ │ ├── flag.h │ │ │ ├── lazy_ptr.h │ │ │ ├── lnx/ │ │ │ │ └── os_linux.cpp │ │ │ ├── locks.h │ │ │ ├── memory.h │ │ │ ├── os.h │ │ │ ├── simple_heap.h │ │ │ ├── small_heap.cpp │ │ │ ├── small_heap.h │ │ │ ├── timer.cpp │ │ │ ├── timer.h │ │ │ ├── utils.h │ │ │ └── win/ │ │ │ └── os_win.cpp │ │ ├── hsa-runtime64-config.cmake.in │ │ ├── hsacore.so.def │ │ ├── hsacore.so.link │ │ ├── image/ │ │ │ ├── addrlib/ │ │ │ │ ├── inc/ │ │ │ │ │ ├── addrinterface.h │ │ │ │ │ └── addrtypes.h │ │ │ │ └── src/ │ │ │ │ ├── addrinterface.cpp │ │ │ │ ├── amdgpu_asic_addr.h │ │ │ │ ├── chip/ │ │ │ │ │ ├── gfx10/ │ │ │ │ │ │ └── gfx10_gb_reg.h │ │ │ │ │ ├── gfx11/ │ │ │ │ │ │ └── gfx11_gb_reg.h │ │ │ │ │ ├── gfx12/ │ │ │ │ │ │ └── gfx12_gb_reg.h │ │ │ │ │ ├── gfx9/ │ │ │ │ │ │ └── gfx9_gb_reg.h │ │ │ │ │ └── r800/ │ │ │ │ │ └── si_gb_reg.h │ │ │ │ ├── core/ │ │ │ │ │ ├── addrcommon.h │ │ │ │ │ ├── addrelemlib.cpp │ │ │ │ │ ├── addrelemlib.h │ │ │ │ │ ├── addrlib.cpp │ │ │ │ │ ├── addrlib.h │ │ │ │ │ ├── addrlib1.cpp │ │ │ │ │ ├── addrlib1.h │ │ │ │ │ ├── addrlib2.cpp │ │ │ │ │ ├── addrlib2.h │ │ │ │ │ ├── addrlib3.cpp │ │ │ │ │ ├── addrlib3.h │ │ │ │ │ ├── addrobject.cpp │ │ │ │ │ ├── addrobject.h │ │ │ │ │ ├── coord.cpp │ │ │ │ │ └── coord.h │ │ │ │ ├── gfx10/ │ │ │ │ │ ├── gfx10SwizzlePattern.h │ │ │ │ │ ├── gfx10addrlib.cpp │ │ │ │ │ └── gfx10addrlib.h │ │ │ │ ├── gfx11/ │ │ │ │ │ ├── gfx11SwizzlePattern.h │ │ │ │ │ ├── gfx11addrlib.cpp │ │ │ │ │ └── gfx11addrlib.h │ │ │ │ ├── gfx12/ │ │ │ │ │ ├── gfx12SwizzlePattern.h │ │ │ │ │ ├── gfx12addrlib.cpp │ │ │ │ │ └── gfx12addrlib.h │ │ │ │ └── gfx9/ │ │ │ │ ├── gfx9addrlib.cpp │ │ │ │ └── gfx9addrlib.h │ │ │ ├── blit_kernel.cpp │ │ │ ├── blit_kernel.h │ │ │ ├── blit_object_gfx7xx.cpp │ │ │ ├── blit_object_gfx8xx.cpp │ │ │ ├── blit_object_gfx9xx.cpp │ │ │ ├── blit_src/ │ │ │ │ ├── CMakeLists.txt │ │ │ │ ├── README.md │ │ │ │ ├── create_hsaco_ascii_file.sh │ │ │ │ └── imageblit_kernels.cl │ │ │ ├── device_info.cpp │ │ │ ├── device_info.h │ │ │ ├── hsa_ext_image.cpp │ │ │ ├── image_lut.h │ │ │ ├── image_lut_gfx11.cpp │ │ │ ├── image_lut_gfx11.h │ │ │ ├── image_lut_kv.cpp │ │ │ ├── image_lut_kv.h │ │ │ ├── image_manager.cpp │ │ │ ├── image_manager.h │ │ │ ├── image_manager_ai.cpp │ │ │ ├── image_manager_ai.h │ │ │ ├── image_manager_gfx11.cpp │ │ │ ├── image_manager_gfx11.h │ │ │ ├── image_manager_gfx12.cpp │ │ │ ├── image_manager_gfx12.h │ │ │ ├── image_manager_kv.cpp │ │ │ ├── image_manager_kv.h │ │ │ ├── image_manager_nv.cpp │ │ │ ├── image_manager_nv.h │ │ │ ├── image_runtime.cpp │ │ │ ├── image_runtime.h │ │ │ ├── inc/ │ │ │ │ └── hsa_ext_image_impl.h │ │ │ ├── resource.h │ │ │ ├── resource_ai.h │ │ │ ├── resource_gfx11.h │ │ │ ├── resource_gfx12.h │ │ │ ├── resource_kv.h │ │ │ ├── resource_nv.h │ │ │ └── util.h │ │ ├── inc/ │ │ │ ├── Brig.h │ │ │ ├── amd_hsa_common.h │ │ │ ├── amd_hsa_elf.h │ │ │ ├── amd_hsa_kernel_code.h │ │ │ ├── amd_hsa_queue.h │ │ │ ├── amd_hsa_signal.h │ │ │ ├── hsa.h │ │ │ ├── hsa_amd_tool.h │ │ │ ├── hsa_api_trace.h │ │ │ ├── hsa_api_trace_version.h │ │ │ ├── hsa_ext_amd.h │ │ │ ├── hsa_ext_finalize.h │ │ │ ├── hsa_ext_image.h │ │ │ ├── hsa_ven_amd_aqlprofile.h │ │ │ ├── hsa_ven_amd_loader.h │ │ │ └── hsa_ven_amd_pc_sampling.h │ │ ├── libamdhsacode/ │ │ │ ├── amd_core_dump.cpp │ │ │ ├── amd_elf_image.cpp │ │ │ ├── amd_hsa_code.cpp │ │ │ ├── amd_hsa_code_util.cpp │ │ │ ├── amd_hsa_code_util.hpp │ │ │ ├── amd_hsa_locks.cpp │ │ │ ├── amd_hsa_locks.hpp │ │ │ ├── amd_options.cpp │ │ │ └── amd_options.hpp │ │ ├── loader/ │ │ │ ├── AMDHSAKernelDescriptor.h │ │ │ ├── executable.cpp │ │ │ └── executable.hpp │ │ └── pcs/ │ │ ├── hsa_ven_amd_pc_sampling.cpp │ │ ├── inc/ │ │ │ └── hsa_ven_amd_pc_sampling_impl.h │ │ ├── pcs_runtime.cpp │ │ └── pcs_runtime.h │ ├── hsa-runtime-tools/ │ │ └── CMakeLists.txt │ └── packages/ │ ├── hsa-ext-rocr-dev/ │ │ ├── CMakeLists.txt │ │ ├── Old CMakeLists.txt │ │ ├── copyright │ │ ├── description │ │ ├── postinst │ │ ├── prerm │ │ ├── rpm_post │ │ └── rpm_postun │ └── rocr_tools_legacy/ │ ├── CMakeLists.txt │ ├── copyright │ ├── description │ ├── postinst │ ├── prerm │ ├── rpm_post │ └── rpm_postun └── samples/ ├── GetInfo/ │ ├── get_info.cpp │ └── get_info.h └── common/ ├── common.cpp ├── common.hpp ├── common_utility.cpp ├── common_utility.h ├── helper_funcs.cpp ├── helper_funcs.hpp ├── hsa_base_util.cpp ├── hsa_base_util.h ├── hsa_perf_cntrs.cpp ├── hsa_perf_cntrs.hpp ├── hsa_rsrc_factory.cpp ├── hsa_rsrc_factory.hpp ├── hsa_test.cpp ├── hsa_test.h ├── hsatimer.cpp ├── hsatimer.h ├── os.cpp ├── os.h ├── utilities.cpp └── utilities.h