gitextract_nqotrkr3/ ├── .github/ │ └── workflows/ │ └── linux.yaml ├── .gitignore ├── AsmGen/ │ ├── AsmGen.csproj │ ├── AsmGen.sln │ ├── DataFiles/ │ │ ├── BranchhistTestBlock.c │ │ ├── CommonFunctions.c │ │ ├── GccBranchHistFunction.c │ │ ├── GccIndirectBranchFunction.c │ │ ├── IndirectBranchTestBlock.c │ │ └── clammicrobench.vcxproj_template │ ├── IUarchTest.cs │ ├── Program.cs │ ├── Properties/ │ │ └── launchSettings.json │ ├── README.md │ ├── UarchTest.cs │ ├── UarchTestHelpers.cs │ └── tests/ │ ├── A73RobTest.cs │ ├── AddLoopTest.cs │ ├── AddNsq.cs │ ├── AddSchedTest.cs │ ├── AddvNsq.cs │ ├── AddvSchedTest.cs │ ├── AeseSchedTest.cs │ ├── AesencNsq.cs │ ├── BranchBufferTest.cs │ ├── BranchHistoryTest.cs │ ├── BtbTest.cs │ ├── CvtSchedTest.cs │ ├── FAdd256RfTest.cs │ ├── Fadd128RfTest.cs │ ├── Fadd128SchedTest.cs │ ├── Fadd256SchedTest.cs │ ├── FaddNsq.cs │ ├── FaddSchedTest.cs │ ├── FcmpSchedTest.cs │ ├── FlagRfTest.cs │ ├── Fma256SchedTest.cs │ ├── FmovSched.cs │ ├── FmulSchedTest.cs │ ├── FpRfTest.cs │ ├── FpStoreDataNsq.cs │ ├── IdrfTest.cs │ ├── IndirectBranchTest.cs │ ├── IntRfDepStoreTest.cs │ ├── IntRfTest.cs │ ├── JsCvtNsq.cs │ ├── JsCvtSched.cs │ ├── JumpNsqTest.cs │ ├── JumpSchedTest.cs │ ├── LdqTest.cs │ ├── LeaSchedTest.cs │ ├── LoadNsq.cs │ ├── LoadSchedTest.cs │ ├── MaddSchedTest.cs │ ├── MaskRfTest.cs │ ├── MixAddJumpSched.cs │ ├── MixAddvJsCvtNsq.cs │ ├── MixAddvJsCvtSched.cs │ ├── MixBranchStoreTest.cs │ ├── MixFAdd256and32RfTest.cs │ ├── MixFpRfDepBranchTest.cs │ ├── MixFpVecRfTest.cs │ ├── MixIntRfDepBranchTest.cs │ ├── MixIntVec128RfTest.cs │ ├── MixIntrfFprfTest.cs │ ├── MixJumpStoreDataSched.cs │ ├── MixJumpStoreSchedTest.cs │ ├── MixJumpThenAddSched.cs │ ├── MixLdqStqTest.cs │ ├── MixLoadStoreDivSchedTest.cs │ ├── MixLoadStoreSchedTest.cs │ ├── MixStoreDivSchedTest.cs │ ├── MixVec512Vec256BlockRfTest.cs │ ├── MixVec512Vec256RfTest.cs │ ├── MmxRfTest.cs │ ├── MulSchedTest.cs │ ├── NopLoopTest.cs │ ├── PdepSchedTest.cs │ ├── ReturnStackTest.cs │ ├── RobTest.cs │ ├── RorSchedTest.cs │ ├── ShlSchedTest.cs │ ├── StoreDataDivNsqTest.cs │ ├── StoreDataNsqTest.cs │ ├── StoreDataSchedTest.cs │ ├── StoreDivNsqTest.cs │ ├── StoreDivSchedTest.cs │ ├── StoreNsq.cs │ ├── StoreSchedTest.cs │ ├── Stq128Test.cs │ ├── Stq512Test.cs │ ├── StqTest.cs │ ├── TakenBranchBufferTest.cs │ ├── TakenJumpSchedTest.cs │ ├── Vec512RfTest.cs │ ├── VecMulNsq.cs │ └── ZeroRobTest.cs ├── CoherencyLatency/ │ ├── CoherencyLatency.cpp │ ├── CoherencyLatency.sln │ ├── CoherencyLatency.vcxproj │ ├── Makefile │ ├── PThreadsCoherencyLatency.c │ └── c2cparse/ │ ├── Program.cs │ ├── c2cparse.csproj │ └── c2cparse.sln ├── Common/ │ ├── arch_detect.mk │ ├── ci_gpumemlatency.sh │ ├── ci_package.sh │ ├── perfmon.h │ ├── timing.c │ └── timing.h ├── CoreClockChecker/ │ ├── BoostClockChecker.c │ ├── BoostClockChecker_arm.s │ ├── BoostClockChecker_x86.s │ ├── CoreClockChecker.c │ ├── CoreClockChecker_x86.s │ ├── Makefile │ └── WinCoreClockChecker/ │ ├── CoreClockCheckFunctions.asm │ ├── WinCoreClockChecker.cpp │ ├── WinCoreClockChecker.sln │ ├── WinCoreClockChecker.vcxproj │ └── WinCoreClockChecker.vcxproj.filters ├── GpuMemLatency/ │ ├── Makefile │ ├── OpenCL/ │ │ ├── LICENSE │ │ ├── README.md │ │ ├── include/ │ │ │ └── CL/ │ │ │ ├── cl.h │ │ │ ├── cl_d3d10.h │ │ │ ├── cl_d3d11.h │ │ │ ├── cl_dx9_media_sharing.h │ │ │ ├── cl_dx9_media_sharing_intel.h │ │ │ ├── cl_egl.h │ │ │ ├── cl_ext.h │ │ │ ├── cl_ext_intel.h │ │ │ ├── cl_gl.h │ │ │ ├── cl_gl_ext.h │ │ │ ├── cl_half.h │ │ │ ├── cl_icd.h │ │ │ ├── cl_platform.h │ │ │ ├── cl_va_api_media_sharing_intel.h │ │ │ ├── cl_version.h │ │ │ └── opencl.h │ │ └── lib/ │ │ └── OpenCL.lib │ ├── atomic_test.c │ ├── bw_test.c │ ├── common.c │ ├── instruction_rate.c │ ├── instruction_rate_fp16_kernel.cl │ ├── instruction_rate_fp64_kernel.cl │ ├── instruction_rate_kernel.cl │ ├── kernel.cl │ ├── kernels/ │ │ ├── atomic_exec_latency_test.cl │ │ ├── buffer_bw_test.cl │ │ ├── c2c_atomic_exec_latency_test.cl │ │ ├── constant_unrolled_latency_test.cl │ │ ├── ldst_bw_test.cl │ │ ├── local_64_bw_test.cl │ │ ├── local_atomic_latency_test.cl │ │ ├── local_bw_test.cl │ │ ├── local_float4_bw_test.cl │ │ ├── local_unrolled_latency_test.cl │ │ ├── scalar_unrolled_latency_test.cl │ │ ├── sum_bw_test.cl │ │ ├── tex_bw_test.cl │ │ ├── tex_latency_test.cl │ │ └── unrolled_latency_test.cl │ ├── latency_test.c │ ├── local_mem_latency_kernel.cl │ ├── opencltest.c │ ├── opencltest.h │ ├── opencltest.sln │ ├── opencltest.vcxproj │ ├── opencltest.vcxproj.filters │ └── texturetest.c ├── InstructionRate/ │ ├── Makefile │ ├── arm_instructionrate.c │ ├── arm_instructionrate.s │ ├── riscv_instructionrate.c │ ├── riscv_instructionrate.s │ ├── test.s │ ├── x86_fusion.c │ ├── x86_fusion.s │ ├── x86_instructionrate.c │ └── x86_instructionrate.s ├── LICENSE ├── LoadedMemoryLatency/ │ ├── LoadedMemoryLatency/ │ │ ├── LoadedMemoryLatency.asm │ │ ├── LoadedMemoryLatency.cpp │ │ ├── LoadedMemoryLatency.sln │ │ ├── LoadedMemoryLatency.vcxproj │ │ └── LoadedMemoryLatency.vcxproj.filters │ ├── LoadedMemoryLatency.c │ ├── LoadedMemoryLatency_amd64.s │ ├── LoadedMemoryLatency_arm.s │ └── Makefile ├── Makefile ├── MemoryBandwidth/ │ ├── Makefile │ ├── MemoryBandwidth/ │ │ ├── MemoryBandwidth.cpp │ │ ├── MemoryBandwidth.sln │ │ ├── MemoryBandwidth.vcxproj │ │ ├── MemoryBandwidth.vcxproj.filters │ │ ├── MemoryBandwidthFunctions.asm │ │ └── MemoryBandwidthFunctions32.asm │ ├── MemoryBandwidth.c │ ├── MemoryBandwidth_arm.s │ ├── MemoryBandwidth_riscv.s │ ├── MemoryBandwidth_x86.s │ ├── MixedMemoryBandwidthTest/ │ │ ├── MemoryBandwidth.h │ │ ├── MemoryBandwidthFunctions.asm │ │ ├── MixedMemoryBandwidthTest.cpp │ │ ├── MixedMemoryBandwidthTest.vcxproj │ │ └── MixedMemoryBandwidthTest.vcxproj.filters │ └── README.md ├── MemoryLatency/ │ ├── Makefile │ ├── MemoryLatency.c │ ├── MemoryLatency.cpp │ ├── MemoryLatency.sln │ ├── MemoryLatency.vcxproj │ ├── MemoryLatencyFunctions.asm │ ├── MemoryLatency_arm.s │ ├── MemoryLatency_i686.s │ ├── MemoryLatency_riscv.s │ ├── MemoryLatency_x86.s │ └── README.md ├── README.md ├── mt_instructionrate/ │ ├── InstructionRateFunctions.asm │ ├── Makefile │ ├── Project1.vcxproj │ ├── Project1.vcxproj.filters │ ├── arm_mt_instructionrate.c │ ├── arm_mt_instructionrate.s │ ├── mt_instructionrate.c │ ├── mt_instructionrate.sln │ ├── ppc64_mt_instructionrate.c │ ├── ppc64_mt_instructionrate.s │ ├── x86_mt_instructionrate │ ├── x86_mt_instructionrate.c │ └── x86_mt_instructionrate.s └── svm/ ├── OpenCL/ │ ├── include/ │ │ └── CL/ │ │ ├── Utils/ │ │ │ ├── Context.h │ │ │ ├── Context.hpp │ │ │ ├── Detail.hpp │ │ │ ├── Device.hpp │ │ │ ├── Error.h │ │ │ ├── Error.hpp │ │ │ ├── ErrorCodes.h │ │ │ ├── Event.h │ │ │ ├── Event.hpp │ │ │ ├── File.h │ │ │ ├── File.hpp │ │ │ ├── InteropContext.hpp │ │ │ ├── OpenCLUtilsCpp_Export.h │ │ │ ├── OpenCLUtils_Export.h │ │ │ ├── Platform.hpp │ │ │ ├── Utils.h │ │ │ └── Utils.hpp │ │ ├── cl.h │ │ ├── cl2.hpp │ │ ├── cl_d3d10.h │ │ ├── cl_d3d11.h │ │ ├── cl_dx9_media_sharing.h │ │ ├── cl_dx9_media_sharing_intel.h │ │ ├── cl_egl.h │ │ ├── cl_ext.h │ │ ├── cl_ext_intel.h │ │ ├── cl_function_types.h │ │ ├── cl_gl.h │ │ ├── cl_gl_ext.h │ │ ├── cl_half.h │ │ ├── cl_icd.h │ │ ├── cl_layer.h │ │ ├── cl_platform.h │ │ ├── cl_va_api_media_sharing_intel.h │ │ ├── cl_version.h │ │ ├── opencl.h │ │ └── opencl.hpp │ ├── lib/ │ │ ├── OpenCL.lib │ │ ├── OpenCLExt.lib │ │ ├── OpenCLUtils.lib │ │ ├── OpenCLUtilsCpp.lib │ │ ├── OpenCLUtilsCppd.lib │ │ ├── OpenCLUtilsd.lib │ │ └── pkgconfig/ │ │ └── OpenCL.pc │ └── share/ │ ├── cmake/ │ │ ├── OpenCL/ │ │ │ ├── OpenCLConfig.cmake │ │ │ └── OpenCLConfigVersion.cmake │ │ ├── OpenCLExtensionLoader/ │ │ │ ├── OpenCLExtensionLoaderConfig.cmake │ │ │ ├── OpenCLExtensionLoaderConfigVersion.cmake │ │ │ ├── OpenCLExtensionLoaderTargets-debug.cmake │ │ │ ├── OpenCLExtensionLoaderTargets-release.cmake │ │ │ └── OpenCLExtensionLoaderTargets.cmake │ │ ├── OpenCLHeaders/ │ │ │ ├── OpenCLHeadersConfig.cmake │ │ │ ├── OpenCLHeadersConfigVersion.cmake │ │ │ └── OpenCLHeadersTargets.cmake │ │ ├── OpenCLHeadersCpp/ │ │ │ ├── OpenCLHeadersCppConfig.cmake │ │ │ ├── OpenCLHeadersCppConfigVersion.cmake │ │ │ └── OpenCLHeadersCppTargets.cmake │ │ ├── OpenCLICDLoader/ │ │ │ ├── OpenCLICDLoaderConfig.cmake │ │ │ ├── OpenCLICDLoaderConfigVersion.cmake │ │ │ ├── OpenCLICDLoaderTargets-debug.cmake │ │ │ ├── OpenCLICDLoaderTargets-release.cmake │ │ │ └── OpenCLICDLoaderTargets.cmake │ │ ├── OpenCLUtils/ │ │ │ ├── OpenCLUtilsConfig.cmake │ │ │ ├── OpenCLUtilsConfigVersion.cmake │ │ │ ├── OpenCLUtilsTargets-debug.cmake │ │ │ ├── OpenCLUtilsTargets-release.cmake │ │ │ └── OpenCLUtilsTargets.cmake │ │ └── OpenCLUtilsCpp/ │ │ ├── OpenCLUtilsCppConfig.cmake │ │ ├── OpenCLUtilsCppConfigVersion.cmake │ │ ├── OpenCLUtilsCppTargets-debug.cmake │ │ ├── OpenCLUtilsCppTargets-release.cmake │ │ └── OpenCLUtilsCppTargets.cmake │ └── pkgconfig/ │ ├── OpenCL-CLHPP.pc │ └── OpenCL-Headers.pc ├── atomic_latency_kernel.cl ├── svm.sln ├── svm.vcxproj ├── svm.vcxproj.filters └── svmtest.cpp