gitextract_28zc9teu/ ├── .vscode/ │ ├── launch.json │ └── settings.json ├── CUDA/ │ ├── chapter10_线程束基本函数与协作组/ │ │ ├── Makefile │ │ ├── error.cuh │ │ ├── reduce.cu │ │ ├── reduce1parallelism.cu │ │ ├── reduce2static.cu │ │ └── warp.cu │ ├── chapter11_CUDA流/ │ │ ├── Makefile │ │ ├── README.md │ │ ├── common.h │ │ ├── error.cuh │ │ ├── host-kernel.cu │ │ ├── kernel-kernel.cu │ │ ├── kernel-transfer.cu │ │ ├── pinMemTransfer.cu │ │ ├── simpleHyperqOpenmp.cu │ │ ├── simpleMultiAddBreadth.cu │ │ └── simpleMultiAddDepth.cu │ ├── chapter12_使用统一内存编程/ │ │ ├── Makefile │ │ ├── add.cu │ │ ├── add2_static.cu │ │ ├── error.cuh │ │ ├── oversubscription1.cu │ │ ├── oversubscription2.cu │ │ ├── oversubscription3.cu │ │ └── prefetch.cu │ ├── chapter13_分子动力学模拟的CUDA程序开发/ │ │ ├── cpp/ │ │ │ ├── common.cuh │ │ │ ├── error.cuh │ │ │ ├── force.cu │ │ │ ├── force.cuh │ │ │ ├── initialize.cu │ │ │ ├── initialize.cuh │ │ │ ├── integrate.cu │ │ │ ├── integrate.cuh │ │ │ ├── main.cu │ │ │ ├── makefile │ │ │ ├── makefile.windows │ │ │ ├── memory.cu │ │ │ ├── memory.cuh │ │ │ ├── mic.cuh │ │ │ ├── neighbor.cu │ │ │ └── neighbor.cuh │ │ ├── force-only/ │ │ │ ├── Makefile │ │ │ ├── common.h │ │ │ ├── error.cuh │ │ │ ├── force.cu │ │ │ ├── force.h │ │ │ ├── initialize.cu │ │ │ ├── initialize.h │ │ │ ├── integrate.cu │ │ │ ├── integrate.h │ │ │ ├── main.cu │ │ │ ├── makefile.windows │ │ │ ├── memory.cu │ │ │ ├── memory.h │ │ │ ├── mic.h │ │ │ ├── neighbor.cu │ │ │ └── neighbor.h │ │ ├── plot_energy.m │ │ └── whole-code/ │ │ ├── Makefile │ │ ├── common.h │ │ ├── error.cuh │ │ ├── force.cu │ │ ├── force.h │ │ ├── initialize.cu │ │ ├── initialize.h │ │ ├── integrate.cu │ │ ├── integrate.h │ │ ├── main.cu │ │ ├── makefile.windows │ │ ├── memory.cu │ │ ├── memory.h │ │ ├── mic.h │ │ ├── neighbor.cu │ │ ├── neighbor.h │ │ ├── reduce.cu │ │ └── reduce.h │ ├── chapter14_CUDA标准库的使用/ │ │ ├── Makefile │ │ ├── cublas_gemm.cu │ │ ├── curand_host1.cu │ │ ├── curand_host2.cu │ │ ├── cusolver.cu │ │ ├── error.cuh │ │ ├── thrust_scan_pointer.cu │ │ └── thrust_scan_vector.cu │ ├── chapter1_GPU硬件与CUDA程序开发工具/ │ │ └── README.md │ ├── chapter2_CUDA中的线程组织/ │ │ ├── Makefile │ │ ├── hello1.cpp │ │ ├── hello2.cu │ │ ├── hello3.cu │ │ ├── hello4.cu │ │ └── hello5.cu │ ├── chapter3_简单CUDA程序的基本框架/ │ │ ├── Makefile │ │ ├── add.cpp │ │ ├── add1.cu │ │ ├── add2wrong.cu │ │ ├── add3if.cu │ │ └── add4device.cu │ ├── chapter4_CUDA程序的错误检测/ │ │ ├── Makefile │ │ ├── check1api │ │ ├── check1api.cu │ │ ├── check2kernel │ │ ├── check2kernel.cu │ │ ├── error.cuh │ │ ├── memcheck │ │ └── memcheck.cu │ ├── chapter5_获得GPU加速的关键/ │ │ ├── Makefile │ │ ├── add1cpu.cu │ │ ├── add2gpu.cu │ │ ├── add3memcpy.cu │ │ ├── arithmetic1cpu.cu │ │ ├── arithmetic2gpu.cu │ │ └── error.cuh │ ├── chapter6_CUDA的内存组织/ │ │ ├── Makefile │ │ ├── README.md │ │ ├── error.cuh │ │ ├── query.cu │ │ └── static.cu │ ├── chapter7_全局内存的合理使用/ │ │ ├── Makefile │ │ ├── error.cuh │ │ └── matrix.cu │ ├── chapter8_共享内存的合理使用/ │ │ ├── Makefile │ │ ├── bank.cu │ │ ├── error.cuh │ │ ├── reduce1cpu.cu │ │ └── reduce2gpu.cu │ └── chapter9_原子函数的合理使用/ │ ├── Makefile │ ├── error.cuh │ ├── neighbor.txt │ ├── neighbor1cpu.cu │ ├── neighbor2gpu.cu │ ├── reduce.cu │ └── xy.txt └── README.md