Refactor away from google bench

LLNL · Apr 15, 2024 · dad5812 · dad5812
1 parent 633f6c0
commit dad5812
Showing 1 changed file with 11 additions and 10 deletions.
diff --git a/benchmark/benchmark-atomic.cpp b/benchmark/benchmark-atomic.cpp
@@ -101,27 +101,28 @@ void TimeAtomicOp(const std::string& test_name, int num_iterations = 2, int arra
 }
 
 int main () {
+    // CUDA benchmarks
     TimeAtomicOp<RAJA::cuda_exec<32>, int, CudaAtomicAdd<int>, true>("Benchmark array contention.  CUDA Block size 32, RAJA builtin atomic", 4);
-    //TimeAtomicOp<RAJA::cuda_exec<32>, int, atomicWrapperDesul<int, RAJA::policy::cuda::cuda_atomic, desul::atomic_fetch_add>, true>("Benchmark array contention.  CUDA Block size 32, DESUL atomic", 4);
+    TimeAtomicOp<RAJA::cuda_exec<32>, int, atomicWrapperDesul<int, RAJA::policy::cuda::cuda_atomic, desul::atomic_fetch_add>, true>("Benchmark array contention.  CUDA Block size 32, DESUL atomic", 4);
     TimeAtomicOp<RAJA::cuda_exec<64>, int, CudaAtomicAdd<int>, true>("Benchmark array contention. CUDA Block size 64, RAJA builtin atomic", 4);
-    //TimeAtomicOp<RAJA::cuda_exec<64>, int, atomicWrapperDesul<int, RAJA::policy::cuda::cuda_atomic, desul::atomic_fetch_add>, true>("Benchmark array contention. CUDA Block size 64, DESUL atomic", 4);
+    TimeAtomicOp<RAJA::cuda_exec<64>, int, atomicWrapperDesul<int, RAJA::policy::cuda::cuda_atomic, desul::atomic_fetch_add>, true>("Benchmark array contention. CUDA Block size 64, DESUL atomic", 4);
     TimeAtomicOp<RAJA::cuda_exec<128>, int, CudaAtomicAdd<int>, true>("Benchmark array contention.  CUDA Block size 128, RAJA builtin atomic", 4);
-    //TimeAtomicOp<RAJA::cuda_exec<128>, int, atomicWrapperDesul<int, RAJA::policy::cuda::cuda_atomic, desul::atomic_fetch_add>, true>("Benchmark array contention.  CUDA Block size 128, DESUL atomic", 4);
+    TimeAtomicOp<RAJA::cuda_exec<128>, int, atomicWrapperDesul<int, RAJA::policy::cuda::cuda_atomic, desul::atomic_fetch_add>, true>("Benchmark array contention.  CUDA Block size 128, DESUL atomic", 4);
     TimeAtomicOp<RAJA::cuda_exec<256>, int, CudaAtomicAdd<int>, true>("Benchmark array contention. CUDA Block size 256, RAJA builtin atomic", 4);
-    //TimeAtomicOp<RAJA::cuda_exec<256>, int, atomicWrapperDesul<int, RAJA::policy::cuda::cuda_atomic, desul::atomic_fetch_add>, true>("Benchmark array contention. CUDA Block size 256, DESUL atomic", 4);
+    TimeAtomicOp<RAJA::cuda_exec<256>, int, atomicWrapperDesul<int, RAJA::policy::cuda::cuda_atomic, desul::atomic_fetch_add>, true>("Benchmark array contention. CUDA Block size 256, DESUL atomic", 4);
 
     TimeAtomicOp<RAJA::cuda_exec<128>, int, CudaAtomicAdd<int>, true>("Benchmark array contention.  CUDA Block size 128, RAJA builtin atomic", 2, 10);
-    //TimeAtomicOp<RAJA::cuda_exec<128>, int, atomicWrapperDesul<int, RAJA::policy::cuda::cuda_atomic, desul::atomic_fetch_add>, true>("Benchmark array contention.  CUDA Block size 128, DESUL atomic", 2, 10);
+    TimeAtomicOp<RAJA::cuda_exec<128>, int, atomicWrapperDesul<int, RAJA::policy::cuda::cuda_atomic, desul::atomic_fetch_add>, true>("Benchmark array contention.  CUDA Block size 128, DESUL atomic", 2, 10);
     TimeAtomicOp<RAJA::cuda_exec<256>, int, CudaAtomicAdd<int>, true>("Benchmark array contention. CUDA Block size 256, RAJA builtin atomic", 2, 10);
-    //TimeAtomicOp<RAJA::cuda_exec<256>, int, atomicWrapperDesul<int, RAJA::policy::cuda::cuda_atomic, desul::atomic_fetch_add>, true>("Benchmark array contention. CUDA Block size 256, DESUL atomic", 2, 10);
+    TimeAtomicOp<RAJA::cuda_exec<256>, int, atomicWrapperDesul<int, RAJA::policy::cuda::cuda_atomic, desul::atomic_fetch_add>, true>("Benchmark array contention. CUDA Block size 256, DESUL atomic", 2, 10);
 
     TimeAtomicOp<RAJA::cuda_exec<128>, double, CudaAtomicAdd<double>>("CUDA Block size 128, RAJA builtin atomic");
-    //TimeAtomicOp<RAJA::cuda_exec<128>, double, atomicWrapperDesul<double, RAJA::policy::cuda::cuda_atomic, desul::atomic_fetch_add>>("CUDA Block size 128, DESUL atomic");
+    TimeAtomicOp<RAJA::cuda_exec<128>, double, atomicWrapperDesul<double, RAJA::policy::cuda::cuda_atomic, desul::atomic_fetch_add>>("CUDA Block size 128, DESUL atomic");
     TimeAtomicOp<RAJA::cuda_exec<256>, double, CudaAtomicAdd<double>>("CUDA Block size 256, RAJA builtin atomic");
-    //TimeAtomicOp<RAJA::cuda_exec<256>, double, atomicWrapperDesul<double, RAJA::policy::cuda::cuda_atomic, desul::atomic_fetch_add>>("CUDA Block size 256, DESUL atomic");
+    TimeAtomicOp<RAJA::cuda_exec<256>, double, atomicWrapperDesul<double, RAJA::policy::cuda::cuda_atomic, desul::atomic_fetch_add>>("CUDA Block size 256, DESUL atomic");
 
     TimeAtomicOp<RAJA::cuda_exec<128>, int, CudaAtomicMax<int>>("CUDA Block size 128, RAJA builtin atomic");
-    //TimeAtomicOp<RAJA::cuda_exec<128>, int, atomicWrapperDesul<int, RAJA::policy::cuda::cuda_atomic, desul::atomic_fetch_max>>("CUDA Block size 128, DESUL atomic");
+    TimeAtomicOp<RAJA::cuda_exec<128>, int, atomicWrapperDesul<int, RAJA::policy::cuda::cuda_atomic, desul::atomic_fetch_max>>("CUDA Block size 128, DESUL atomic");
     TimeAtomicOp<RAJA::cuda_exec<256>, int, CudaAtomicMax<int>>("CUDA Block size 256, RAJA builtin atomic");
-    //TimeAtomicOp<RAJA::cuda_exec<256>, int, atomicWrapperDesul<int, RAJA::policy::cuda::cuda_atomic, desul::atomic_fetch_max>>("CUDA Block size 256, DESUL atomic");
+    TimeAtomicOp<RAJA::cuda_exec<256>, int, atomicWrapperDesul<int, RAJA::policy::cuda::cuda_atomic, desul::atomic_fetch_max>>("CUDA Block size 256, DESUL atomic");
 }