/* ========================================================================= Copyright (c) 2010-2015, Institute for Microelectronics, Institute for Analysis and Scientific Computing, TU Wien. Portions of this software are copyright by UChicago Argonne, LLC. ----------------- ViennaCL - The Vienna Computing Library ----------------- Project Head: Karl Rupp rupp@iue.tuwien.ac.at (A list of authors and contributors can be found in the PDF manual) License: MIT (X11), see file LICENSE in the base directory ============================================================================= */ /* * Benchmark: Direct solve matrix-matrix and matrix-vecotor * */ #include #include "viennacl/scalar.hpp" #include "viennacl/matrix.hpp" #include "viennacl/matrix_proxy.hpp" #include "viennacl/vector.hpp" #include "viennacl/linalg/prod.hpp" #include "viennacl/linalg/norm_2.hpp" #include "viennacl/linalg/direct_solve.hpp" #include "viennacl/tools/random.hpp" #include "viennacl/tools/timer.hpp" #define BENCHMARK_RUNS 10 inline void printOps(double num_ops, double exec_time) { std::cout << "GFLOPs: " << num_ops / (1000000 * exec_time * 1000) << std::endl; } template void fill_matrix(viennacl::matrix & mat) { viennacl::tools::uniform_random_numbers randomNumber; for (std::size_t i = 0; i < mat.size1(); ++i) { for (std::size_t j = 0; j < mat.size2(); ++j) mat(i, j) = static_cast(-0.5) * randomNumber(); mat(i, i) = NumericT(1.0) + NumericT(2.0) * randomNumber(); //some extra weight on diagonal for stability } } template void fill_vector(viennacl::vector & vec) { viennacl::tools::uniform_random_numbers randomNumber; for (std::size_t i = 0; i < vec.size(); ++i) vec(i) = NumericT(1.0) + NumericT(2.0) * randomNumber(); //some extra weight on diagonal for stability } template void run_solver_matrix(MatrixT1 const & matrix1, MatrixT2 const & matrix2,MatrixT3 & result, SolverTag) { std::cout << "------- Solver tag: " <(exec_time) / static_cast(BENCHMARK_RUNS))); std::cout << "GPU: " << double(matrix1.size1() * matrix1.size1() * matrix2.size2() * sizeof(NumericT)) / (static_cast(exec_time) / static_cast(BENCHMARK_RUNS)) / 1e9 << " GB/sec" << std::endl; std::cout << "Execution time: " << exec_time/BENCHMARK_RUNS << std::endl; std::cout << "------- Finnished: " << SolverTag::name() << " ----------" << std::endl; } template void run_solver_vector(MatrixT const & matrix, VectorT2 const & vector2,VectorT & result, SolverTag) { std::cout << "------- Solver tag: " <(exec_time) / static_cast(BENCHMARK_RUNS))); std::cout << "GPU: "<< double(matrix.size1() * matrix.size1() * sizeof(NumericT)) / (static_cast(exec_time) / static_cast(BENCHMARK_RUNS)) / 1e9 << " GB/sec" << std::endl; std::cout << "Execution time: " << exec_time/BENCHMARK_RUNS << std::endl; std::cout << "------- Finished: " << SolverTag::name() << " ----------" << std::endl; } template void run_benchmark() { std::size_t matrix_size = 1500; //some odd number, not too large std::size_t rhs_num = 153; viennacl::matrix vcl_A(matrix_size, matrix_size); viennacl::matrix vcl_B(matrix_size, rhs_num); viennacl::matrix result(matrix_size, rhs_num); viennacl::vector vcl_vec_B(matrix_size); viennacl::vector vcl_vec_result(matrix_size); fill_matrix(vcl_A); fill_matrix(vcl_B); fill_vector(vcl_vec_B); std::cout << "------- Solve Matrix-Matrix: ----------\n" << std::endl; run_solver_matrix(vcl_A,vcl_B,result,viennacl::linalg::lower_tag()); run_solver_matrix(vcl_A,vcl_B,result,viennacl::linalg::unit_lower_tag()); run_solver_matrix(vcl_A,vcl_B,result,viennacl::linalg::upper_tag()); run_solver_matrix(vcl_A,vcl_B,result,viennacl::linalg::unit_upper_tag()); std::cout << "------- End Matrix-Matrix: ----------\n" << std::endl; std::cout << "------- Solve Matrix-Vector: ----------\n" << std::endl; run_solver_vector(vcl_A,vcl_vec_B,vcl_vec_result,viennacl::linalg::lower_tag()); run_solver_vector(vcl_A,vcl_vec_B,vcl_vec_result,viennacl::linalg::unit_lower_tag()); run_solver_vector(vcl_A,vcl_vec_B,vcl_vec_result,viennacl::linalg::upper_tag()); run_solver_vector(vcl_A,vcl_vec_B,vcl_vec_result,viennacl::linalg::unit_upper_tag()); std::cout << "------- End Matrix-Vector: ----------\n" << std::endl; } int main() { std::cout << std::endl; std::cout << "----------------------------------------------" << std::endl; std::cout << " Device Info" << std::endl; std::cout << "----------------------------------------------" << std::endl; #ifdef VIENNACL_WITH_OPENCL std::cout << viennacl::ocl::current_device().info() << std::endl; #endif std::cout << std::endl; std::cout << "----------------------------------------------" << std::endl; std::cout << "----------------------------------------------" << std::endl; std::cout << "## Benchmark :: Direct solve" << std::endl; std::cout << "----------------------------------------------" << std::endl; std::cout << std::endl; std::cout << " -------------------------------" << std::endl; std::cout << " # benchmarking single-precision" << std::endl; std::cout << " -------------------------------" << std::endl; run_benchmark(); #ifdef VIENNACL_WITH_OPENCL if ( viennacl::ocl::current_device().double_support() ) #endif { std::cout << std::endl; std::cout << " -------------------------------" << std::endl; std::cout << " # benchmarking double-precision" << std::endl; std::cout << " -------------------------------" << std::endl; run_benchmark(); } return 0; }