#ifndef VIENNACL_VECTOR_PROXY_HPP_ #define VIENNACL_VECTOR_PROXY_HPP_ /* ========================================================================= Copyright (c) 2010-2011, Institute for Microelectronics, Institute for Analysis and Scientific Computing, TU Wien. ----------------- ViennaCL - The Vienna Computing Library ----------------- Project Head: Karl Rupp rupp@iue.tuwien.ac.at (A list of authors and contributors can be found in the PDF manual) License: MIT (X11), see file LICENSE in the base directory ============================================================================= */ /** @file vector_proxy.hpp @brief Proxy classes for vectors. */ #include "viennacl/forwards.h" #include "viennacl/range.hpp" #include "viennacl/vector.hpp" namespace viennacl { template class vector_range { typedef vector_range self_type; public: typedef typename VectorType::value_type value_type; typedef range::size_type size_type; typedef range::difference_type difference_type; typedef value_type reference; typedef const value_type & const_reference; static const int alignment = VectorType::alignment; vector_range(VectorType & v, range const & entry_range) : v_(v), entry_range_(entry_range) {} size_type start() const { return entry_range_.start(); } size_type size() const { return entry_range_.size(); } template self_type & operator = (const vector_expression< LHS, RHS, OP > & proxy) { assert( false && "Not implemented!"); return *this; } self_type & operator += (self_type const & other) { viennacl::linalg::inplace_add(*this, other); return *this; } //const_reference operator()(size_type i, size_type j) const { return A_(start1() + i, start2() + i); } //reference operator()(size_type i, size_type j) { return A_(start1() + i, start2() + i); } VectorType & get() { return v_; } const VectorType & get() const { return v_; } private: VectorType & v_; range entry_range_; }; template std::ostream & operator<<(std::ostream & s, vector_range const & proxy) { typedef typename VectorType::value_type ScalarType; std::vector temp(proxy.size()); viennacl::copy(proxy, temp); //instead of printing 'temp' directly, let's reuse the existing functionality for viennacl::vector. It certainly adds overhead, but printing a vector is typically not about performance... VectorType temp2(temp.size()); viennacl::copy(temp, temp2); s << temp2; return s; } ///////////////////////////////////////////////////////////// ///////////////////////// CPU to GPU //////////////////////// ///////////////////////////////////////////////////////////// //row_major: template void copy(const VectorType & cpu_vector, vector_range > & gpu_vector_range ) { assert(cpu_vector.end() - cpu_vector.begin() >= 0); if (cpu_vector.end() - cpu_vector.begin() > 0) { //we require that the size of the gpu_vector is larger or equal to the cpu-size std::vector temp_buffer(cpu_vector.end() - cpu_vector.begin()); std::copy(cpu_vector.begin(), cpu_vector.end(), temp_buffer.begin()); cl_int err = clEnqueueWriteBuffer(viennacl::ocl::get_queue().handle(), gpu_vector_range.get().handle(), CL_TRUE, sizeof(SCALARTYPE)*gpu_vector_range.start(), sizeof(SCALARTYPE)*temp_buffer.size(), &(temp_buffer[0]), 0, NULL, NULL); VIENNACL_ERR_CHECK(err); } } ///////////////////////////////////////////////////////////// ///////////////////////// GPU to CPU //////////////////////// ///////////////////////////////////////////////////////////// template void copy(vector_range > const & gpu_vector_range, VectorType & cpu_vector) { assert(cpu_vector.end() - cpu_vector.begin() >= 0); if (cpu_vector.end() > cpu_vector.begin()) { std::vector temp_buffer(cpu_vector.end() - cpu_vector.begin()); cl_int err = clEnqueueReadBuffer(viennacl::ocl::get_queue().handle(), gpu_vector_range.get().handle(), CL_TRUE, sizeof(SCALARTYPE)*gpu_vector_range.start(), sizeof(SCALARTYPE)*temp_buffer.size(), &(temp_buffer[0]), 0, NULL, NULL); VIENNACL_ERR_CHECK(err); viennacl::ocl::get_queue().finish(); //now copy entries to cpu_vec: std::copy(temp_buffer.begin(), temp_buffer.end(), cpu_vector.begin()); } } } #endif