alpaka/BufUniformCudaHipRtTraits_8hpp_source.html

/* Copyright 2025 Anton Reinhard, Maria Michailidi

 * SPDX-License-Identifier: MPL-2.0

 */


#pragma once


#include "alpaka/mem/buf/Traits.hpp"

#include "alpaka/mem/buf/cpu/BufCpu.hpp"

#include "alpaka/mem/buf/uniformCudaHip/BufUniformCudaHipRt.hpp"

#include "alpaka/mem/view/Traits.hpp"


#if defined(ALPAKA_ACC_GPU_CUDA_ENABLED) || defined(ALPAKA_ACC_GPU_HIP_ENABLED)


namespace alpaka::trait

{

    //! The CUDA/HIP RT device memory buffer type trait specialization.

    template<typename TApi, typename TElem, typename TDim, typename TIdx>


    struct BufType<DevUniformCudaHipRt<TApi>, TElem, TDim, TIdx>

    {

        using type = BufUniformCudaHipRt<TApi, TElem, TDim, TIdx>;

    };


    //! The BufUniformCudaHipRt device type trait specialization.

    template<typename TApi, typename TElem, typename TDim, typename TIdx>


    struct DevType<BufUniformCudaHipRt<TApi, TElem, TDim, TIdx>>

    {

        using type = DevUniformCudaHipRt<TApi>;

    };


    //! The BufUniformCudaHipRt device get trait specialization.

    template<typename TApi, typename TElem, typename TDim, typename TIdx>


    struct GetDev<BufUniformCudaHipRt<TApi, TElem, TDim, TIdx>>

    {


        ALPAKA_FN_HOST static auto getDev(BufUniformCudaHipRt<TApi, TElem, TDim, TIdx> const& buf)

            -> DevUniformCudaHipRt<TApi>

        {

            return buf.m_spBufImpl->m_dev;

        }


    };


    //! The BufUniformCudaHipRt dimension getter trait.

    template<typename TApi, typename TElem, typename TDim, typename TIdx>


    struct DimType<BufUniformCudaHipRt<TApi, TElem, TDim, TIdx>>

    {

        using type = TDim;

    };


    //! The BufUniformCudaHipRt memory element type get trait specialization.

    template<typename TApi, typename TElem, typename TDim, typename TIdx>


    struct ElemType<BufUniformCudaHipRt<TApi, TElem, TDim, TIdx>>

    {

        using type = TElem;

    };


    //! The BufUniformCudaHipRt width get trait specialization.

    template<typename TApi, typename TElem, typename TDim, typename TIdx>


    struct GetExtents<BufUniformCudaHipRt<TApi, TElem, TDim, TIdx>>

    {


        ALPAKA_FN_HOST auto operator()(BufUniformCudaHipRt<TApi, TElem, TDim, TIdx> const& buf)

        {

            return buf.m_spBufImpl->m_extentElements;

        }


    };


    //! The BufUniformCudaHipRt native pointer get trait specialization.

    template<typename TApi, typename TElem, typename TDim, typename TIdx>


    struct GetPtrNative<BufUniformCudaHipRt<TApi, TElem, TDim, TIdx>>

    {


        ALPAKA_FN_HOST static auto getPtrNative(BufUniformCudaHipRt<TApi, TElem, TDim, TIdx> const& buf)

            -> TElem const*

        {

            return buf.m_spBufImpl->m_pMem;

        }


        ALPAKA_FN_HOST static auto getPtrNative(BufUniformCudaHipRt<TApi, TElem, TDim, TIdx>& buf) -> TElem*

        {

            return buf.m_spBufImpl->m_pMem;

        }


    };


    //! The BufUniformCudaHipRt pointer on device get trait specialization.

    template<typename TApi, typename TElem, typename TDim, typename TIdx>


    struct GetPtrDev<BufUniformCudaHipRt<TApi, TElem, TDim, TIdx>, DevUniformCudaHipRt<TApi>>

    {


        ALPAKA_FN_HOST static auto getPtrDev(

            BufUniformCudaHipRt<TApi, TElem, TDim, TIdx> const& buf,

            DevUniformCudaHipRt<TApi> const& dev) -> TElem const*

        {

            if(dev == getDev(buf))

            {

                return buf.m_spBufImpl->m_pMem;

            }

            else

            {

                throw std::runtime_error("The buffer is not accessible from the given device!");

            }

        }


        ALPAKA_FN_HOST static auto getPtrDev(

            BufUniformCudaHipRt<TApi, TElem, TDim, TIdx>& buf,

            DevUniformCudaHipRt<TApi> const& dev) -> TElem*

        {

            if(dev == getDev(buf))

            {

                return buf.m_spBufImpl->m_pMem;

            }

            else

            {

                throw std::runtime_error("The buffer is not accessible from the given device!");

            }

        }


    };


    template<typename TApi, typename TElem, typename TDim, typename TIdx>


    struct GetPitchesInBytes<BufUniformCudaHipRt<TApi, TElem, TDim, TIdx>>

    {


        ALPAKA_FN_HOST auto operator()(BufUniformCudaHipRt<TApi, TElem, TDim, TIdx> const& buf) const

            -> Vec<TDim, TIdx>

        {

            return GetPitchesInBytes<ConstBufUniformCudaHipRt<TApi, TElem, TDim, TIdx>>{}(

                ConstBufUniformCudaHipRt<TApi, TElem, TDim, TIdx>{buf});

        }


    };


    //! The BufUniformCudaHipRt offset get trait specialization.

    template<typename TApi, typename TElem, typename TDim, typename TIdx>


    struct GetOffsets<BufUniformCudaHipRt<TApi, TElem, TDim, TIdx>>

    {


        ALPAKA_FN_HOST auto operator()(BufUniformCudaHipRt<TApi, TElem, TDim, TIdx> const& /*buf*/) const

            -> Vec<TDim, TIdx>

        {

            return Vec<TDim, TIdx>::zeros();

        }


    };


    //! The BufUniformCudaHipRt idx type trait specialization.

    template<typename TApi, typename TElem, typename TDim, typename TIdx>


    struct IdxType<BufUniformCudaHipRt<TApi, TElem, TDim, TIdx>>

    {

        using type = TIdx;

    };


    //! The BufCpu pointer on CUDA/HIP device get trait specialization.

    template<typename TApi, typename TElem, typename TDim, typename TIdx>


    struct GetPtrDev<BufCpu<TElem, TDim, TIdx>, DevUniformCudaHipRt<TApi>>

    {


        ALPAKA_FN_HOST static auto getPtrDev(BufCpu<TElem, TDim, TIdx> const& buf, DevUniformCudaHipRt<TApi> const&)

            -> TElem const*

        {

            // TODO: Check if the memory is mapped at all!

            TElem* pDev(nullptr);


            ALPAKA_UNIFORM_CUDA_HIP_RT_CHECK(TApi::hostGetDevicePointer(

                &pDev,

                const_cast<void*>(reinterpret_cast<void const*>(getPtrNative(buf))),

                0));


            return pDev;

        }


        ALPAKA_FN_HOST static auto getPtrDev(BufCpu<TElem, TDim, TIdx>& buf, DevUniformCudaHipRt<TApi> const&)

            -> TElem*

        {

            // TODO: Check if the memory is mapped at all!

            TElem* pDev(nullptr);


            ALPAKA_UNIFORM_CUDA_HIP_RT_CHECK(TApi::hostGetDevicePointer(&pDev, getPtrNative(buf), 0));


            return pDev;

        }


    };


    //! The MakeConstBuf trait for CUDA/HIP buffers.

    template<typename TApi, typename TElem, typename TDim, typename TIdx>


    struct MakeConstBuf<BufUniformCudaHipRt<TApi, TElem, TDim, TIdx>>

    {


        ALPAKA_FN_HOST static auto makeConstBuf(BufUniformCudaHipRt<TApi, TElem, TDim, TIdx> const& buf)

            -> ConstBufUniformCudaHipRt<TApi, TElem, TDim, TIdx>

        {

            return ConstBufUniformCudaHipRt<TApi, TElem, TDim, TIdx>(buf);

        }


        ALPAKA_FN_HOST static auto makeConstBuf(BufUniformCudaHipRt<TApi, TElem, TDim, TIdx>&& buf)

            -> ConstBufUniformCudaHipRt<TApi, TElem, TDim, TIdx>

        {

            return ConstBufUniformCudaHipRt<TApi, TElem, TDim, TIdx>(std::move(buf));

        }


    };


    //! The CUDA/HIP memory allocation trait specialization.

    template<typename TApi, typename TElem, typename Dim, typename TIdx>


    struct BufAlloc<TElem, Dim, TIdx, DevUniformCudaHipRt<TApi>>

    {

        template<typename TExtent>


        ALPAKA_FN_HOST static auto allocBuf(DevUniformCudaHipRt<TApi> const& dev, TExtent const& extent)

            -> BufUniformCudaHipRt<TApi, TElem, Dim, TIdx>

        {

            ALPAKA_DEBUG_MINIMAL_LOG_SCOPE;


            ALPAKA_UNIFORM_CUDA_HIP_RT_CHECK(TApi::setDevice(dev.getNativeHandle()));


            void* memPtr = nullptr;

            std::size_t rowPitchInBytes = 0u;

            if(getExtentProduct(extent) != 0)

            {

                if constexpr(Dim::value == 0)

                {

                    ALPAKA_UNIFORM_CUDA_HIP_RT_CHECK(TApi::malloc(&memPtr, sizeof(TElem)));

                }

                else if constexpr(Dim::value == 1)

                {

                    ALPAKA_UNIFORM_CUDA_HIP_RT_CHECK(

                        TApi::malloc(&memPtr, static_cast<std::size_t>(getWidth(extent)) * sizeof(TElem)));

                }

                else if constexpr(Dim::value == 2)

                {

                    ALPAKA_UNIFORM_CUDA_HIP_RT_CHECK(TApi::mallocPitch(

                        &memPtr,

                        &rowPitchInBytes,

                        static_cast<std::size_t>(getWidth(extent)) * sizeof(TElem),

                        static_cast<std::size_t>(getHeight(extent))));

                }

                else if constexpr(Dim::value == 3)

                {

                    typename TApi::Extent_t const extentVal = TApi::makeExtent(

                        static_cast<std::size_t>(getWidth(extent)) * sizeof(TElem),

                        static_cast<std::size_t>(getHeight(extent)),

                        static_cast<std::size_t>(getDepth(extent)));

                    typename TApi::PitchedPtr_t pitchedPtrVal;

                    pitchedPtrVal.ptr = nullptr;

                    ALPAKA_UNIFORM_CUDA_HIP_RT_CHECK(TApi::malloc3D(&pitchedPtrVal, extentVal));

                    memPtr = pitchedPtrVal.ptr;

                    rowPitchInBytes = pitchedPtrVal.pitch;

                }

            }

#    if ALPAKA_DEBUG >= ALPAKA_DEBUG_FULL

            std::cout << __func__;

            if constexpr(Dim::value >= 1)

                std::cout << " ew: " << getWidth(extent);

            if constexpr(Dim::value >= 2)

                std::cout << " eh: " << getHeight(extent);

            if constexpr(Dim::value >= 3)

                std::cout << " ed: " << getDepth(extent);

            std::cout << " ptr: " << memPtr;

            if constexpr(Dim::value >= 2)

                std::cout << " rowpitch: " << rowPitchInBytes;

            std::cout << std::endl;

#    endif

            return {

                dev,

                reinterpret_cast<TElem*>(memPtr),

                [](TElem* ptr) { ALPAKA_UNIFORM_CUDA_HIP_RT_CHECK_NOEXCEPT(TApi::free(ptr)); },

                extent,

                rowPitchInBytes};

        }


    };


    //! The CUDA/HIP stream-ordered memory allocation capability trait specialization.

    template<typename TApi, typename TDim>


    struct HasAsyncBufSupport<TDim, DevUniformCudaHipRt<TApi>> : std::true_type

    {

    };


    //! The CUDA/HIP stream-ordered memory allocation trait specialization.

    template<typename TApi, typename TElem, typename TDim, typename TIdx>


    struct AsyncBufAlloc<TElem, TDim, TIdx, DevUniformCudaHipRt<TApi>>

    {

        template<typename TQueue>


        ALPAKA_FN_HOST static auto allocAsyncBuf(TQueue queue, [[maybe_unused]] Vec<TDim, TIdx> const& extent)

            -> BufUniformCudaHipRt<TApi, TElem, TDim, TIdx>

        {

            ALPAKA_DEBUG_MINIMAL_LOG_SCOPE;


            std::size_t bytes, pitch;

            if constexpr(TDim::value == 0)

            {

                bytes = pitch = sizeof(TElem);

            }

            else if constexpr(TDim::value == 1)

            {

                bytes = pitch = static_cast<std::size_t>(extent.back()) * sizeof(TElem);

            }

            else

            {

                std::size_t const width = static_cast<std::size_t>(extent.back()) * sizeof(TElem);

                // On all tested NVIDIA and AMD GPUs the alignment used for pitched allocations is the same value

                // reported by the textureAlignment device property (512 bytes on NVIDA GPUs, 256 bytes on AMD GPUs).

                // This was tested on: NVIDIA Tesla T4, A100, L40S, H100, and RTX 3050 Ti Laptop GPUs,

                // and on AMD Radeon Pro WX 9100, Radeon Pro W7800/W7900, Instinct MI250X, and Instinct MI300X.

                // However, it is expected that an alignment of 128 bytes (32 threads per warp times 4 bytes per float

                // or int) should be sufficient to achieve coalesced memory accesses, and would reduce the amount of

                // wasted memory.

                constexpr std::size_t alignment = 128;

                pitch = (width + alignment - 1) / alignment * alignment;

                // Replace the last entry in the extent vector (i.e. the number of elements per row) with the pitch

                // (the number of bytes per row, including padding), and compute the total size in bytes, removing

                // the padding after the last row.

                auto aligned = alpaka::castVec<std::size_t>(extent);

                aligned.back() = pitch;

                bytes = aligned.prod() - pitch + width;

            }


            auto const& dev = getDev(queue);

            ALPAKA_UNIFORM_CUDA_HIP_RT_CHECK(TApi::setDevice(dev.getNativeHandle()));

            void* memPtr = nullptr;

            ALPAKA_UNIFORM_CUDA_HIP_RT_CHECK(TApi::mallocAsync(&memPtr, bytes, queue.getNativeHandle()));


#    if ALPAKA_DEBUG >= ALPAKA_DEBUG_FULL

            std::cout << __func__;

            if constexpr(Dim::value >= 1)

                std::cout << " ew: " << getWidth(extent);

            if constexpr(Dim::value >= 2)

                std::cout << " eh: " << getHeight(extent);

            if constexpr(Dim::value >= 3)

                std::cout << " ed: " << getDepth(extent);

            std::cout << " ptr: " << memPtr;

            if constexpr(Dim::value >= 2)

                std::cout << " rowpitch: " << pitch;

            std::cout << std::endl;

#    endif

            return {

                dev,

                reinterpret_cast<TElem*>(memPtr),

                [q = std::move(queue)](TElem* ptr)

                { ALPAKA_UNIFORM_CUDA_HIP_RT_CHECK_NOEXCEPT(TApi::freeAsync(ptr, q.getNativeHandle())); },

                extent,

                pitch};

        }


    };


    //! The pinned/mapped memory allocation capability trait specialization.

    template<typename TApi>


    struct HasMappedBufSupport<PlatformUniformCudaHipRt<TApi>> : public std::true_type

    {

    };


    //! The pinned/mapped memory allocation trait specialization for the CUDA/HIP devices.

    template<typename TApi, typename TElem, typename TDim, typename TIdx>


    struct BufAllocMapped<PlatformUniformCudaHipRt<TApi>, TElem, TDim, TIdx>

    {

        template<typename TExtent>


        ALPAKA_FN_HOST static auto allocMappedBuf(

            DevCpu const& host,

            PlatformUniformCudaHipRt<TApi> const& /*platform*/,

            TExtent const& extent) -> BufCpu<TElem, TDim, TIdx>

        {

            ALPAKA_DEBUG_MINIMAL_LOG_SCOPE;


            // Allocate CUDA/HIP page-locked memory on the host, mapped into the CUDA/HIP address space and

            // accessible to all CUDA/HIP devices.

            TElem* memPtr = nullptr;

            ALPAKA_UNIFORM_CUDA_HIP_RT_CHECK(TApi::hostMalloc(

                reinterpret_cast<void**>(&memPtr),

                sizeof(TElem) * static_cast<std::size_t>(getExtentProduct(extent)),

                TApi::hostMallocMapped | TApi::hostMallocPortable));

            auto deleter = [](TElem* ptr) { ALPAKA_UNIFORM_CUDA_HIP_RT_CHECK_NOEXCEPT(TApi::hostFree(ptr)); };


            return BufCpu<TElem, TDim, TIdx>(host, memPtr, std::move(deleter), extent);

        }


    };


    //! The unified/managed memory allocation trait specialization for the CUDA/HIP devices.

    template<typename TApi, typename TElem, typename TDim, typename TIdx>


    struct BufAllocManaged<PlatformUniformCudaHipRt<TApi>, TElem, TDim, TIdx>

    {

        template<typename TExtent>


        ALPAKA_FN_HOST static auto allocManagedBuf(

            DevCpu const& host,

            PlatformUniformCudaHipRt<TApi> const& /*platform*/,

            TExtent const& extent) -> BufCpu<TElem, TDim, TIdx>

        {

            ALPAKA_DEBUG_MINIMAL_LOG_SCOPE;


            // Allocate CUDA/HIP unified (managed) memory accessible by both host and all CUDA/HIP devices.

            TElem* memPtr = nullptr;

            ALPAKA_UNIFORM_CUDA_HIP_RT_CHECK(TApi::mallocManaged(

                reinterpret_cast<void**>(&memPtr),

                sizeof(TElem) * static_cast<std::size_t>(getExtentProduct(extent)),

                TApi::memAttachGlobal));

            auto deleter = [](TElem* ptr) { ALPAKA_UNIFORM_CUDA_HIP_RT_CHECK_NOEXCEPT(TApi::free(ptr)); };


            return BufCpu<TElem, TDim, TIdx>(host, memPtr, std::move(deleter), extent);

        }


    };


} // namespace alpaka::trait


#endif

BufCpu.hpp

BufUniformCudaHipRt.hpp

ALPAKA_DEBUG_MINIMAL_LOG_SCOPE
#define ALPAKA_DEBUG_MINIMAL_LOG_SCOPE
Definition Debug.hpp:55

ALPAKA_UNIFORM_CUDA_HIP_RT_CHECK_NOEXCEPT
#define ALPAKA_UNIFORM_CUDA_HIP_RT_CHECK_NOEXCEPT(cmd)
CUDA/HIP runtime error checking with log.
Definition UniformCudaHip.hpp:112

ALPAKA_UNIFORM_CUDA_HIP_RT_CHECK
#define ALPAKA_UNIFORM_CUDA_HIP_RT_CHECK(cmd)
CUDA/HIP runtime error checking with log and exception.
Definition UniformCudaHip.hpp:105

alpaka::BufCpu
The CPU memory buffer template implementing muting accessors.
Definition BufCpu.hpp:24

alpaka::BufUniformCudaHipRt
The generic memory buffer template implementing muting accessors.
Definition BufUniformCudaHipRt.hpp:29

alpaka::BufUniformCudaHipRt::m_spBufImpl
std::shared_ptr< TBufImpl > m_spBufImpl
Definition BufUniformCudaHipRt.hpp:45

alpaka::DevCpu
The CPU device handle.
Definition DevCpu.hpp:56

alpaka::DevUniformCudaHipRt
The CUDA/HIP RT device handle.
Definition DevUniformCudaHipRt.hpp:62

alpaka::Vec
A n-dimensional vector.
Definition Vec.hpp:38

alpaka::Vec::zeros
ALPAKA_NO_HOST_ACC_WARNING static ALPAKA_FN_HOST_ACC constexpr auto zeros() -> Vec< TDim, TVal >
Zero value constructor.
Definition Vec.hpp:99

ALPAKA_FN_HOST
#define ALPAKA_FN_HOST
Definition Common.hpp:40

Traits.hpp

Traits.hpp

alpaka::trait
The accelerator traits.
Definition AccCpuOmp2Blocks.hpp:115

alpaka::getExtentProduct
ALPAKA_NO_HOST_ACC_WARNING ALPAKA_FN_HOST_ACC auto getExtentProduct(T const &object) -> Idx< T >
Definition Traits.hpp:134

alpaka::getHeight
ALPAKA_NO_HOST_ACC_WARNING ALPAKA_FN_HOST_ACC auto getHeight(TExtent const &extent=TExtent()) -> Idx< TExtent >
Definition Traits.hpp:108

alpaka::getPtrNative
ALPAKA_FN_HOST auto getPtrNative(TView const &view) -> Elem< TView > const *
Gets the native pointer of the memory view.
Definition Traits.hpp:165

alpaka::getDev
ALPAKA_FN_HOST auto getDev(T const &t)
Definition Traits.hpp:68

alpaka::getDepth
ALPAKA_NO_HOST_ACC_WARNING ALPAKA_FN_HOST_ACC auto getDepth(TExtent const &extent=TExtent()) -> Idx< TExtent >
Definition Traits.hpp:121

alpaka::Dim
typename trait::DimType< T >::type Dim
The dimension type trait alias template to remove the ::type.
Definition Traits.hpp:19

alpaka::getWidth
ALPAKA_NO_HOST_ACC_WARNING ALPAKA_FN_HOST_ACC auto getWidth(TExtent const &extent=TExtent()) -> Idx< TExtent >
Definition Traits.hpp:95

alpaka::ConstBufUniformCudaHipRt
The CUDA/HIP memory buffer.
Definition ConstBufUniformCudaHipRt.hpp:39

alpaka::PlatformUniformCudaHipRt
The CUDA/HIP RT platform.
Definition PlatformUniformCudaHipRt.hpp:30

alpaka::trait::AsyncBufAlloc< TElem, TDim, TIdx, DevUniformCudaHipRt< TApi > >::allocAsyncBuf
static ALPAKA_FN_HOST auto allocAsyncBuf(TQueue queue, Vec< TDim, TIdx > const &extent) -> BufUniformCudaHipRt< TApi, TElem, TDim, TIdx >
Definition BufUniformCudaHipRtTraits.hpp:269

alpaka::trait::AsyncBufAlloc
The stream-ordered memory allocator trait.
Definition Traits.hpp:35

alpaka::trait::BufAllocManaged< PlatformUniformCudaHipRt< TApi >, TElem, TDim, TIdx >::allocManagedBuf
static ALPAKA_FN_HOST auto allocManagedBuf(DevCpu const &host, PlatformUniformCudaHipRt< TApi > const &, TExtent const &extent) -> BufCpu< TElem, TDim, TIdx >
Definition BufUniformCudaHipRtTraits.hpp:367

alpaka::trait::BufAllocManaged
The managed (unified) memory allocator trait.
Definition Traits.hpp:55

alpaka::trait::BufAllocMapped< PlatformUniformCudaHipRt< TApi >, TElem, TDim, TIdx >::allocMappedBuf
static ALPAKA_FN_HOST auto allocMappedBuf(DevCpu const &host, PlatformUniformCudaHipRt< TApi > const &, TExtent const &extent) -> BufCpu< TElem, TDim, TIdx >
Definition BufUniformCudaHipRtTraits.hpp:342

alpaka::trait::BufAllocMapped
The pinned/mapped memory allocator trait.
Definition Traits.hpp:45

alpaka::trait::BufAlloc< TElem, Dim, TIdx, DevUniformCudaHipRt< TApi > >::allocBuf
static ALPAKA_FN_HOST auto allocBuf(DevUniformCudaHipRt< TApi > const &dev, TExtent const &extent) -> BufUniformCudaHipRt< TApi, TElem, Dim, TIdx >
Definition BufUniformCudaHipRtTraits.hpp:195

alpaka::trait::BufAlloc
The memory allocator trait.
Definition Traits.hpp:31

alpaka::trait::BufType
The memory buffer type trait.
Definition Traits.hpp:23

alpaka::trait::DevType
The device type trait.
Definition Traits.hpp:23

alpaka::trait::DimType< BufUniformCudaHipRt< TApi, TElem, TDim, TIdx > >::type
TDim type
Definition BufUniformCudaHipRtTraits.hpp:45

alpaka::trait::DimType
The dimension getter type trait.
Definition Traits.hpp:14

alpaka::trait::ElemType< BufUniformCudaHipRt< TApi, TElem, TDim, TIdx > >::type
TElem type
Definition BufUniformCudaHipRtTraits.hpp:52

alpaka::trait::ElemType
The element type trait.
Definition Traits.hpp:16

alpaka::trait::GetDev< BufUniformCudaHipRt< TApi, TElem, TDim, TIdx > >::getDev
static ALPAKA_FN_HOST auto getDev(BufUniformCudaHipRt< TApi, TElem, TDim, TIdx > const &buf) -> DevUniformCudaHipRt< TApi >
Definition BufUniformCudaHipRtTraits.hpp:34

alpaka::trait::GetDev
The device get trait.
Definition Traits.hpp:27

alpaka::trait::GetExtents< BufUniformCudaHipRt< TApi, TElem, TDim, TIdx > >::operator()
ALPAKA_FN_HOST auto operator()(BufUniformCudaHipRt< TApi, TElem, TDim, TIdx > const &buf)
Definition BufUniformCudaHipRtTraits.hpp:59

alpaka::trait::GetExtents
The GetExtents trait for getting the extents of an object as an alpaka::Vec.
Definition Traits.hpp:37

alpaka::trait::GetOffsets< BufUniformCudaHipRt< TApi, TElem, TDim, TIdx > >::operator()
ALPAKA_FN_HOST auto operator()(BufUniformCudaHipRt< TApi, TElem, TDim, TIdx > const &) const -> Vec< TDim, TIdx >
Definition BufUniformCudaHipRtTraits.hpp:129

alpaka::trait::GetOffsets
The GetOffsets trait for getting the offsets of an object as an alpaka::Vec.
Definition Traits.hpp:33

alpaka::trait::GetPitchesInBytes< BufUniformCudaHipRt< TApi, TElem, TDim, TIdx > >::operator()
ALPAKA_FN_HOST auto operator()(BufUniformCudaHipRt< TApi, TElem, TDim, TIdx > const &buf) const -> Vec< TDim, TIdx >
Definition BufUniformCudaHipRtTraits.hpp:117

alpaka::trait::GetPitchesInBytes
Customization point for getPitchesInBytes. The default implementation uses the extent to calculate th...
Definition Traits.hpp:129

alpaka::trait::GetPtrDev< BufCpu< TElem, TDim, TIdx >, DevUniformCudaHipRt< TApi > >::getPtrDev
static ALPAKA_FN_HOST auto getPtrDev(BufCpu< TElem, TDim, TIdx > const &buf, DevUniformCudaHipRt< TApi > const &) -> TElem const *
Definition BufUniformCudaHipRtTraits.hpp:147

alpaka::trait::GetPtrDev< BufCpu< TElem, TDim, TIdx >, DevUniformCudaHipRt< TApi > >::getPtrDev
static ALPAKA_FN_HOST auto getPtrDev(BufCpu< TElem, TDim, TIdx > &buf, DevUniformCudaHipRt< TApi > const &) -> TElem *
Definition BufUniformCudaHipRtTraits.hpp:161

alpaka::trait::GetPtrDev< BufUniformCudaHipRt< TApi, TElem, TDim, TIdx >, DevUniformCudaHipRt< TApi > >::getPtrDev
static ALPAKA_FN_HOST auto getPtrDev(BufUniformCudaHipRt< TApi, TElem, TDim, TIdx > const &buf, DevUniformCudaHipRt< TApi > const &dev) -> TElem const *
Definition BufUniformCudaHipRtTraits.hpp:85

alpaka::trait::GetPtrDev< BufUniformCudaHipRt< TApi, TElem, TDim, TIdx >, DevUniformCudaHipRt< TApi > >::getPtrDev
static ALPAKA_FN_HOST auto getPtrDev(BufUniformCudaHipRt< TApi, TElem, TDim, TIdx > &buf, DevUniformCudaHipRt< TApi > const &dev) -> TElem *
Definition BufUniformCudaHipRtTraits.hpp:99

alpaka::trait::GetPtrDev
The pointer on device get trait.
Definition Traits.hpp:84

alpaka::trait::GetPtrNative< BufUniformCudaHipRt< TApi, TElem, TDim, TIdx > >::getPtrNative
static ALPAKA_FN_HOST auto getPtrNative(BufUniformCudaHipRt< TApi, TElem, TDim, TIdx > &buf) -> TElem *
Definition BufUniformCudaHipRtTraits.hpp:75

alpaka::trait::GetPtrNative< BufUniformCudaHipRt< TApi, TElem, TDim, TIdx > >::getPtrNative
static ALPAKA_FN_HOST auto getPtrNative(BufUniformCudaHipRt< TApi, TElem, TDim, TIdx > const &buf) -> TElem const *
Definition BufUniformCudaHipRtTraits.hpp:69

alpaka::trait::GetPtrNative
The native pointer get trait.
Definition Traits.hpp:80

alpaka::trait::HasAsyncBufSupport
The stream-ordered memory allocation capability trait.
Definition Traits.hpp:40

alpaka::trait::HasMappedBufSupport
The pinned/mapped memory allocation capability trait.
Definition Traits.hpp:50

alpaka::trait::IdxType< BufUniformCudaHipRt< TApi, TElem, TDim, TIdx > >::type
TIdx type
Definition BufUniformCudaHipRtTraits.hpp:140

alpaka::trait::IdxType
The idx type trait.
Definition Traits.hpp:25

alpaka::trait::MakeConstBuf< BufUniformCudaHipRt< TApi, TElem, TDim, TIdx > >::makeConstBuf
static ALPAKA_FN_HOST auto makeConstBuf(BufUniformCudaHipRt< TApi, TElem, TDim, TIdx > &&buf) -> ConstBufUniformCudaHipRt< TApi, TElem, TDim, TIdx >
Definition BufUniformCudaHipRtTraits.hpp:183

alpaka::trait::MakeConstBuf< BufUniformCudaHipRt< TApi, TElem, TDim, TIdx > >::makeConstBuf
static ALPAKA_FN_HOST auto makeConstBuf(BufUniformCudaHipRt< TApi, TElem, TDim, TIdx > const &buf) -> ConstBufUniformCudaHipRt< TApi, TElem, TDim, TIdx >
Definition BufUniformCudaHipRtTraits.hpp:177

alpaka::trait::MakeConstBuf
The trait to transform a mutable buffer into a constant one.
Definition Traits.hpp:59