PSPNet/src/caffe/syncedmem.cpp at master · Spatialghost/PSPNet

History

157 lines (143 loc) · 3.23 KB

Raw

100

101

102

103

104

105

106

107

108

109

110

111

112

113

114

115

116

117

118

119

120

121

122

123

124

125

126

127

128

129

130

131

132

133

134

135

136

137

138

139

140

141

142

143

144

145

146

147

148

149

150

151

152

153

154

155

156

#include "caffe/common.hpp"

#include "caffe/syncedmem.hpp"

#include "caffe/util/math_functions.hpp"

namespace caffe {

SyncedMemory::~SyncedMemory() {

if (cpu_ptr_ && own_cpu_data_) {

CaffeFreeHost(cpu_ptr_, cpu_malloc_use_cuda_);

}

#ifndef CPU_ONLY

if (gpu_ptr_ && own_gpu_data_) {

int initial_device;

cudaGetDevice(&initial_device);

if (gpu_device_ != -1) {

CUDA_CHECK(cudaSetDevice(gpu_device_));

}

CUDA_CHECK(cudaFree(gpu_ptr_));

cudaSetDevice(initial_device);

}

#endif // CPU_ONLY

}

inline void SyncedMemory::to_cpu() {

switch (head_) {

case UNINITIALIZED:

CaffeMallocHost(&cpu_ptr_, size_, &cpu_malloc_use_cuda_);

caffe_memset(size_, 0, cpu_ptr_);

head_ = HEAD_AT_CPU;

own_cpu_data_ = true;

break;

case HEAD_AT_GPU:

#ifndef CPU_ONLY

if (cpu_ptr_ == NULL) {

CaffeMallocHost(&cpu_ptr_, size_, &cpu_malloc_use_cuda_);

own_cpu_data_ = true;

}

caffe_gpu_memcpy(size_, gpu_ptr_, cpu_ptr_);

head_ = SYNCED;

#else

NO_GPU;

#endif

break;

case HEAD_AT_CPU:

case SYNCED:

break;

}

inline void SyncedMemory::to_gpu() {

#ifndef CPU_ONLY

switch (head_) {

case UNINITIALIZED:

CUDA_CHECK(cudaGetDevice(&gpu_device_));

CUDA_CHECK(cudaMalloc(&gpu_ptr_, size_));

caffe_gpu_memset(size_, 0, gpu_ptr_);

head_ = HEAD_AT_GPU;

own_gpu_data_ = true;

break;

case HEAD_AT_CPU:

if (gpu_ptr_ == NULL) {

CUDA_CHECK(cudaGetDevice(&gpu_device_));

CUDA_CHECK(cudaMalloc(&gpu_ptr_, size_));

own_gpu_data_ = true;

}

caffe_gpu_memcpy(size_, cpu_ptr_, gpu_ptr_);

head_ = SYNCED;

break;

case HEAD_AT_GPU:

case SYNCED:

break;

}

#else

NO_GPU;

#endif

}

const void* SyncedMemory::cpu_data() {

to_cpu();

return (const void*)cpu_ptr_;

}

void SyncedMemory::set_cpu_data(void* data) {

CHECK(data);

if (own_cpu_data_) {

CaffeFreeHost(cpu_ptr_, cpu_malloc_use_cuda_);

}

cpu_ptr_ = data;

head_ = HEAD_AT_CPU;

own_cpu_data_ = false;

}

const void* SyncedMemory::gpu_data() {

#ifndef CPU_ONLY

to_gpu();

return (const void*)gpu_ptr_;

#else

NO_GPU;

return NULL;

#endif

}

void SyncedMemory::set_gpu_data(void* data) {

#ifndef CPU_ONLY

CHECK(data);

if (own_gpu_data_) {

int initial_device;

cudaGetDevice(&initial_device);

if (gpu_device_ != -1) {

CUDA_CHECK(cudaSetDevice(gpu_device_));

}

CUDA_CHECK(cudaFree(gpu_ptr_));

cudaSetDevice(initial_device);

}

gpu_ptr_ = data;

head_ = HEAD_AT_GPU;

own_gpu_data_ = false;

#else

NO_GPU;

#endif

}

void* SyncedMemory::mutable_cpu_data() {

to_cpu();

head_ = HEAD_AT_CPU;

return cpu_ptr_;

}

void* SyncedMemory::mutable_gpu_data() {

#ifndef CPU_ONLY

to_gpu();

head_ = HEAD_AT_GPU;

return gpu_ptr_;

#else

NO_GPU;

return NULL;

#endif

}

#ifndef CPU_ONLY

void SyncedMemory::async_gpu_push(const cudaStream_t& stream) {

CHECK(head_ == HEAD_AT_CPU);

if (gpu_ptr_ == NULL) {

CUDA_CHECK(cudaGetDevice(&gpu_device_));

CUDA_CHECK(cudaMalloc(&gpu_ptr_, size_));

own_gpu_data_ = true;

}

const cudaMemcpyKind put = cudaMemcpyHostToDevice;

CUDA_CHECK(cudaMemcpyAsync(gpu_ptr_, cpu_ptr_, size_, put, stream));

// Assume caller will synchronize on the stream before use

head_ = SYNCED;

}

#endif

} // namespace caffe

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Expand file tree

Search code, repositories, users, issues, pull requests...

FilesExpand file tree

syncedmem.cpp

Latest commit

History

syncedmem.cpp

File metadata and controls

Expand file tree