在Tensorflow的官方文档中,关于bfc_allocator的描述如下:
“bfc_allocator是一种分块分配器(buddy allocator),被用于处理大的Tensor对象和一些小的Tensor对象(大小小于256KB)。这个allocator会从更大的**区块(chunks)**中分配一部分来给单个Tensor对象使用。这在GPU上尤为重要:许多GPU设备遇到许多繁琐的并行内存分配问题。通过减少总的分配开销并防止碎片,bfc_allocator可以更好地管理内存。bfc_allocator跟踪可用内存的池,当对象被删除时将内存返回池中以供其他张量再次使用。可以使用的pool大小设置为可用的CPU内存总量的一定比例(目前默认为70%)。“
可以看到,在bfc_allocator中,MaxInUse实际上是记录当前使用的最大内存大小,即最大内存峰值。
#include "tensorflow/core/common_runtime/bfc_allocator.h"
#include "tensorflow/core/framework/allocator_registry.h"
#include "tensorflow/core/platform/test.h"
namespace tensorflow {
namespace {
TEST(BfcAllocatorTest, BasicTests) {
// Simple allocation.
Allocator* alloc = test::AsAllocator(new BFCAllocator(0));
int64 size = 16;
int64 alignment = 32;
int64 allocated_size;
void* ptr = alloc->AllocateRaw(size, alignment, &allocated_size);
bool freed;
EXPECT_TRUE(alloc->Owns(ptr));
freed = alloc->OwnsAndDeallocate(ptr);
EXPECT_EQ(freed, true);
}
} // namespace
} // namespace tensorflow
以上是Tensorflow中对bfc_allocator的一个简单测试代码,可以对bfc_allocator进行更深入的研究。