void func()
{
X* pX = new X[10];
}
代替 new 在 内存池 里 获取 结构数组:
X* pX = static_cast<X*> (X10_pool::malloc());
}
失败的boost::object_pool :
boost::object_pool绝对是一个超失败的设计!该内存池模块,基于sss(simple segregated storage),以32为长为block大小,成倍增长,本来挺好的设计思想,利用了chunks空间存free list既节省了overhead空间又节省free list空间,还包装了对象构造和析构,但就是毁在了它的释放操作。真是不看代码不知道,一看吓一跳,它的释放效率居然是O(N),原因在于它的free list不同于boost::pool的free list,它的free list是有序的,我理解设计者的目的,因为有序的free list可以保证在最终垃圾回收时的效率保持在O(N)(否则是O(N*N)),但设计者难道不知道释放chunk的使用频率远远大于最终回收时的一次吗?鬼才会使它呢,真是失败中的失败。。。遗憾啊
补救的方法一个是使pool代替(但这样就会丧失面向对象操作的遍历,比如需要自己调用构造析构等),或者自己写一个object_pool的版本。
PS:顺便搜了一下,拍的人还不少,http://lists.boost.org/boost-users/2007/03/25888.php
boost内存池详细说明:http://www.cppblog.com/CppExplore/archive/2009/04/04/42986.html
boost 内存池:
Pool分配是一种分配内存方法,用于快速分配同样大小的内存块,
尤其是反复分配/释放同样大小的内存块的情况。
1. pool
快速分配小块内存,如果pool无法提供小块内存给用户,返回0。
Example:
pool的析构函数会释放所有从系统申请到的内存。
2. object_pool
与pool的区别在于:pool需要指定每次分配的块的大小,object_pool需要指定
每次分配的对象的类型。
Example:
void func()
{
boost::object_pool<X> p;
^
for (int i = 0; i < 10000; ++i)
{
X * const t = p.malloc();
注意;X的构造函数不会被调用,仅仅是分配大小为sizeof(X)
的内存块。如果需要调用构造函数(像new一样),应该调用
construct。比如:
X * const t = p.construct();
...
}
}
3. singleton_pool
与pool用法一样。不同的是:可以定义多个pool类型的object,都是分配同样
大小的内存块;singleton_pool提供静态成员方法分配内存,不用定义object。
Example:
typedef boost::singleton_pool<MyPoolTag, sizeof(int)> my_pool;
void func()
{
for (int i = 0; i < 10000; ++i)
{
int * const t = my_pool::malloc();
// ^^^^^^^^^
// 和pool不一样。
...
}
my_pool::purge_memory();
// 释放my_pool申请的内存。
}
4. pool_alloc
基于singleton_pool实现,提供allocator(用于STL等)。
Example:
需要的话,必须自己显式地调用
boost::singleton_pool<boost::pool_allocator_tag, sizeof(int)>::release_memory()
把allocator分配的内存返回系统。
实现原理
pool每次向系统申请一大块内存,然后分成同样大小的多个小块,
形成链表连接起来。每次分配的时候,从链表中取出头上一块,提
供给用户。链表为空的时候,pool继续向系统申请大块内存。
一个小问题:在pool的实现中,在申请到大块内存后,马上把它分
成小块形成链表。这个过程开销比较大。即你需要分配一小块内存
时,却需要生成一个大的链表。用如下代码测试:
for(i = 0; i < NPASS; i++) {
period = clock();
for(n = 0; n < NITEM; n++) {
array_ptr[n] = (int *)mem_pool.malloc();
}
for(n = 0; n < NITEM; n++) {
mem_pool.free(array_ptr[n]);
}
period = clock() - period;
printf("pool<> : period = %5d ms ", period);
}
可以发现,第一遍花的时间明显多于后面的。
而且在pool的使用过程中如果不是恰好把链表中所有的小块都用上
的话,在链表中最后的一些小块会始终用不上。把这些小块加入链
表是多余的。虽然这个开销可能很小:)