现在的位置: 首页 > 综合 > 正文

使用模板元编程操作类型集合（C++11下的TypeList）

2018年04月13日 ⁄ 综合 ⁄ 共 13473字 ⁄ 字号小中大 ⁄ 评论关闭

Wrote by mutouyun. (http://darkc.at/cxx-type-list/)

群里有个朋友要实现这么一个功能：如何在编译期把一个函数类型的参数减少一个。
简单来说，就是实现下面这个模板：

remove_func_par<2, void(int, long, short)>::type; // type = void(int, long)

根据输入的编译期整数，把函数参数表里对应的参数干掉一个。
为了实现这种功能，我们需要操作变参模板的参数包。比如像这样：

// make function's parameters from the types
 
template <typename R, typename TypesT>
struct make_func_par;
 
template <typename R, typename... P>
struct make_func_par<R, types<P...>>
{
    typedef R type(P...);
};
 
// remove function's parameter
 
template <size_t N, typename F>
struct remove_func_par;
 
template <size_t N, typename R, typename... P>
struct remove_func_par<N, R(P...)>
{
    using erase_pars_t = typename types_erase<types<P...>, N>::type;
    using type = typename make_func_par<R, erase_pars_t>::type type;
};

上面这段代码的思想很简单，把模板参数包的第N个参数删掉，然后再将它重新展开成函数的参数表。而types的定义可以非常简单：

template <typename...>
struct types {};

如果定义了一组对types类型做操作的算法，那么我们就可以把参数包放入types中，然后对它做这样那样的事情。。

看到这里，不知道有没有朋友想起来很久很久以前，Loki库里的TypeList。现代的C++当然不需要再像当年那样用外敷类和繁琐的宏来实现这个，使用变参模板加模板元就好了。

一、types的判断和大小计算

有了上面types的定义之后，下面需要实现一些算法来操作它。首先，在不涉及到容器的查找修改时，最基本的算法简单来说有下面几个：判断容器类型（因为容器是编译期的一个类型）、计算容器大小、判断容器是否是空的。下面我们来依次实现它们。

判断算法非常简单：

/*
    Is types
*/
 
template <typename TypesT>
struct is_types
     : std::false_type
{};
 
template <typename... T>
struct is_types<types<T...>>
     : std::true_type
{};

有了判断的算法之后，对于后面的运算就可以在编译时判断出传入的类型是否符合要求。我们可以定义一个专门用来判断类型合法性的模板：

// Check is types or not
 
template <typename TypesT>
struct check_is_types
{
    static_assert(is_types<TypesT>::value, "The template parameter is not a types-list!");
};

在需要的时候，继承check_is_types就好了。
接下来，是计算types的大小。在有了变参模板，以及针对模板参数包的sizeof运算符以后，这个工作也是非常简单的：

/*
    Return size
*/
 
template <typename TypesT>
struct types_size : std::integral_constant<int, 0>
                  , check_is_types<TypesT>
{};
 
template <typename... T>
struct types_size<types<T...>>
     : std::integral_constant<int, sizeof...(T)>
{};

通过继承check_is_types，types_size在传入参数不是一个types的时候，会在编译时报出错误提示。
有了计算types大小的工具，我们可以为后面的算法再准备两个编译时合法性判断的辅助类：

// Check is index valid or not
 
template <typename TypesT, int IndexN>
struct check_is_index_valid
{
    static_assert(IndexN >= 0,                        "Index is out of range!");
    static_assert(IndexN < types_size<TypesT>::value, "Index is out of range!");
};
 
// Check is count valid or not
 
template <typename TypesT, int CountN>
struct check_is_count_valid
{
    static_assert(CountN > 0,                          "Count is too small!");
    static_assert(CountN <= types_size<TypesT>::value, "Count is too large!");
};

check_is_index_valid用来判断传入的索引是否超出了指定types的范围；
check_is_count_valid用来判断传入的大小是否超出了指定types的大小。
和check_is_types一样，在需要的时候继承这两个类模板就可以了。

然后，是容器是否为空的判断：

/*
    Test whether types is empty
*/
 
template <typename TypesT>
struct types_empty : std::true_type
                   , check_is_types<TypesT>
{};
 
template <typename... T>
struct types_empty<types<T...>>
     : std::false_type
{};
 
template <>
struct types_empty<types<>>
     : std::true_type
{};

二、types的元素访问

types的访问算法就是根据传入的索引（index）定位类型。我们可以先写下types_at的定义：

template <typename TypesT, int IndexN>
struct types_at : check_is_index_valid<TypesT, IndexN>
{
    using type = TypesT;
};

接下来，是思考如何通过模板元的递归定位元素了。在数学里，最基本的定位方法就是数个数（是的，你没听错，就是数数）。模板元在递归的时候，每次可以去掉参数包中开头的第一个参数，同时我们让传入的index减1。当index为0的时候，对应的参数类型就是我们需要的类型了。算法实现可以像这样：

template <typename T1, typename... T, int N>
struct types_at<types<T1, T...>, N>
     : types_at<types<T...>, N - 1>
{};
 
template <typename T1, typename... T>
struct types_at<types<T1, T...>, 0>
{
    using type = T1;
};

上面的第一个types_at特化负责把参数包和index同时减1，并传入下一层；最后模板的递归会在第二个types_at特化处终结。
我们看到，这里并不需要一个types<>的特化。因为当传入的模板参数是types<>的时候，它不会匹配到任何一个特化，因此最初的types_at定义就可以搞定这种情况了。

有了types_at之后，我们可以很方便的实现front和back的定位算法：

/*
    Access first element
*/
 
template <typename TypesT>
struct types_front
{
    using type = types_at_t<TypesT, 0>;
};
 
/*
    Access last element
*/
 
template <typename TypesT>
struct types_back
{
    using type = types_at_t<TypesT, types_size<TypesT>::value - 1>;
};

三、types的连接（Link）和分配（Assign）

这两个算法都是用来把类型打包成types的。

首先我们来考虑类型的连接。需求很简单，传入两个类型，把它们连接成一个types。
当参数是普通类型时的算法很简单：

template <typename T, typename U>
struct types_link
{
    using type = types<T, U>;
};

当两个类型都是普通类型时，算法是显然的。那么当其中一个类型是一个types时，另一个类型应该被追加到那个types的尾部或头部：

template <typename... T, typename U>
struct types_link<types<T...>, U>
{
    using type = types<T..., U>;
};
 
template <typename T, typename... U>
struct types_link<T, types<U...>>
{
    using type = types<T, U...>;
};

假如两个类型都是types类型，那么需要把它们连接成一个types：

template <typename... T, typename... U>
struct types_link<types<T...>, types<U...>>
{
    using type = types<T..., U...>;
};

我们注意到，上面的link算法里考虑了当参数是types的情况。因此在做后面的其它算法时，通过使用这里的link，会把types内部的types展开。

下面是types的Assign算法。需求是，传入一个数字N和类型T，types_assign将构造一个由N个T组成的types。
有了上面的types_link以后，我们可以在模板递归中一次连接一个T，直到N减少到0为止。算法如下：

template <int N, typename T>
struct types_assign
{
    static_assert(N >= 0, "N cannot be less than 0!");
private:
    using tail = typename types_assign<N - 1, T>::type;
public:
    using type = typename types_link<T, tail>::type;
};
 
template <typename T>
struct types_assign<0, T>
{
    using type = types<>;
};

由于使用了types_link连接types，当我们这样写时：types_assign<2, types<int, long>>::type，将会得到：types<int, long, int, long>。

四、types的插入和删除

插入算法的需求如下：
给定一个types，传入索引index和类型T，需要把T插入到types的index处。根据这个需求，我们可以先写出types_insert的定义：

template <typename TypesT, int IndexN, typename T>
struct types_insert : check_is_types<TypesT>
                    , check_is_index_valid<TypesT, IndexN>
{
    using type = TypesT;
};

接下来考虑算法。插入算法其实只比数数多了一个步骤，那就是在数到需要的位置后，把T插到那个位置。那么我们可以先写上数数的算法：

template <typename T1, typename... T, int N, typename U>
struct types_insert<types<T1, T...>, N, U>
{
private:
    using tail = typename types_insert<types<T...>, N - 1, U>::type;
public:
    using type = typename types_link<T1, tail>::type;
};

每次递归，都将数出一个参数，并把剩下的继续向下传递。当所有的递归完成后，下一层的types_insert将返回一个已插入完毕的types，那么把这个types当做结尾，和T1连接在一起就好了。
关键的插入将在递归终结的时候完成：

template <typename T1, typename... T, typename U>
struct types_insert<types<T1, T...>, 0, U>
{
    using type = typename types_link<U, types<T1, T...>>::type;
};

待插入的类型U，被插入到types的索引0处，也就是最开始的位置。
这里需要特殊考虑一下types<>：

template <typename U>
struct types_insert<types<>, 0, U>
{
    using type = typename types_link<U, types<>>::type;
};

因为若不添加这个特化的话，types<>会被匹配到types_insert的定义上去，那么types<>将无法插入任何类型了。
可能有童鞋看到这里，觉得我们没必要把types<T1, T...>和types<>的特化分开写，直接这样就好了：

template <typename... T, typename U>
struct types_insert<types<T...>, 0, U>
{
    using type = typename types_link<U, types<T...>>::type;
};

看起来好像没问题，但实际上是不行的。这是因为<types<T...>, 0, U>和<types<T1, T...>, N, U>之间存在二义性。当模板递归到最后一层时，N将为0，此时若types大小大于1，这两个特化都可以被匹配到。
而<types<T1, T...>, 0, U>和<types<T1, T...>, N, U>之间则没有二义性。因为前面的特化版本是后面一个的特殊情况。

这里也说明了模板元编程时书写的一个原则：应该从最普遍的特化版本开始，逐一特殊化各种条件，直到最后的递归终结。
这种书写方法可以保证不会出现模板特化的二义性，只是和数学归纳法的思考方向相反。如果习惯于用数学归纳法之类的方式思考模板元递归算法的童鞋，可以先正着写出算法，再倒着看每个条件是否是逐步特殊化的。

下面我们思考删除算法。需求：
给定一个types，传入索引index和数量count，需要把types中从索引index处开始的count个元素删除。
首先，我们还是先写出定义：

template <typename TypesT, int IndexN, int CountN = 1>
struct types_erase : check_is_types<TypesT>
                   , check_is_index_valid<TypesT, IndexN>
{
    using type = TypesT;
};

同样的，删除算法也是在数到指定索引位置之后，将后面的元素删除掉。我们可以把count的需求放在一遍，先定位到需要删除的位置：

template <typename T1, typename... T, int N, int C>
struct types_erase<types<T1, T...>, N, C>
{
private:
    using tail = typename types_erase<types<T...>, N - 1, C>::type;
public:
    using type = typename types_link<T1, tail>::type;
};

和上面的插入一样，types_erase在递归后将返回一个处理完毕的types，之后把它和T1连起来就好了。
那么，当找到需要删除的索引时，我们自然是删掉它了。为了思考的简单，我们可以先考虑删除一个元素的算法：

template <typename T1, typename... T>
struct types_erase<types<T1, T...>, 0, 1>
{
    using type = types<T...>;
};

当数到需要删除的位置时，N一定是等于0的。这个时候若count为1，那么只需要去掉开头的T1就可以了。那么连续删除count个元素就可以这样写：

template <typename T1, typename... T, int C>
struct types_erase<types<T1, T...>, 0, C>
     : check_is_count_valid<types<T1, T...>, C>
{
    using type = typename types_erase<types<T...>, 0, C - 1>::type;
};

当count不为1时，删除开头的T1，将count减1后继续向下递归。当count为1后，将匹配到前一个模板。由于这里的count可能超出types的界限，因此需要用check_is_count_valid来检查count的有效性。
现在，我们回过头来检查一下，模板的特化条件是否是逐渐收窄的：

<types<T1, T...>, N, C>
<types<T1, T...>, 0, C>
<types<T1, T...>, 0, 1>

那么是否所有的情况都考虑到了呢？通过枚举出所有的特化条件，我们发现只有types<>没有考虑。对于types_erase来说，types<>没有删除的意义，因此直接让它匹配到types_erase的定义就可以了。当然，这会引起一个编译期的static_assert，因为任何的index都将超出types<>的范围。

五、types的查找，以及其它算法

查找算法的需求如下：
给定一个types和类型T，需要在types中找到T所在的第一个索引位置。
首先，我们先写出定义：

template <typename TypesT, typename T>
struct types_find : std::integral_constant<int, -1>
                  , check_is_types<TypesT>
{};

接着，我们用数学归纳法的方式来思考：
当types中的第一个元素为T时，索引位置为0；（终结条件）
当types中的第N个元素为T时，索引位置为上一个元素的索引加1。

那么我们可以先列出需要特化的版本：

<types<T1, T...>, T1>
<types<T1, T...>, U>

接下来，先特化终结条件：

template <typename T1, typename... T>
struct types_find<types<T1, T...>, T1>
     : std::integral_constant<int, 0>
{};

然后思考一般情况：索引位置为上一个元素的索引加1，说明我们需要做一个加法。而find的结果有两种：找到了，和没找到。当没找到的时候，模板最终会匹配到types_find的定义上去。而我们在定义里给出的value是-1。因此在做加法运算时，需要把-1的情况忽略掉：

template <typename T1, typename... T, typename U>
struct types_find<types<T1, T...>, U>
     : std::integral_constant<int, 
                             (types_find<types<T...>, U>::value == -1 ? -1 :
                              types_find<types<T...>, U>::value + 1)>
{};

有了查找算法以后，判断types中是否存在某个类型就非常简单了：

template <typename TypesT, typename T>
struct types_exist
     : std::integral_constant<bool, (types_find<TypesT, T>::value != -1)>
{};

接下来，让我们思考一个一般化的算法：
逐个遍历给定types中的元素，当该元素满足某个条件时，对这个元素做某件事情。
我们可以把定义写成下面这样：

template <typename TypesT,
template <typename, typename> class If_, typename V,
template <bool, typename, typename> class Do_, typename U>
struct types_do_if : check_is_types<TypesT>
{
    using type = TypesT;
};

If_用来把types中的某个类型T1，和给定的V做判断；Do_将接受If_的判断结果，对T1和U一起做某件事（比如置换）。
上面这句话说出来可能有点绕口，实际上写成代码并不复杂：

using done = typename Do_<If_<T1, V>::value, U, T1>::type;

我们从这里可以得到处理后的结果类型done。那么一般化的算法就是把done和剩下的（T1以外的）元素连起来。需要注意的是，处理是递归的，因此最后写出来应该是这个样子：

template <typename T1, typename... T,
template <typename, typename> class If_, typename V,
template <bool, typename, typename> class Do_, typename U>
struct types_do_if<types<T1, T...>, If_, V, Do_, U>
{
private:
    using tail = typename types_do_if<types<T...>, If_, V, Do_, U>::type;
    using done = typename Do_<If_<T1, V>::value, U, T1>::type;
public:
    using type = typename types_link<done, tail>::type;
};

费这么大劲写这个一般化的算法有什么用呢？下面我们来看看它的威力。

首先，是types的置换算法：
给定一个types，以及类型T，U；要求把所有types中的T都换成U。
有了上面的types_do_if，实现这个算法非常轻松：

template <typename TypesT, typename T, typename U>
struct types_replace
     : types_do_if<TypesT, std::is_same, T, std::conditional, U>
{};

当在types中找到类型T的时候，就把它变成U。代码和语言描述基本是一致的。

接下来，考虑一个移除的算法：
给定一个types，和类型T，要求从types中移除所有的T。
通过types_do_if实现如下：

template <typename TypesT, typename T>
struct types_remove
     : types_do_if<TypesT, std::is_same, T, std::conditional, types<>>
{};

我们可以看到，上面std::conditional后面的类型是types<>。原因是types_do_if里使用types_link连接结果。那么直接给定一个空的types，它和类型U连接后的结果仍然是U。
看到这里，我们其实可以写得更简单点：

template <typename TypesT, typename T>
struct types_remove
     : types_replace<TypesT, T, types<>>
{};

使用types<>置换掉types里的T，结果和移除是一样的。
这里再思考一步：如果需要移除的类型T本身，也是一个types列表，那么我们可以批量移除掉多个类型。实现算法其实很简单：

template <typename TypesT, typename U1, typename... U>
struct types_remove<TypesT, types<U1, U...>>
{
private:
    using rm_t = typename types_remove<TypesT, U1>::type;
public:
    using type = typename types_remove<rm_t, types<U...>>::type;
};

从types<U1, U...>中取出一个元素做types_remove，把结果和剩下的types<U...>放到递归里就可以了。

通过types_do_if还可以实现很多特殊操作，在这里就不再展开了。
接下来，我们实现types的“压缩”算法。当types里有多个重复元素的时候，如何把重复的内容剔除掉，只保留一个呢？
同样的，我们先写出定义：

template <typename TypesT>
struct types_compact : check_is_types<TypesT>
{
    using type = TypesT;
};

如何判断内容有重复？其实很简单，当我们从types中取出一个元素T1，那么剩下的内容里，所有的T1都将是重复的，删掉就可以了。
算法写出来就是这样：

template <typename T1, typename... T>
struct types_compact<types<T1, T...>>
{
private:
    using rm_t = typename types_remove<types<T...>, T1>::type;
    using tail = typename types_compact<rm_t>::type;
public:
    using type = typename types_link<T1, tail>::type;
};

最后，一个特殊且有用的算法是倒序（reverse），即把types中的元素倒过来。实现如下：

template <class TypesT>
struct types_reverse : check_is_types<TypesT>
{
    using type = TypesT;
};
 
template <typename T1, typename... T>
struct types_reverse<types<T1, T...>>
{
private:
    using head = typename types_reverse<types<T...>>::type;
public:
    using type = typename types_link<head, T1>::type;
};

每次取出第一个元素，然后把它放到最后面即可。

六、types的排序

在编译期排序和运行期其实并没什么不同，只是算法的选择上需要考虑一下。假设是从大到小排列，那么最直观的想法是每次递归都从types中找到最大的元素，然后把它放到头上去。这样递归完毕后整个types就是有序的了。
这种想法其实就是选择排序（Selection sort）。
当然，我们也可以实现插入，或者快排。如果读者感兴趣的话，可以自己实现一下。

使用选择排序，首先需要能从types中找到放在最前面的那个元素。在这里我们不使用现成的比较算法，而写成可以让外部指定比较算法。那么select的算法定义如下：

template <typename TypesT,
template <typename, typename> class If_>
struct types_select_if : check_is_types<TypesT>
{
    using type = TypesT;
};

我们先用数学归纳法思考下算法：
当types中只有1个元素T1时，直接返回T1；（终结条件）
当types中有1个元素以上时，先得到T1以外的其它元素的select结果（S），然后将T1和S一起放入If_中。若If_为true，那么选择T1，否则选择S。

同样，先列出特化条件：

<types<T1>, If_>
<types<T1, T...>, If_>

然后是它们的实现：

template <typename T1,
template <typename, typename> class If_>
struct types_select_if<types<T1>, If_>
{
    using type = T1;
};
 
template <typename T1, typename... T,
template <typename, typename> class If_>
struct types_select_if<types<T1, T...>, If_>
{
private:
    using select_t = typename types_select_if<types<T...>, If_>::type;
public:
    using type = typename std::conditional<If_<T1, select_t>::value, T1, select_t>::type;
};

可以看到，代码和前面归纳法的描述是一致的。
接下来，是排序的实现。首先是定义：

template <class TypesT,
template <typename, typename> class If_>
struct types_sort_if : check_is_types<TypesT>
{
    using type = TypesT;
};

和上面一样，先用数学归纳法思考下：
当types中只有1个元素T1时，直接返回types<T1>；（终结条件）
当types中有1个元素以上时，先得到types的select结果（S），之后从types中删除S，然后对结果递归运算，最后把S连接到头部。

列出特化条件：

<types<T1>, If_>
<types<T1, T...>, If_>

最后是实现：

template <typename T1,
template <typename, typename> class If_>
struct types_sort_if<types<T1>, If_>
{
    using type = types<T1>;
};
 
template <typename T1, typename... T,
template <typename, typename> class If_>
struct types_sort_if<types<T1, T...>, If_>
{
private:
    using types_t = types<T1, T...>;
    using sl_t = typename types_select_if<types_t, If_>::type;
    using er_t = typename types_erase<types_t, types_find<types_t, sl_t>::value>::type;
    using tail = typename types_sort_if<er_t, If_>::type;
public:
    using type = typename types_link<sl_t, tail>::type;
};

我们来看看排序的效果：

using types_t = types<short, int, unsigned char, long long, float&, const double, long*>;
 
template <typename T, typename U>
struct is_large
     : std::integral_constant<bool, (sizeof(T) > sizeof(U))>
{};
 
using sort_t = types_sort_if<types_t, is_large>::type;
// sort_t = types<double const, long long, long*, float&, int, short, unsigned char>

尾声

实际项目中，我们往往不会像这样写这么多模板元的代码。如果有类似需求，可能会考虑直接使用Boost.MPL，或者在Loki.TypeList的基础上加一层变参模板的外敷。

自己完整的实现一次模板元的容器操作算法的意义，在于可以大大加深对模板元编程，以及对变参模板的理解。
有了这些经验之后，在不方便使用第三方库时，能够快速自撸一些简单且可靠的模板元算法，来完成一些编译期计算的需求；同时也可以帮助我们更清晰的理解和分析一些C++模板库（STL、Boost之类）里的泛型算法。

另外，目前的std::tuple的实现方式其实是类似上面的types的。比如gnuc的libstdc++里的定义：

// Forward declarations.
template<typename...>
class tuple;

而目前stl里对std::tuple的编译期操作很简单，只有std::tuple_size和std::tuple_element两种。如果想增加std::tuple的编译期运算功能，也可以自行采用上面类似的算法做拓展。

完整代码及测试下载请点击：types

Wrote by mutouyun. (http://darkc.at/cxx-type-list/)

【上篇】为什么直接杀死线程是不好的
【下篇】一段tricky code

作者: Unnfrkim

该日志由 Unnfrkim 于6年前发表在综合分类下，最后更新于 2018年04月13日.
转载请注明: 使用模板元编程操作类型集合（C++11下的TypeList） | 学步园 +复制链接

抱歉!评论已关闭.

学步园