母函数(Generating function)详解
在数学中,某个序列的母函数是一种形式幂级数,其每一项的系数可以提供关于这个序列的信息。使用母函数解决问题的方法称为母函数方法。
母函数可分为很多种,包括普通母函数、指数母函数、L级数、贝尔级数和狄利克雷级数。对每个序列都可以写出以上每个类型的一个母函数。构造母函数的目的一般是为了解决某个特定的问题,因此选用何种母函数视乎序列本身的特性和问题的类型。
这里先给出两句话,不懂的可以等看完这篇文章再回过头来看:
"把组合问题的加法法则和幂级数的t的乘幂的相加对应起来"
"母函数的思想很简单—就是把离散数列和幂级数一一对应起来,把离散数列间的相互结合关系对应成为幂级数间的运算关系,最后由幂级数形式来确定离散数列的构造. "
我们首先来看下这个多项式乘法:
由此可以看出:
1. x的系数是a1,a2,…an的单个组合的全体。
2. x2的系数是a1,a2,…an的两个组合的全体。
………
n. xn的系数是a1,a2,….an的n个组合的全体(只有1个)。
由此得到:
母函数的定义:
对于序列a0,a1,a2,…构造一函数:
称函数G(x)是序列a0,a1,a2,…的母函数
这里先给出2个例子,等会再结合题目分析:
第一种:
有1克、2克、3克、4克的砝码各一枚,能称出哪几种重量?每种重量各有几种可能方案?
考虑用母函数来接吻这个问题:
我们假设x表示砝码,x的指数表示砝码的重量,这样:
1个1克的砝码可以用函数1+x表示,
1个2克的砝码可以用函数1+x2表示,
1个3克的砝码可以用函数1+x3表示,
1个4克的砝码可以用函数1+x4表示,
上面这四个式子懂吗?
我们拿1+x2来说,前面已经说过,x表示砝码,x的指数表示重量,即这里就是一个质量为2的砝码,那么前面的1表示什么?1代表重量为2的砝码数量为0个。(理解!)
不知道大家理解没,我们这里结合前面那句话:
"把组合问题的加法法则和幂级数的t的乘幂的相加对应起来"
1+x2表示了两种情况:1表示质量为2的砝码取0个的情况,x2表示质量为2的砝码取1个的情况。
这里说下各项系数的意义:
在x前面的系数a表示相应质量的砝码取a个,而1就表示相应砝码取0个,这里可不能简单的认为相应砝码取0个就该是0*x2(想下为何?结合数学式子)。
所以,前面说的那句话的意义大家可以理解了吧?
几种砝码的组合可以称重的情况,可以用以上几个函数的乘积表示:
(1+x)(1+x2)(1+x3)(1+x4)
=(1+x+x2+x3)(1+x3+x4+x7)
=1+x+x2+2x3+2x4+2x5+2x6+2x7+x8+x9+x10
从上面的函数知道:可称出从1克到10克,系数便是方案数。(!!!经典!!!)
例如右端有2x5 项,即称出5克的方案有2:5=3+2=4+1;同样,6=1+2+3=4+2;10=1+2+3+4。
故称出6克的方案有2,称出10克的方案有1。
接着上面,接下来是第二种情况:
求用1分、2分、3分的邮票贴出不同数值的方案数:
大家把这种情况和第一种比较有何区别?第一种每种是一个,而这里每种是无限的。
以展开后的x4为例,其系数为4,即4拆分成1、2、3之和的拆分数为4;
即 :4=1+1+1+1=1+1+2=1+3=2+2
这里再引出两个概念整数拆分和拆分数:
所谓整数拆分即把整数分解成若干整数的和(相当于把n个无区别的球放到n个无标志的盒子,盒子允许空,也允许放多于一个球)。
整数拆分成若干整数的和,办法不一,不同拆分法的总数叫做拆分数。
现在以上面的第二种情况每种种类个数无限为例,给出模板:
- #include<iostream>
- usingnamespace std;
- constint _max = 10001;
- //c1是保存各项质量砝码可以组合的数目
- //c2是中间量,保存没一次的情况
- intc1[_max], c2[_max];
- intmain()
- { //int n,i,j,k;
- int nNum; //
- int i, j, k;
- while(cin >> nNum)
- {
- for(i=0; i<=nNum; ++i) // ---- ① ,(1+x+x^2...)
- {
- c1[i] = 1;
- c2[i] = 0;
- }
-
for(i=2; i<=nNum; ++i) // ----- ②
(第i个括号) - {
-
for(j=0; j<=nNum; ++j) // ----- ③
(计算第i个括号与前面的乘积) -
for(k=0; k+j<=nNum; k+=i) // ---- ④
//大于nNum没有意义,即超过X^(nNum)没意义 - {
- c2[j+k] += c1[j];
- }
-
for(j=0; j<=nNum; ++j) // ---- ⑤
//把乘积保存下来,因为这是一个连乘 - {
- c1[j] = c2[j];
- c2[j] = 0;
- }
- }
- cout << c1[nNum] << endl;
- }
- return 0;
- }
跑了一个nNum = 4的结果:
当nNum = 4时,其实我们要计算这么一个多项式:
G(x)=(1+x+x^2+x^3+x^4)(1+x^2+x^4)(1+x^3)(1+x^4)
i = 2时:计算了(1+x+x^2+x^3+x^4)(1+x^2+x^4),并把结果存在C2中;
乘法他这么做的:1*(1+x^2+x^4)+x*(1+x^2+x^4)+x^2*(1+x^2+x^4)...
假如:(1+x^2)(1+x^2+x^4)=1*(1+x^2+x^4)+0*x*(1+x^2+x^4)+1*x^2*(1+x^2+x^4) (就是没有系数也乘了,只不过乘以后的结果为0,累加的时候,加的0)
i = 3时:计算了(1+x+x^2+x^3+x^4)(1+x^2+x^4)(1+x^3),并把结果存在C2中,当然(1+x+x^2+x^3+x^4)(1+x^2+x^4)这个结果在i=2时已经算出来了;
i = 4时:就可以计算整个表达式的结果了。
我们来解释下上面标志的各个地方:
① 、首先对c1初始化,由第一个表达式(1+x+x2+..xn)初始化,把质量从0到n的所有砝码都初始化为1.
② 、 i从2到n遍历,这里i就是指第i个表达式,上面给出的第二种母函数关系式里,每一个括号括起来的就是一个表达式。
③、j 从0到n遍历,这里j就是只一个表达式里第j个变量,比如在第二个表达式里:(1+x2+x4....)里,第j个就是x2*j.
③ k表示的是第j个指数,所以k每次增i(因为第i个表达式的增量是i)。
④ 、把c2的值赋给c1,而把c2初始化为0,因为c2每次是从一个表达式中开始的
咱们赶快趁热打铁,来几道题目:
(相应题目解析均在相应的代码里分析)
1. 题目:http://acm.hdu.edu.cn/showproblem.php?pid=1028
代码:http://www.wutianqi.com/?p=587
这题大家看看简单不?把上面的模板理解了,这题就是小Case!
看看这题:
2. 题目:http://acm.hdu.edu.cn/showproblem.php?pid=1398
代码:http://www.wutianqi.com/?p=590
要说和前一题的区别,就只需要改2个地方。 在i遍历表达式时(可以参考我的资料---《母函数详解》),把i<=nNum改成了i*i<=nNum,其次在k遍历指数时把k+=i变成了k+=i*i; Ok,说来说去还是套模板~~~
3. 题目:http://acm.hdu.edu.cn/showproblem.php?pid=1085
代码:http://www.wutianqi.com/?p=592
这题终于变化了一点,但是万变不离其中。
大家好好分析下,结合代码就会懂了。
4. 题目:http://acm.hdu.edu.cn/showproblem.php?pid=1171
代码:http://www.wutianqi.com/?p=594
还有一些题目,大家有时间自己做做:
HDOJ:1709,1028、1709、1085、1171、1398、2069、2152
附:
1.在维基百科里讲到了普通母函數、指數母函數、L級數、貝爾級數和狄利克雷級數:
http://zh.wikipedia.org/zh-tw/%E6%AF%8D%E5%87%BD%E6%95%B0
2.Matrix67大牛那有篇文章:什么是生成函数:
http://www.matrix67.com/blog/archives/120
3.大家可以看看杭电的ACM课件的母函数那篇,我这里的图片以及一些内容都引至那。
4、将一个较大的钱,不超过1000000(10^6)的人民币,兑换成数量不限的100、50、10、5、2、1的组合,请问共有多少种组合呢?(完全背包)(其它选择题考的是有关:操作系统、树、概率题、最大生成树有关的题,另外听老梦说,谷歌不给人霸笔的机会。)。
第一种方法(母函数):
- #define NUM 7
- int money[NUM] = {1, 2, 5, 10, 20, 50, 100};
- // 母函数解法
- int NumOfCoins(int value)
- {
- int i , j , k , c1[1010] , c2[1010];
- for(i = 0 ; i <= value ; ++i)
- {
- c1[i] = 1;
- c2[i] = 0;
- }
- //第一层循环是一共有 n 个小括号,而刚才已经算过一个了
- // i 就是代表的母函数中第几个大括号中的表达式
- for(i = 1 ; i < NUM ; ++i)
- {
- for(j = 0 ; j <= value ; ++j) //j 就是指的已经计算出的各项的系数
- {
- for(k = 0 ; k+j <= value ; k += money[i]) //k 就是指将要计算的那个括号中的项
- c2[k+j] += c1[j];
- }
- for(j = 0 ; j <= value ; ++j) // 刷新一下数据,继续下一次计算,就是下一个括号里面的每一项
- {
- c1[j] = c2[j];
- c2[j] = 0;
- }
- }
- return c1[value];
- }
第二种方法(动态规划):
我们可以将它形式化为:
硬搜的话肯定是可以出结果的,但时间复杂度太高。
第一种方法:
设 F[n] 为用那么多种面值组成 n 的方法个数。则 F[n] 可以分成这样互不重复的几个部分:
只用 50 及以下的面值构成 [n] + 0 张 100
只用 50 及以下的面值构成 [n-100] + 1 张 100
只用 50 及以下的面值构成 [n-200] + 2 张 100
……
也就是说,按 F[n] 的组成方案中 100 的张数,将 F[n] 划分成若干等价类,等价类的划分要不重复、不遗漏。这些等价类恰好完整覆盖了 F[n] 的所有情况。
然后对于 50 及以下的方案又可以按 50 的张数划分等价类。于是像这样一层一层递归下去……就可以得到结果了。
把上面的递归过程反过来,从下往上递推,这就是动态规划了。代码(用到了一些 C99 特性,比如栈上的可变长数组):
时间复杂度 < O(N^2)
- #define NUM 7
- int money[NUM] = {1, 2, 5, 10, 20, 50, 100};
- // 动态规划解法
- int NumOfCoins(int value)
- {
- int i , j , t , dp[7][1010];
- for(i = 0 ; i <= value ; ++i) //用第0张,即面值为1元的都只有一种
- dp[0][i] = 1;
- for(i = 1 ; i < NUM ; ++i)
- {
- for(j = 0 ; j <= value ; ++j)
- {
- t = j;
- dp[i][j] = 0;
- while(t >= 0)
- {
-
dp[i][j] += dp[i-1][t];
//这里必须是d[i-1][j],此时就不包含j -
t -= money[i];
//减一次表示用了一张money[i] - }
- }
- }
- return dp[6][value];
- }
其中 dp[i][j] 表示只用第 i 张面值及以下构成 j 用多少种方法。
改进如下:
a[6][n] = ar[6][n-100] // 至少包含 1 张 100 的拆分个数
+ ar[5][n] // 不包含 100 的拆分个数
直接把时间复杂度从 O(n^2) 降到了 O(n):
- #define NUM 7
- int money[NUM] = {1, 2, 5, 10, 20, 50, 100};
- // 动态规划解法(完全背包)
- int NumOfCoins(int value)
- {
- int i , j , dp[7][1010];
-
for(i = 0 ; i <= value ; ++i)
//用第0张,即面值为1元的都只有一种 - dp[0][i] = 1;
- for(i = 1 ; i < NUM ; ++i)
- {
- for(j = 0 ; j <= value ; ++j)
- {
-
if(j >= money[i])
//i表示当前的物品算进去;i-1表示当前的物品没有算进去 - dp[i][j] = dp[i][j - money[i]] + dp[i - 1][j];
- else
- dp[i][j] = dp[i-1][j];
- }
- }
- return dp[6][value];
- }
或者使用滚动数组也是可以的
- #define NUM 7
- int money[NUM] = {1, 2, 5, 10, 20, 50, 100};
- int f[1010] , bf[1010];
- // f[j] == f[i][j] bf[j] == bf[i-1][j]
- int NumofCoin2(int value)
- {
- int i , j;
- for(j = 0 ; j <= value ; ++j)
- f[j] = 0 , bf[j] = 0;
- bf[0] = 1;
- for(i = 0 ; i < NUM ; ++i)
- {
- for(j = 0 ; j <= value ; ++j)
- {
- if(j >= money[i])
- f[j] = f[j-money[i]] + bf[j];
- else
- f[j] = bf[j] ;
- }
- for(j = 0; j <= value ; ++j)
- bf[j] = f[j] , f[j] = 0;
- }
- return bf[value];
-
}