动态规划之状态压缩
动态规划之状态压缩摘录
========================
一、概述
1.状态压缩
状态压缩
就是使用某种方法,简明扼要地以最小代价来表示某种状态,通常是用一串01数字(二进制数)来表示各个点的状态。这就要求使用状态压缩的对象的点的状态必须只有两种,0 或 1;当然如果有三种状态用三进制来表示也未尝不可。
2.使用条件
从状态压缩的特点来看,这个算法适用的题目符合以下的条件:
解法需要保存一定的状态数据
(表示一种状态的一个数据值),每个状态数据通常情况下是可以通过2进制来表示的。这就要求状态数据的每个单元只有两种状态,比如说棋盘上的格子,放棋子或者不放,或者是硬币的正反两面。这样用0或者1来表示状态数据的每个单元,而整个状态数据就是一个一串0和1组成的二进制数
。- 解法需要将状态数据实现为一个基本数据类型,比如int,long等等,即所谓的状态压缩。状态压缩的目的一方面是
缩小了数据存储的空间
,另一方面是在状态对比和状态整体处理时能够提高效率
。这样就要求状态数据中的单元个数不能太大,比如用int来表示一个状态的时候,状态的单元个数不能超过32(32位的机器),所以题目一般都是至少有一维的数据范围很小。
3.状压DP
状压DP,顾名思义,就是使用状态压缩的动态规划。
动态规划问题通常有两种,一种是对递归问题的记忆化求解,另一种是把大问题看作是多阶段的决策求解。这里用的便是后一种,这带来一个需求,即存储之前的状态,再由状态及状态对应的值推演出状态转移方程最终得到最优解。
二、位运算
一般基础的状压就是将一行的状态压成一个数,这个数的二进制形式反映了这一行的情况。由于使用二进制数来保存被压缩的状态,所以要用到神奇的二进制位运算操作,将一个十进制数转成二进制进行位运算操作再转回十进制数。包括:
- 按位与&(有0为0,其实就是且)
- 按位或|(有1为1,其实就是或)
- 按位取反~(注意负数补码的符号,最前面的第一位是1)
- 异或^(相同为0,不同为1)
- 左移<<
- 右移>>
常见操作:
- 判断x是奇数还是偶数:(x&1)==0
- x乘以一个2的n次方的数:x<<n
- x除以一个2的n次方的数:x>>n
- 消去x最后一位的1:x&(x-1)
- 求x的相反数:
(x-1)或者x+1 - x的异或操作:~x = -x-1
- 把x从右边数第n位变1:x|(1<<(n-1))(n从1开始)
- 把x从右边数第n位变0:x&(~(1<<(n-1)))(n从1开始)
- 取x最后n位的值:x&((1<<n)-1)
- 取x前n位的值,后面的全部置为0:x & (~((1 << (32 - n)) - 1))
- 只保留x右边第一个1,其他的全部置为0:x & (-x) 或 x & ~(x - 1)
- 判断x的第n位是偶数还是奇数:(x & (1 << (n - 1))) == 0
- 求x的绝对值:(n ^ (n >> 31)) - (n >> 31) 或 (x >> 31) == 0 ? x : (~x + 1) 或 (x + (x >> 31)) ^ (x >> 31)
- 求两个数的最大数:(x & ((y - x) >> 31)) | (y & (~(y - x) >> 31))
- 返回x的符号:(i >> 31) | (-i >>> 31)(正数为1,负数为-1)
- 两数相加:(x | y) + (x & y) 或 (x ^ y) + ((x & y) << 1)
- 两数相减:(x &
y) - (x & y) - 求两数的平均数:(x & y) + ((x ^ y) >> 1) 或 (x + y) >> 1
- 判断一个数是不是2的次幂:(x != 0) && (x & (x - 1)) == 0
- x对2的n次方求余:x & (2^n - 1)(这里的^是幂的次方)
- 判断x和y的符号是否相同:(a ^ b) >= 0
- if(x == a) x = b; if(x == b) x = a:用异或运算符:x = a ^ b ^ x
初试化状态的时候要看清条件,什么要,什么不要。
一般情况下要预处理前k行(k由题目定)。
Dp时题目给的条件和fit函数、state数组都要检查。
最最重要的一点:
位反(~ ) > 算术 > 位左移、位右移 > 关系运算
>位与 > 位或 > 位异或 > 逻辑运算
所以一般位运算最好打括号。
三、例题引入
【例1】填满棋盘
有一个NM(N<=5,M<=1000)的棋盘,现在有12及2*1的小木块无数个,要盖满整个棋盘,有多少种方式?答案只需要mod1,000,000,007即可。
例如:对于一个22的棋盘,有两种方法,一种是使用2个12的,一种是使用2个2*1的。
【算法分析】
在这道题目中,N和M的范围本应该是一样的,但实际上,N和M的范围却差别甚远,对于这种题目,首先应该想到的就是,正确算法与这两个范围有关!N的范围特别小,因此可以考虑使用状态压缩动态规划的思想,请看下面的图:
本思路来自博客,不过原博没有图,我帮他补个图,再优化一下内容。
假设第一列已经填满,则第二列的摆设方式,只与第一列对第二列的影响有关。同理,第三列的摆设方式也只与第二列对它的影响有关。那么,使用一个长度为NN的二进制数statestate来表示这个影响,例如:4(00100)就表示了图上第二列的状态。
因此,本题的状态可以这样表示:
dp[i][state]表示该填充第 ii 列,第 i-1i−1 列对它的影响是 statestate 的时候的方法数。i<=M,0<=state<2^Ni<=M,0<=state<2
N
对于每一列,情况数也有很多,但由于 NN 很小,所以可以采取搜索的办法去处理。对于每一列,搜索所有可能的放木块的情况,并记录它对下一列的影响,之后更新状态。状态转移方程如下:
dp[i][state]=∑dp[i-1][pre] 每一个prepre可以通过填放成为statestate
对于每一列的深度优先搜索,写法如下:
1 |
|
最终,答案就是dp[M+1][0]。
完整代码
1 |
|
要注意多加几个括号,能加就加,以免因为位运算的优先级问题而导致出bug。
【例2】最小总代价(Vijos-1456)
题目描述:
n个人在做传递物品的游戏,编号为1-n。
游戏规则是这样的:开始时物品可以在任意一人手上,他可把物品传递给其他人中的任意一位;下一个人可以传递给未接过物品的任意一人。
即物品只能经过同一个人一次,而且每次传递过程都有一个代价;不同的人传给不同的人的代价值之间没有联系;
求当物品经过所有n个人后,整个过程的总代价是多少。
输入格式:
第一行为n,表示共有n个人(16>=n>=2);
以下为n*n的矩阵,第i+1行、第j列表示物品从编号为i的人传递到编号为j的人所花费的代价,特别的有第i+1行、第i列为-1(因为物品不能自己传给自己),其他数据均为正整数(<=10000)。
(对于50%的数据,n<=11)。
输出格式:
一个数,为最小的代价总和。
输入样例:
2
-1 9794
2724 –1
输出样例:
2724
【算法分析】
看到2<=n<=16,应想到此题和状态压缩dp有关。每个人只能够被传递一次,因此使用一个n位二进制数state来表示每个人是否已经被访问过了。但这还不够,因为从这样的状态中,并不能清楚地知道现在物品在谁 的手中,因此,需要在此基础上再增加一个状态now,表示物品在谁的手上。
dp[state][now]表示每个人是否被传递的状态是state,物品在now的手上的时候,最小的总代价。
初始状态为:dp[1<<i][i]=0;表示一开始物品在i手中。
所求状态为:min(dp[(1<<n)-1][j]); 0<=j<n
状态转移方程是:
dp[state][now]=min(dp[pre][t]+dist[now][t]);
pre表示的是能够到达state这个状态的一个状态,t能够传递物品给now且只有二进制下第t位与state不同。
状态的大小是O((2n)*n),转移复杂度是O(n)。总的时间复杂度是O((2n)nn)。
【代码实现】
1 |
|
【例3】胜利大逃亡(续)(Hdoj-1429)
题目描述:
Ignatius再次被魔王抓走了(搞不懂他咋这么讨魔王喜欢)……
这次魔王汲取了上次的教训,把Ignatius关在一个n*m的地牢里,并在地牢的某些地方安装了带锁的门,钥匙藏在地牢另外的某些地方。刚开始Ignatius被关在(sx,sy)的位置,离开地牢的门在(ex,ey)的位置。Ignatius每分钟只能从一个坐标走到相邻四个坐标中的其中一个。魔王每t分钟回地牢视察一次,若发现Ignatius不在原位置便把他拎回去。经过若干次的尝试,Ignatius已画出整个地牢的地图。现在请你帮他计算能否再次成功逃亡。只要在魔王下次视察之前走到出口就算离开地牢,如果魔王回来的时候刚好走到出口或还未到出口都算逃亡失败。
输入格式:
每组测试数据的第一行有三个整数n,m,t(2<=n,m<=20,t>0)。接下来的n行m列为地牢的地图,其中包括:
. 代表路
- 代表墙
@ 代表Ignatius的起始位置
^ 代表地牢的出口
A-J 代表带锁的门,对应的钥匙分别为a-j
a-j 代表钥匙,对应的门分别为A-J
每组测试数据之间有一个空行。
输出格式:
针对每组测试数据,如果可以成功逃亡,请输出需要多少分钟才能离开,如果不能则输出-1。
输入样例:
4 5 17
@A.B.
a*.*.
*..*^
c..b*
输出样例:
16
【算法分析】
初看此题感觉十分像是宽度优先搜索(BFS),但搜索的过程中如何表示钥匙的拥有情况,却是个问题。借鉴状态压缩的思想,使用一个10位的二进制数state来表示此刻对10把钥匙的拥有情况,那么,dp[x][y][state]表示到达(x,y),钥匙拥有状况为state的最短路径。另外,需要注意到一旦拥有了某一把钥匙,那个有门的位置就如履平地了。
代码的实现方式可以采用Spfa求最短路的方式。值得一提的是,Spfa算法本来就是一种求解最短路径问题的动态规划算法,本文假设读者已经非常熟悉Spfa等基础算法,在此处不再赘述。
状态压缩dp可以出现在各种算法中,本题就是典型的搜索算法和状态压缩dp算法结合的题目。另外,很多状态压缩dp本身就是通过搜索算法实现的状态转移。
【代码实现】
1 |
|
本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!