Các phép toán tập hợp nhị phân
一个数的二进制表示可以看作是一个集合(\(0\) 表示不在集合中,\(1\) 表示在集合中).比如集合 \(\{1,3,4,8\}\),可以表示成 \((100011010)_2\).而对应的位运算也就可以看作是对集合进行的操作.
| 操作 | 集合表示 | 位运算表示 |
|---|---|---|
| 交集 | \(a \cap b\) | \(a \operatorname{AND} b\) |
| 并集 | \(a \cup b\) | \(a \operatorname{OR} b\) |
| 补集 | \(\bar{a}\) | \(\operatorname{NOT} a\)(全集为二进制都是 1) |
| 差集 | \(a \setminus b\) | \(a \operatorname{AND} \operatorname{NOT} b\) |
| 对称差 | \(a\triangle b\) | \(a \operatorname{XOR} b\) |
在进一步介绍集合的子集遍历操作之前,先看位运算的有关应用例子.
模 2 的幂
一个数对 \(2\) 的非负整数次幂取模,等价于取二进制下一个数的后若干位,等价于和 \(mod-1\) 进行与操作.
1 | |
1 2 | |
于是可以知道,\(2\) 的非负整数次幂对它本身取模,结果为 \(0\),即如果 \(n\) 是 \(2\) 的非负整数次幂,\(n\) 和 \(n-1\) 的与操作结果为 \(0\).
事实上,对于一个正整数 \(n\),\(n-1\) 会将 \(n\) 的最低 \(1\) 位置零,并将后续位数全部置 \(1\).因此,\(n\) 和 \(n-1\) 的与操作等价于删掉 \(n\) 的最低 \(1\) 位.
借此可以判断一个数是不是 \(2\) 的非负整数次幂.当且仅当 \(n\) 的二进制表示只有一个 \(1\) 时,\(n\) 为 \(2\) 的非负整数次幂.
1 | |
1 2 | |
子集遍历
遍历一个二进制数表示的集合的全部子集,等价于枚举二进制数对应掩码的所有子掩码.
掩码是一串二进制码,用于和源码进行与运算,得到屏蔽源码的若干输入位后的新操作数.
掩码对于源码可以起到遮罩的作用,掩码中的 \(1\) 位意味着源码的相应位得到保留,掩码中的 \(0\) 位意味着源码的相应位进行置 \(0\) 操作.将掩码的若干 \(1\) 位改为 \(0\) 位可以得到掩码的子掩码,掩码本身也是自己的子掩码.
给定一个掩码 \(m\),希望有效迭代 \(m\) 的所有子掩码 \(s\),可以考虑基于位运算技巧的实现.
1 2 3 4 5 6 | |
或者使用更紧凑的 for 语句:
1 2 3 | |
这两段代码都不会处理等于 \(0\) 的子掩码,要想处理等于 \(0\) 的子掩码可以使用其他办法,例如:
1 2 3 4 5 | |
接下来证明,上面的代码访问了所有 \(m\) 的子掩码,没有重复,并且按降序排列.
假设有一个当前位掩码 \(s\),并且想继续访问下一个位掩码.在掩码 \(s\) 中减去 \(1\),等价于删除掩码 \(s\) 中最右边的设置位,并将其右边的所有位变为 \(1\).
为了使 \(s-1\) 变为新的子掩码,需要删除掩码 \(m\) 中未包含的所有额外的 \(1\) 位,可以使用位运算 (s - 1) & m 来进行此移除.
这两步操作等价于切割掩码 \(s-1\),以确定算术上可以取到的最大值,即按降序排列的 \(s\) 之后的下一个子掩码.
因此,该算法按降序生成该掩码的所有子掩码,每次迭代仅执行两个操作.
特殊情况是 \(s=0\).在执行 \(s-1\) 之后得到 \(-1\),其中所有位都为 \(1\).在 (s - 1) & m 操作之后将得到新的 \(s\) 等于 \(m\).因此,如果循环不以 \(s=0\) 结束,算法的循环将无法终止.
使用 \(\text{popcount}(m)\) 表示 \(m\) 二进制中 \(1\) 的个数,用这种方法可以在 \(O(2^{\text{popcount}(m)})\) 的时间复杂度内遍历集合 \(m\) 的子集.
遍历所有掩码的子掩码
在使用状压 DP 的问题中,有时会希望对于每个掩码,遍历掩码的所有子掩码:
1 2 3 4 | |
这样做可以遍历大小为 \(n\) 的集合的每个子集的子集.
接下来证明,该操作的时间复杂度为 \(O(3^n)\),\(n\) 为掩码总共的位数,即集合中元素的总数.
考虑第 \(i\) 位,即集合中第 \(i\) 个元素,有三种情况:
- 在掩码 \(m\) 中为 \(0\),因此在子掩码 \(s\) 中为 \(0\),即元素不在大小子集中.
- 在 \(m\) 中为 \(1\),但在 \(s\) 中为 \(0\),即元素只在大子集中,不在小子集中.
- 在 \(m\) 和 \(s\) 中均为 \(1\),即元素同时在大小子集中.
总共有 \(n\) 位,因此有 \(3^n\) 个不同的组合.
还有一种证明方法是:
如果掩码 \(m\) 具有 \(k\) 个 \(1\),那么它有 \(2^k\) 个子掩码.对于给定的 \(k\),对应有 \(\dbinom{n}{k}\) 个掩码 \(m\),那么所有掩码的总数为:
上面的和等于使用二项式定理对 \((1+2)^n\) 的展开,因此有 \(3^n\) 个不同的组合.
参考资料
本页面主要译自博文 Перебор всех подмасок данной маски 与其英文翻译版 Submask Enumeration.其中俄文版版权协议为 Public Domain + Leave a Link;英文版版权协议为 CC-BY-SA 4.0.
习题
- Atcoder - Close Group
- Codeforces - Nuclear Fusion
- Codeforces - Sandy and Nuts
- UVa 1439 - Exclusive Access 2
- UVa 11825 - Hackers' Crackdown
Last updated on this page:, Update history
Found an error? Want to help improve? Edit this page on GitHub!
Contributors to this page:OI-wiki
All content on this page is provided under the terms of the CC BY-SA 4.0 and SATA license, additional terms may apply