快速傅里叶变换
快速傅里叶变换(Fast Fourier Transform, FTT)在CP中最主要的应用是计算多项式乘法。
多项式的系数表示和点值表示
假设为的阶多项式,则其可以表示为:
这里的个系数就称为多项式的系数表示。
另一方面,我们也可以把看成是一个关于的函数,我们可以取个不同的,用这个数值对来唯一确定,这种表示形式就称为多项式的点值表示。
点值表示与多项式乘法的关系
假设我们现在要求的是,如果我们已知和的点值表示,那么我们可以非常容易地得到的点值表示为
注意这里的实际上要取到和的阶数之和。
现在的关键问题是,如何快速将这一点值表示转换为系数表示。
FFT的实现
为了解决这一问题,我们首先考虑其逆问题,也即:如何从系数表示快速计算点值表示。
FFT
暴力计算对点值的总时间复杂度为。如何优化呢?我们希望我们选择的个之间存在一定的关系,使得我们可以复用的计算结果。那么,应该如何选择呢?
前人的经验告诉我们,可以选择单位复根。它有三个重要的性质:
利用上述这三个性质,我们可以实现计算过程的简化。
不妨考虑一个最高阶为7阶的多项式
可以把奇偶项分别处理
从而
这时把单位复根()代入,可以得到
而另一方面,代入可以得到
因此,我们只要求得和,就可以同时求得和,这样就把问题规模缩小了一半。
使用同样的方法对和进行递归求解,我们有
可知总的时间复杂度为。
在这一过程中,我们默认总是整数,因此我们需要。所以在计算之前,我们要先对系数补0,使得总的项数变为2的幂次。
逆FFT
将FFT的运算过程看做一个矩阵乘法,逆FFT,也即从点值表示求取系数表示的过程,可以视为左乘逆矩阵。在点值表示的点选取为时,FFT矩阵的逆矩阵恰好为,因此可以复用FFT的计算过程,只需要加上一个标志变量来表示当前是在进行FFT还是IFFT。
模板题:洛谷 P3803 - 多项式乘法(FFT)
下面给出了本题的递归实现。
参考代码(C++)
#include <cmath>
#include <complex>
#include <iostream>
#define MAXN (1 << 22)
using namespace std;
typedef complex<double> cd;
const cd I{0, 1};
cd tmp[MAXN], a[MAXN], b[MAXN];
void fft(cd *f, int n, int rev) {
if (n == 1)
return;
for (int i = 0; i < n; ++i)
tmp[i] = f[i];
for (int i = 0; i < n; ++i) {
if (i & 1)
f[n / 2 + i / 2] = tmp[i];
else
f[i / 2] = tmp[i];
}
cd *g = f, *h = f + n / 2;
fft(g, n / 2, rev), fft(h, n / 2, rev);
cd omega = exp(I * (2 * M_PI / n * rev)), now = 1;
for (int k = 0; k < n / 2; ++k) {
tmp[k] = g[k] + now * h[k];
tmp[k + n / 2] = g[k] - now * h[k];
now *= omega;
}
for (int i = 0; i < n; ++i)
f[i] = tmp[i];
}
int main() {
int n, m;
cin >> n >> m;
int k = 1 << (32 - __builtin_clz(n + m + 1));
for (int i = 0; i <= n; ++i)
cin >> a[i];
for (int j = 0; j <= m; ++j)
cin >> b[j];
fft(a, k, 1);
fft(b, k, 1);
for (int i = 0; i < k; ++i)
a[i] *= b[i];
fft(a, k, -1);
for (int i = 0; i < k; ++i)
a[i] /= k;
for (int i = 0; i < n + m + 1; ++i)
cout << (int)round(a[i].real()) << " ";
}
上述递归方法的常数较大,不能通过洛谷P3803的最后两个测试点。
为了改写非递归方法,我们引入蝴蝶变换的概念。
蝴蝶变换
继续使用前面的例子,经过第一步分治,将原来的系数分为两组:
继续进行第二步分治,得到四组系数:
最后一步分治,得到八组系数:
所谓蝴蝶变换,指的就是从这一原始系数序列,变换得到最后一步分治后的系数序列。
观察后可以发现,在蝴蝶变换的最终结果中,系数下标的二进制表示恰好是其所在位置二进制表示的逆序,因此,可以利用这一规律来求取蝴蝶变换的结果。
直接利用规律来计算的复杂度是,如果从小到大递推实现,复杂度则为。
FFT的非递归实现
下面给出了洛谷P3803的非递归实现。
参考代码(C++/Kotlin)
- C++
- Kotlin
#include <cmath>
#include <complex>
#include <iostream>
#define MAXN (1 << 22)
using namespace std;
typedef complex<double> cd;
const cd I{0, 1};
cd a[MAXN], b[MAXN];
void change(cd *f, int n) {
int i, j, k;
for (int i = 1, j = n / 2; i < n - 1; i++) {
if (i < j)
swap(f[i], f[j]);
k = n / 2;
while (j >= k) {
j = j - k;
k = k / 2;
}
if (j < k)
j += k;
}
}
void fft(cd *f, int n, int rev) {
change(f, n);
for (int len = 2; len <= n; len <<= 1) {
cd omega = exp(I * (2 * M_PI / len * rev));
for (int j = 0; j < n; j += len) {
cd now = 1;
for (int k = j; k < j + len / 2; ++k) {
cd g = f[k], h = now * f[k + len / 2];
f[k] = g + h, f[k + len / 2] = g - h;
now *= omega;
}
}
}
if (rev == -1)
for (int i = 0; i < n; ++i)
f[i] /= n;
}
int main() {
int n, m;
cin >> n >> m;
int k = 1 << (32 - __builtin_clz(n + m + 1));
for (int i = 0; i <= n; ++i)
cin >> a[i];
for (int j = 0; j <= m; ++j)
cin >> b[j];
fft(a, k, 1);
fft(b, k, 1);
for (int i = 0; i < k; ++i)
a[i] *= b[i];
fft(a, k, -1);
for (int i = 0; i < n + m + 1; ++i)
cout << (int)round(a[i].real()) << " ";
}
import kotlin.math.*
fun readInts(): List<Int> {
return readLine()!!.trim().split(" ").map(String::toInt)
}
fun nearest(n: Int): Int {
return 1.shl(ceil(log2(n.toDouble())).toInt() + 1)
}
data class Complex(val real: Double, val imag: Double) {
operator fun plus(other: Complex): Complex {
return Complex(real + other.real, imag + other.imag)
}
operator fun minus(other: Complex): Complex {
return Complex(real - other.real, imag - other.imag)
}
operator fun times(other: Double): Complex {
return Complex(real * other, imag * other)
}
operator fun times(other: Complex): Complex {
return Complex(real * other.real - imag * other.imag, real * other.imag + imag * other.real)
}
}
val rev = IntArray(nearest(1000002))
fun change(f: Array<Complex>, n: Int) {
if (rev[1] == 0)
for (i in 0 until n) {
rev[i] = rev[i shr 1] shr 1
if (i % 2 == 1)
rev[i] = rev[i] or (n shr 1)
}
for (i in 0 until n)
if (i < rev[i]) {
val tmp = f[i]
f[i] = f[rev[i]]
f[rev[i]] = tmp
}
}
fun fft(f: Array<Complex>, n: Int, rev: Int) {
change(f, n)
var len = 2
while (len <= n) {
val omega = Complex(cos(2.0 * PI / len * rev), sin(2.0 * PI / len * rev))
var l = 0
while (l < n) {
var now = Complex(1.0, 0.0)
for (i in l until l + len / 2) {
val g = f[i]
val h = now * f[i + len / 2]
f[i] = g + h
f[i + len / 2] = g - h
now *= omega
}
l += len
}
len *= 2
}
if (rev == -1)
for (i in 0 until n)
f[i] = f[i] * (1.0 / n)
}
fun main() {
val (n, m) = readInts()
val k = nearest(n + m + 1)
val a = Array(k) { Complex(0.0, 0.0) }
for ((i, v) in readInts().withIndex())
a[i] = Complex(v.toDouble(), 0.0)
val b = Array(k) { Complex(0.0, 0.0) }
for ((i, v) in readInts().withIndex())
b[i] = Complex(v.toDouble(), 0.0)
fft(a, k, 1)
fft(b, k, 1)
for (i in 0 until k)
a[i] = a[i] * b[i]
fft(a, k, -1)
val ans = a.slice(0 until n + m + 1).map { round(it.real).toInt() }
println(ans.joinToString(" "))
}
由于语言差异,Kotlin版本并不能通过洛谷的测试。
学习资源
Matters Computational
- 第二十一章 快速傅里叶变换
练习题
裸FFT并不可怕,本身FFT的码量并不算大,背一背也不是多大的事,关键是如何看出一道题目是FFT。
SPOJ - ADAMATCH
如果暴力枚举子串,时间复杂度为,显然不行。如何降低复杂度呢?
提示一
首先考虑字母'A'
。不妨把字符串为'A'
的位置设为,其余位置设为。看起来似乎可以进行多项式乘法,但乘法的结果似乎没有明显的意义。
提示二
如果把r
串逆序呢?看看此时乘积的每一项有怎样的含义。
参考代码(C++)
#include <cmath>
#include <complex>
#include <cstring>
#include <iostream>
#include <vector>
#define MAXN (1 << 22)
using namespace std;
typedef complex<double> cd;
const cd I{0, 1};
cd a[MAXN], b[MAXN];
void change(cd *f, int n) {
for (int i = 1, j = n / 2; i < n - 1; i++) {
if (i < j)
swap(f[i], f[j]);
int k = n / 2;
while (j >= k) {
j = j - k;
k = k / 2;
}
if (j < k)
j += k;
}
}
void fft(cd *f, int n, int rev) {
change(f, n);
for (int len = 2; len <= n; len <<= 1) {
cd omega = exp(I * (2 * M_PI / len * rev));
for (int j = 0; j < n; j += len) {
cd now = 1;
for (int k = j; k < j + len / 2; ++k) {
cd g = f[k], h = now * f[k + len / 2];
f[k] = g + h, f[k + len / 2] = g - h;
now *= omega;
}
}
}
if (rev == -1)
for (int i = 0; i < n; ++i)
f[i] /= n;
}
int main() {
string s, r;
cin >> s >> r;
int n = s.size(), m = r.size();
int k = 1 << (32 - __builtin_clz(n + m + 1));
vector<int> cnt(k);
for (char c : "ACGT") {
memset(a, 0, sizeof(a));
memset(b, 0, sizeof(b));
for (int i = 0; i < n; ++i)
a[i] = s[i] == c;
for (int i = 0; i < m; ++i)
b[i] = r[m - i - 1] == c;
fft(a, k, 1);
fft(b, k, 1);
for (int i = 0; i < k; ++i)
a[i] *= b[i];
fft(a, k, -1);
for (int i = 0; i < k; ++i)
cnt[i] += (int)round(a[i].real());
}
int ans = m;
for (int i = m - 1; i < n; ++i)
ans = min(ans, m - cnt[i]);
cout << ans;
}
SPOJ - TSUM
如果暴力枚举,时间复杂度为,显然不行。如何降低复杂度呢?
提示一
加法可以变为多项式的乘法。
提示二
如何去除包含重复元素的项?
参考代码(C++)
#include <cmath>
#include <complex>
#include <iostream>
#include <vector>
#define MAXN 131072
#define OFFSET 20000
using namespace std;
typedef complex<double> cd;
const cd I{0, 1};
void change(vector<cd> &f, int n) {
for (int i = 1, j = n / 2; i < n - 1; i++) {
if (i < j)
swap(f[i], f[j]);
int k = n / 2;
while (j >= k) {
j = j - k;
k = k / 2;
}
if (j < k)
j += k;
}
}
void fft(vector<cd> &f, int n, int rev) {
change(f, n);
for (int len = 2; len <= n; len <<= 1) {
cd omega = exp(I * (2 * M_PI / len * rev));
for (int j = 0; j < n; j += len) {
cd now = 1;
for (int k = j; k < j + len / 2; ++k) {
cd g = f[k], h = now * f[k + len / 2];
f[k] = g + h, f[k + len / 2] = g - h;
now *= omega;
}
}
}
if (rev == -1)
for (int i = 0; i < n; ++i)
f[i] /= n;
}
int main() {
int n;
cin >> n;
vector<cd> a(MAXN), a2(MAXN);
vector<int> a3(MAXN);
for (int i = 0; i < n; ++i) {
int m;
cin >> m;
a[m + OFFSET] = cd{1, 0};
a2[(m + OFFSET) << 1] = cd{1, 0};
a3[(m + OFFSET) * 3] = 1;
}
vector<cd> tot(a), b(a);
fft(tot, MAXN, 1);
fft(b, MAXN, 1);
fft(a2, MAXN, 1);
for (int i = 0; i < MAXN; ++i)
tot[i] *= b[i] * b[i], a2[i] *= b[i];
fft(tot, MAXN, -1);
fft(a2, MAXN, -1);
for (int i = 0; i < MAXN; ++i) {
int cnt1 = round(tot[i].real()); // ABC, with permutation
int cnt2 = round(a2[i].real()); // AAB, no permutation
int cnt3 = a3[i]; // AAA
int cnt = (cnt1 - cnt2 * 3 + cnt3 * 2) / 6;
if (cnt > 0)
cout << i - OFFSET * 3 << " : " << cnt << endl;
}
}