快速傅里叶变换 (Fast Fourier Transform, FFT) 是一种 $ O(n\ log_2\ n) $ 的时间复杂度内完成离散傅里叶变换 (DFT) 的算法,OI 中通常用来优化多项式乘法。

常见题目类型链接
给定一个 $n$ 次多项式 $F(x)$ 和一个 $m$ 次多项式 $G(x) $。求出它们的卷积。

FFT 就可以在 $ n\ log_2\ n $ 的时间复杂度内解决该类问题。

先来学习一些 FFT 前备知识。

Q:我是初中的啊…看不懂怎么办?

A:本人尽量写到初中生理解水平...因为我就是一个没学过数学奥赛的初中生…大可放心食用

<h2>多项式</h2>

<h3>系数表示法</h3>

设 $F(x)$ 表示一个 $n-1$ 次的多项式,则 $$ F(x) = \Sigma_{i=0}^{n-1} a_i * x_i $$

利用系数直接运算多项式乘法的时间复杂度是 $ O(n^2) $ 。(即每个系数都要枚举相乘)

<h3>点值表示法</h3>

将这个多项式 $F(x) $ 看成一个函数,就是说代入 $ n $ 个互不相同的 $x$ ,会得到 $n$ 个不同的取值 $y$。

那么这个多项式就被这 $n$ 个点 $(x_1,y_1),(x_2,y_2) \cdots (x_n,y_n) $ 唯一确定。

当然这样计算也是 $O(n^2)$ 的。

当然这些都需要优化。对于第一种好像不会优化,于是我们考虑第二种表示法的优化。



我们为了照顾初中选手,先介绍一些简单的东西。

<h3>向量(矢量)</h3>

有方向也有大小的量,与标量(无方向)相对。

在集合中我们用有箭头的直线来表示。

<h3>圆的弧度制</h3>

我们之前学的角度制的定义是将圆 $ 360 $ 等分。

弧度制的定义是等于半径长的圆弧对应的圆心角叫做 1 弧度的角。用符号 rad 表示,读作弧度,用 rad 作为单位来度量角的制度叫做弧度制(字面意思)

显然有:$ 1 ^{ ∘ } = \frac{\pi}{180}rad $

因为设这个圆的半径为 r ,我们发现周长是 $2\pi r$ ,那么在这个周长上取长度为 r 的弧,圆心角显然是 $ ( \frac{r}{2\pi r} * 360^∘ )rad= \frac{\pi}{180}rad $

<h3>平行四边形定则</h3>

有一个平行四边形 $ABCD $ ,那么有 $ AB + AD = AC$。

可以表示成向量加法。

<h3>等比数列求和</h3>

设一个等比数列中:首项为 $ a_1 $,公比是 $q$。

那么前 $n$ 项的和 $S = \frac{a_1(1-q^n)}{1-q}$

证明可以通过错位相减来实现。

<h2>复数</h2>

<h3>定义</h3>

设实数 $a,b$,定义虚数单位 $ i $,有 $i^2 = -1 $ ,将形如 $a + bi$ 的数叫做复数。复数域是目前已知最大的域。

在复平面里(x 轴表示实数,y 轴表示虚数)。从 $ O(0,0) $ 到 $A(a,b)$ 的向量能表示复数 $a + bi$。

模长:$OA$ 的长度,即 $\sqrt{a^2 + b^2}$

幅角:假设以逆时针为正方向,从 $x$ 正半轴旋转至向量的转角的有向角叫做幅角。

<h3>运算法则</h3>

<h4>加法</h4>

向量相加,满足平行四边形定则。即:$ (a + bi) + (c + di) = (a + c) + (b+d)i $

复数的加法是封闭的。

<h4>乘法</h4>

向量的乘法几何定义:复数相乘,模长相乘,幅角相加。

代数定义:

$$(a + bi) * (c + di) =ac + adi + bci + bdi^2 = ac + adi + bci - bd = (ac-bd) + (bc + ad)i$$

<h2>单位根</h2>

下文若不做特别的声明,均默认 $n$ 为 $2$ 的整数次幂。

在复平面上以原点为圆心,1 为半径作出的圆叫做单位圆。以圆点为起点,圆的 n 等分点为终点作出 n 个向量。设幅角为正且最小的向量对应的复数为 $\omega_n$ ,称为 $n$ 次单位根。

其余的 $n-1$ 个复数显然是 $ \omega_n^2,\omega_n^3 \cdots \omega_n^n$

注意到有 $\omega_n^0 = \omega_n^n = 1$ (对应方向为 x 轴正半轴的向量)

单位根的幅角是周角的 $\frac{1}{n}$ (显然 $n$ 等分)。

一些性质:

性质1

$$ \omega_n^k = cos\ k * \frac{2\pi}{n} + i\ sin\ k * \frac{2\pi}{n} \Rightarrow \omega_{2n}^{2k} = \omega_n^k$$

证明:

$$\omega_{2n}^{2k} = \cos 2k * \frac{2 \pi }{2n} + i \sin 2k* \frac{2 \pi }{2n} = \cos k* \frac{2 \pi }{n} + i \sin k * \frac{2\pi}{n} =\omega_n^k$$

性质2

$ \omega_n^{k+\frac{n}{2}} = -\omega_n^k $

证明:

$$ w_n^{ \frac{n}{2} } = \cos \frac{n}{2} * \frac{2 \pi }{n} + i \sin \frac{n}{2} * \frac{2 \pi }{n} = \cos \pi + i \sin \pi = -1$$

我们终于把预备知识讲完了,那么接下来开始正题。

<h2>快速傅里叶变换</h2>

朴素的求一个多项式的点值表达法的复杂度是 $ O(n^2) $,我们先来探究一些性质。

设多项式 $F(x)$ 的系数为 $$ &#123;a_0,a_{1},a_{2},\cdots,a_{n-1}&#125;$$

那么

$ F(x) = \Sigma_{i=0}^{n-1} a_i * x^i $

将其按照下标分成两个多项式:

$$ F_1 (x) = \Sigma_{i=0}^{ \frac{n}{2} - 1 } a_{i * 2} x^{i * 2} $$
$$F_2(x) = \Sigma_{i=0}^{ \frac{n}{2} - 1 }a_{i * 2 + 1 } x^{i * 2 + 1 }$$

那么可以得到:

$$ F(x) = F_1(x^2) + xF_2(x^2) $$

我们代入 $\omega_n^k(k &lt; \frac{n}{2})$ 得到

$$ F( \omega^k_n ) = F_1( \omega^{2k}_ n ) + \omega^k_n F_2( \omega_n^{2k} ) $$

$$ = F_1(\omega^k_{ \frac{n}{2} }) + \omega^k_nF_2( \omega_{ \frac{n}{2}}^{k})$$

同理,代入 $w_n^{k+\frac{n}{2}}$得到

$$ F( \omega_n^{k + \frac{n}{2} } ) = F_1({ \omega^{2k+n}_ n }) + \omega_n^{k+ \frac{n}{2} }F_2(\omega_n^{2k+n}) $$
$$ = F_1(\omega_n^{2k}) - \omega_n^kF_2(\omega_n^{2k} * \omega_n^n) $$
$$= F_1(\omega_n^{2k}) - \omega_n^kF_2(\omega_n^{2k}) $$
$$ = F_1(\omega^k_{\frac{n}{2}}) - \omega^k_nF_2(\omega_{\frac{n}{2}}^{k})$$

发现这两个式子仅由一个常数项不同(-号)

所以我们只需要算出第一个式子,第二个式子就可以 $O(1)$ 求。

所以说我们可以递归二分去计算这个东西,遇到常数项就返回。

时间复杂度:$ T(n) = 2T(n/2) + O(n) = O(n\ log_2\ n)$

<h2>快速傅里叶逆变换</h2>

还没有结束...

我们要考虑怎么输出答案啊。

一般来说没有人会让你输出点值表示法的,所以我们需要用逆变换来换回来。

首先我们可以将 FFT 后的结果看做一个向量 $$ (y_0,y_1,y_2,\cdots,y_{n-1}) $$。

我们设另一个向量 $$ (c_0,c_1,c_2,\cdots,c_{n-1}) $$ 令其满足

$$ c_k=\Sigma_{i=0}^{n-1}y_i(\omega^{-k}_n)^i $$

浅显易懂的讲就是将结果看做一个多项式,求出这个多项式的 FFT 的结果。

推一波式子:

$$ c_k=\Sigma_{i=0}^{n-1}y_i(\omega^{-k}_ n)^i $$
$$=\Sigma_{i=0}^{n-1}(\Sigma_{j=0}^{n-1}a_j(\omega^i_n)^j)(\omega_n^{-k})^i $$
$$=\Sigma_{i=0}^{n-1}(\Sigma_{j=0}^{n-1}a_j(\omega_n^j)^i)(\omega_n^{-k})^i $$
$$= \Sigma_{i=0}^{n-1}(\Sigma_{j=0}^{n-1}a_j(\omega_n^j)^i(\omega_n^{-k})^i $$
$$= \Sigma_{i=0}^{n-1}\Sigma_{j=0}^{n-1}a_j(\omega_n^j)^i(\omega_n^{-k})^i $$
$$=\Sigma_{i=0}^{n-1}\Sigma_{j=0}^{n-1}a_j(\omega_n^{j-k})^i $$
$$ = \Sigma_{j=0}^{n-1}a_j \Sigma_{i=0}^{n-1}(\omega_n^{j-k})^i $$

设 $ S(x) = \Sigma_{i=0}^{n-1} x^i$

代入 $ \omega_n^k $ 得:

$$ S(\omega_n^k) = \Sigma_{i=0}^{n-1}w_n^i $$

直接套用等比数列求和(错位相减法),得:

$ S(\omega_n^k) = \frac{1-1}{\omega_n^k-1} $

不难看出分子为 0 ,分母不为 0 。

分类讨论一下:

$ K \neq 0$ :$ S(\omega_n^k) = 0 $

$ K = 0$:$S(\omega_n^0) = n$

我们继续考虑式子 $$c_k = \Sigma_{j=0}^{n-1}a_j\Sigma_{i=0}^{n-1}(\omega_n^{j-k})^i $$

同理:

$ j \neq k \to (j-k) \neq 0 $:$c_k = 0$

$ j = k \to (j - k) = 0$:$c_k = n $

这样我们就得到点值与系数之间的表示方法:

$$ c_k = na_k \Longleftrightarrow a_k = \frac{c_k}{n} $$

<h2>递归实现的代码</h2>

const double Pi=acos(-1.0);
struct complex
{
    double x,y;
    complex (double xx=0,double yy=0){x=xx,y=yy;}
}a[MAXN],b[MAXN];
complex operator + (complex a,complex b){ return complex(a.x+b.x , a.y+b.y);}
complex operator - (complex a,complex b){ return complex(a.x-b.x , a.y-b.y);}
complex operator  (complex a,complex b){ return complex(a.xb.x-a.yb.y , a.xb.y+a.y*b.x);} 
void fast_fast_tle(int limit,complex *a,int type)
{
    if(limit==1) return ;// 只有一个常数项
    complex a1[limit>>1],a2[limit>>1];
    for(int i=0;i<=limit;i+=2)// 根据下标的奇偶性分类
        a1[i>>1]=a[i],a2[i>>1]=a[i+1];
    fast_fast_tle(limit>>1,a1,type);
    fast_fast_tle(limit>>1,a2,type);
    complex Wn=complex(cos(2.0Pi/limit) , typesin(2.0*Pi/limit)),w=complex(1,0);
    // Wn为单位根,w表示幂
    for(int i=0;i<(limit>>1);i++,w=w*Wn)
        a[i]=a1[i]+w*a2[i],
        a[i+(limit>>1)]=a1[i]-w*a2[i];// O(1)得到另一部分 
}
// 自己懒得写了找了一份别人的代码233以后会补上的

<h3>蝴蝶操作</h3>

稍微优化一下小常数。

发现 $w*a2[i]$ 被计算了两次,开一个 $t$ 来存储仅需计算一次。

<h2>迭代实现</h2>

递归的效率过于低下,我们需要更快的解决这个问题。

我们观察原序列的下标和分类后的序列下标。

发现二进制翻转可以就直接解决这个问题。

这样我们就可以 $O(n)$ 的利用某种操作来求得序列,然后依照规律合并即可。

#include <algorithm>
#include <iostream>
#include <cstring>
#include <climits>
#include <cstdio>
#include <vector>
#include <cmath>
#include <queue>
#include <stack>
#include <map>
#include <set>

#define R register
#define LL long long
#define U unsigned
#define FOR(i,a,b) for(int i = a;i <= b;++i)
#define RFOR(i,a,b) for(int i = a;i >= b;--i)
#define CLR(i,a) memset(i,a,sizeof(i))
#define BR printf("--------------------n")
#define DEBUG(x) std::cerr << #x << '=' << x << std::endl

namespace fastIO{
    #define BUF_SIZE 100000
    #define OUT_SIZE 100000
    #define ll long long
    bool IOerror=0;
    inline char nc(){
        static char buf[BUF_SIZE],p1=buf+BUF_SIZE,pend=buf+BUF_SIZE;
        if (p1==pend){
            p1=buf; pend=buf+fread(buf,1,BUF_SIZE,stdin);
            if (pend==p1){IOerror=1;return -1;}
        }
        return *p1++;
    }
    inline bool blank(char ch){return ch==' '||ch=='n'||ch=='r'||ch=='t';}
    inline void read(int &x){
        bool sign=0; char ch=nc(); x=0;
        for (;blank(ch);ch=nc());
        if (IOerror)return;
        if (ch=='-')sign=1,ch=nc();
        for (;ch>='0'&&ch<='9';ch=nc())x=x*10+ch-'0';
        if (sign)x=-x;
    }
    inline void read(ll &x){
        bool sign=0; char ch=nc(); x=0;
        for (;blank(ch);ch=nc());
        if (IOerror)return;
        if (ch=='-')sign=1,ch=nc();
        for (;ch>='0'&&ch<='9';ch=nc())x=x*10+ch-'0';
        if (sign)x=-x;
    }
    #undef ll
    #undef OUT_SIZE
    #undef BUF_SIZE
};
using namespace fastIO;
#undef R

const int MAXN = 10000000 + 5;

const double PI = acos(-1.0);
struct complex{
    double x,y;
    complex(double x=0,double y=0) : x(x),y(y) {}
}a[MAXN],b[MAXN];

complex operator + (const complex &a,const complex &b){
    return complex(a.x + b.x,a.y + b.y);
}

complex operator - (const complex &a,const complex &b){
    return complex(a.x-b.x,a.y-b.y);
}

complex operator * (const complex &a,const complex &b){
    return complex(a.x  b.x - a.y  b.y,a.xb.y+a.yb.x);
}

int N,M;
int f[MAXN],g[MAXN],r[MAXN];
int limit=1,len;

inline void fft(complex *A,int opt){
    FOR(i,0,limit){
        if(i < r[i]) std::swap(A[i],A[r[i]]);
    }
    for(int mid = 1;mid < limit;mid <<= 1){
        complex W(cos(PI/mid),opt*sin(PI/mid));
        for(int j=0,R = (mid << 1);j < limit;j += R){
            complex w(1,0);
            for(int k = 0;k < mid;k++,w=w*W){
                complex x = A[j+k],y=w*A[j+mid+k];
                A[j+k] = x+y;
                A[j+mid+k] = x-y;
            }
        }
    }
}

int main(){
    read(N);read(M);
    FOR(i,0,N){
        int x;read(x);a[i].x = x;
    }
    FOR(i,0,M){
        int x;read(x);b[i].x = x;
    }
    while(limit <= N + M){
        limit <<= 1;len++;
    }
    FOR(i,0,limit){
        r[i] = (r[i>>1]>>1)|((i&1)<<(len-1));
    }
    fft(a,1);
    fft(b,1);
    FOR(i,0,limit) a[i] = a[i]*b[i];
    fft(a,-1);
    FOR(i,0,N+M) printf("%d%c",(int)(a[i].x/limit+0.5),(i == N + M) ? 'n': ' ');
    return 0;
}
Last modification:April 7th, 2020 at 10:14 pm
如果觉得我的文章对你有用,请随意赞赏