洛谷 P4721 分治FFT

因为要求出f要先求出f（i<j），且式子是和式，故f对f的影响是独立的，考虑运用CDQ分治的思想。

为了代码的高效优美简洁，有以下几个具体实现：

分治过程中用到STL函数（左闭右开），且区间长为2的幂，为方便，l，r，表示的应是区间[l,r)。
在区间[l,r)中，求出区间[l,mid)对区间[mid,r)的影响，而非[mid,Max)。
对于数组r，应在计算不同长度的卷积前重新计算（因为这个调了1小时）。

代码用NTT实现：

#include<bits/stdc++.h>
#define IL inline
#define LL long long
using namespace std;
const int N=4e5+3,P=998244353,G=3,Gi=332748118;
IL int in(){
    char c;int f=1;
    while((c=getchar())<'0'||c>'9')
      if(c=='-') f=-1;
    int x=c-'0';
    while((c=getchar())>='0'&&c<='9')
      x=x*10+c-'0';
    return x*f;
}
LL g[N],f[N],a[N],b[N];
int n,m,r[N],Max=1,cnt;
IL LL ksm(LL a,LL b){
    LL c=1;
    while(b){
        if(b&1) c=c*a%P;
        a=a*a%P,b>>=1;
    }
    return c;
}
IL void get(int len){for(int i=0;i<len;++i) r[i]=(r[i>>1]>>1)|((i&1)*len>>1);}
IL void FFT(LL *a,int len,int op){
    for(int i=0;i<len;++i) if(i<r[i]) swap(a[i],a[r[i]]);
    for(int i=1;i<len;i<<=1){
        LL wn=ksm(~op?G:Gi,(P-1)/(i<<1));
        for(int j=0,l=i<<1;j<len;j+=l){
            LL w=1;
            for(int k=0;k<i;++k,w=w*wn%P){
                LL x=a[j+k],y=w*a[j+i+k]%P;
                a[j+k]=(x+y)%P,a[j+i+k]=(x-y+P)%P;
            }
        }
    }
}
void solve(int l,int r){
    if(l+1==r) return;
    int mid=l+r>>1,m=(r-l)>>1;
    solve(l,mid);
    LL inv=ksm(r-l,P-2);get(r-l);
    memset(a+m,0,8*m),memcpy(a,f+l,8*m),memcpy(b,g,8*(r-l));
    FFT(a,r-l,1),FFT(b,r-l,1);
    for(int i=0;i<r-l;++i) a[i]=a[i]*b[i]%P;
    FFT(a,r-l,-1);
    for(int i=m;i<r-l;++i) a[i]=a[i]*inv%P;
    for(int i=m;i<r-l;++i) f[l+i]=(f[l+i]+a[i])%P;
    solve(mid,r);
}
int main()
{
    n=in(),f[0]=1;
    for(int i=1;i<n;++i) g[i]=in();
    while(Max<n) Max<<=1,++cnt;
    solve(0,Max);
    for(int i=0;i<n;++i) printf("%lld ",f[i]);
    return 0;
}