P4770 [NOI2018]你的名字

题意

不妨先考虑\(l=1,r=|S|\)的情况：
这时我们要求的其实是\(S,T\)的本质不同的公共子串数量。

首先对\(S\)建一个后缀自动机，同时对于每个\(T\)，我们也建一个自动机。

根据后缀自动机的性质，后缀自动机的所有节点的代表的字符串的集合代表了\(T\)的全部子串，因此我们可以考虑\(T\)后缀自动机的上的每一个点代表的字符串中有多少是和\(S\)的公共子串。

于是考虑怎么求这个东西：
我们对于\(T\)的每一个前缀\(T[1...i]\)求出\(match_i\)表示这个前缀的后缀能跟\(S\)匹配的最长长度，这个东西可以在\(S\)的后缀自动机上匹配\(T\)来求出，见这题。

对于一个节点\(x\)，我们设它的字符串长度范围为\([minlen_x,maxlen_x]\)，\(endpos\)集合的第一个为\(firpos_x\)。

这时我们发现这个节点长度在\(match_{firpos_x}+1\)往上的字符串都不可能和\(S\)匹配，因此这个节点的贡献为\(\max(len_x-\max(len_{fa_x},match_{firpos_x}),0)\)。

现在考虑\([l,r]\)的限制，我们按照套路用线段树维护\(S\)的后缀自动机每个节点\(endpos\)集合，求\(match\)的时候只走合法的点即可。

求match时注意个细节，写在注释里了。

code:

#include<bits/stdc++.h>
using namespace std;
typedef long long ll;
const int maxn=1e6+10;
int n,m,Q,tot,cnt_edge;
int head[maxn<<1],root[maxn<<1],match[maxn];
char s[maxn];
struct edge{int to,nxt;}e[maxn<<2];
struct Seg
{
    #define lc(p) (seg[p].lc)
    #define rc(p) (seg[p].rc)
    #define sum(p) (seg[p].sum)
    int lc,rc,sum;
}seg[maxn*50];
inline void add_edge(int u,int v)
{
    e[++cnt_edge].nxt=head[u];
    head[u]=cnt_edge;
    e[cnt_edge].to=v;
}
void insert(int &p,int l,int r,int pos)
{
    if(!p)p=++tot;
    sum(p)++;
    if(l==r)return;
    int mid=(l+r)>>1;
    if(pos<=mid)insert(lc(p),l,mid,pos);
    else insert(rc(p),mid+1,r,pos);
}
int merge(int p,int q,int l,int r)
{
    if(!p||!q)return p+q;
    int x=++tot;sum(x)=sum(p)+sum(q);
    if(l==r)return x;
    int mid=(l+r)>>1;
    lc(x)=merge(lc(p),lc(q),l,mid);
    rc(x)=merge(rc(p),rc(q),mid+1,r);
    return x;
}
int query(int p,int l,int r,int ql,int qr)
{
    if(!p)return 0;
    if(l>=ql&&r<=qr)return sum(p);
    int mid=(l+r)>>1,res=0;
    if(ql<=mid)res+=query(lc(p),l,mid,ql,qr);
    if(qr>mid)res+=query(rc(p),mid+1,r,ql,qr);
    return res;
}
void dfs(int x)
{
    for(int i=head[x];i;i=e[i].nxt)
        dfs(e[i].to),root[x]=merge(root[x],root[e[i].to],1,n);
}
struct SAM
{
    int tot,last;
    int fa[maxn<<1],len[maxn<<1],firpos[maxn<<1];
    int ch[maxn<<1][30];
    inline void clear()
    {
        for(int i=1;i<=tot;i++)
        {
            fa[i]=len[i]=firpos[i]=0;
            memset(ch[i],0,sizeof(ch[i]));
        }
        last=tot=1;
    }
    inline void add(int c,int id)
    {
        int now=++tot;len[now]=len[last]+1;firpos[now]=id;
        int p=last;last=now;
        while(p&&!ch[p][c])ch[p][c]=now,p=fa[p];
        if(!p){fa[now]=1;return;}
        int q=ch[p][c];
        if(len[q]==len[p]+1)fa[now]=q;
        else
        {
            int nowq=++tot;len[nowq]=len[p]+1;firpos[nowq]=firpos[q];
            memcpy(ch[nowq],ch[q],sizeof(ch[q]));
            fa[nowq]=fa[q];fa[q]=fa[now]=nowq;
            while(p&&ch[p][c]==q)ch[p][c]=nowq,p=fa[p];
        }
    }
}sam1,sam2;
inline int read()
{
    char c=getchar();int res=0,f=1;
    while(c<'0'||c>'9'){if(c=='-')f=-1;c=getchar();}
    while(c>='0'&&c<='9')res=res*10+c-'0',c=getchar();
    return res*f;
}
inline void getmatch(char* s,int l,int r)
{
    int len=strlen(s+1),now=1,nowl=0;
    for(int i=1;i<=len;i++)
    {
        while(2333)
        {
            if(sam1.ch[now][s[i]-'a']&&query(root[sam1.ch[now][s[i]-'a']],1,n,l+nowl,r))//注意是l+nowl，这是endpos的集合。
            {
                now=sam1.ch[now][s[i]-'a'],nowl++;
                break;
            }
            if(!nowl)break;
            nowl--;//注意不要直接跳fa[now],因为区间缩小可能产生答案。
            if(nowl==sam1.len[sam1.fa[now]])now=sam1.fa[now];
        }
        match[i]=nowl;
    }
}
int main()
{
    scanf("%s",s+1);n=strlen(s+1);
    sam1.clear();
    for(int i=1;i<=n;i++)sam1.add(s[i]-'a',i),insert(root[sam1.last],1,n,i);
    for(int i=2;i<=sam1.tot;i++)add_edge(sam1.fa[i],i);
    dfs(1);
    Q=read();
    while(Q--)
    {
        ll ans=0;
        scanf("%s",s+1);m=strlen(s+1);
        int l=read(),r=read();
        sam2.clear();
        for(int i=1;i<=m;i++)sam2.add(s[i]-'a',i);
        getmatch(s,l,r);
        for(int i=2;i<=sam2.tot;i++)
            ans+=max(0,sam2.len[i]-max(match[sam2.firpos[i]],sam2.len[sam2.fa[i]]));
        printf("%lld\n",ans);
    }
    return 0;
}