Description
标点符号的出现晚于文字的出现,所以以前的语言都是没有标点的。现在你要处理的就是一段没有标点的文章。 一段文章T是由若干小写字母构成。一个单词W也是由若干小写字母构成。一个字典D是若干个单词的集合。 我们称一段文章T在某个字典D下是可以被理解的,是指如果文章T可以被分成若干部分,且每一个部分都是字典D中的单词。 例如字典D中包括单词{‘is’, ‘name’, ‘what’, ‘your’},则文章‘whatisyourname’是在字典D下可以被理解的 因为它可以分成4个单词:‘what’, ‘is’, ‘your’, ‘name’,且每个单词都属于字典D,而文章‘whatisyouname’ 在字典D下不能被理解,但可以在字典D’=D+{‘you’}下被理解。这段文章的一个前缀‘whatis’,也可以在字典D下被理解 而且是在字典D下能够被理解的最长的前缀。 给定一个字典D,你的程序需要判断若干段文章在字典D下是否能够被理解。 并给出其在字典D下能够被理解的最长前缀的位置。
Input
输入文件第一行是两个正整数n和m,表示字典D中有n个单词,且有m段文章需要被处理。 之后的n行每行描述一个单词,再之后的m行每行描述一段文章。 其中1<=n, m<=20,每个单词长度不超过10,每段文章长度不超过1M。
Output
对于输入的每一段文章,你需要输出这段文章在字典D可以被理解的最长前缀的位置。
Sample Input
4 3
is
name
what
your
whatisyourname
whatisyouname
whaisyourname
is
name
what
your
whatisyourname
whatisyouname
whaisyourname
Sample Output
14
6
0
6
0
解题思路:
最长可理解前缀,可以认为是在Trie图匹配时维护一个bool型数组
记录匹配成功的单词,若此单词独立,就更新dp数组
代码:
#include<queue>
#include<cstdio>
#include<cstring>
#include<algorithm>
using std::max;
struct trnt{
int ch[];
int fl;
int fin;
}tr[];
char tmp[];
int ln[];
bool dp[];
int siz;
int n,m;
std::queue<int>Q;
void Insert(char *a,int k,int &len)
{
len=strlen(a+);
int root=;
for(int i=;i<=len;i++)
{
int c=a[i]-'a';
if(!tr[root].ch[c])
tr[root].ch[c]=++siz;
root=tr[root].ch[c];
}
tr[root].fin=k;
return ;
}
void Build()
{
int root=;
for(int i=;i<;i++)
if(tr[root].ch[i])
Q.push(tr[root].ch[i]);
while(!Q.empty())
{
root=Q.front();
Q.pop();
for(int i=;i<;i++)
{
if(tr[root].ch[i])
{
tr[tr[root].ch[i]].fl=tr[tr[root].fl].ch[i];
Q.push(tr[root].ch[i]);
}else
tr[root].ch[i]=tr[tr[root].fl].ch[i];
}
}
return ;
}
int Dp(char *a)
{
int len=strlen(a+);
for(int i=;i<=len;i++)
dp[i]=;
dp[]=;
int ans=;
int root=;
for(int i=;i<=len;i++)
{
int c=a[i]-'a';
root=tr[root].ch[c];
for(int j=root;j;j=tr[j].fl)
if(tr[j].fin&&dp[i-ln[tr[j].fin]])
{
dp[i]=true;
ans=max(ans,i);
break;
}
}
return ans;
}
int main()
{
scanf("%d%d",&n,&m);
for(int i=;i<=n;i++)
{
scanf("%s",tmp+);
Insert(tmp,i,ln[i]);
}
Build();
while(m--)
{
scanf("%s",tmp+);
printf("%d\n",Dp(tmp));
}
return ;
}