@description@
给定一个字符串 s 与正整数 k。现在你需要进行恰好一次操作:
(1)将 s 切割成最多 k 个子串。即令 s = t1 + t2 + ... + tm (1 <= m <= k)。
(2)将其中的某些(不是全部) ti 翻转,得到 t1', t2', ... tm'。
(3)重新拼合得到 s' = t1' + t2' + ... tm'。
求字典序最小化的 s'。
@solution@
先考虑假如可以任意划分,而没有段数的限制的话该怎么做。
注意到一个不翻转的子串可以拆解成若干个长度为 1 的翻转的子串,也就是说我们可以总默认所有子串都要翻转。
考虑将原串 \(S\) 翻转得到 \(S^r\),则我们可以将操作等效地理解成将 \(S^r\) 划分成若干子串,然后从后往前取出这些串拼合得到 \(S'\)。
要使 \(S'\) 的字典序最小,不难联想到 lyndon 分解:\(S^r\) 的 lyndon 分解就是我们想要的答案(默认大家都会,不会可以百度.jpg)。
假如加上 k 的限制,注意到当 k > 2 时我们依然可以贪心地取出最末尾的 lyndon 串。
直观理解的话,大概就是这么做不会影响之后操作的合法性。
注意到长度为 1 的 lyndon 串我们可以一起取出(对应不翻转的情况),长得一样的 lyndon 串我们也可以一起取出(一起翻转和分别翻转的结果一样)。
(这里有一个处理的 trick:考虑 lyndon 分解的过程,在 lyndon 分解的时候我们就可以把长得一样的串处理出来)
接下来考虑 k <= 2 的情况。k = 1 没什么话说,主要说一下 k = 2。
分几种情况:
(1)划分线前后的串都不翻转。情况唯一。
(2)划分线前的串不翻转,划分线后的串翻转。发现得到的 \(S'\) = \(S\) 的一个前缀 + \(S^r\) 的一个前缀。
比较字典序时可以用求 lcp 的方法比较。注意到只需要求某个子串和 \(S^r\) 的 lcp,所以把 \(S^r \#S\) 拿去建 \(Z-algorithm\)(扩展 kmp)就 OK。
(3)划分线前的串翻转。此时划分线前的串是 \(S^r\) 的一个后缀 \(T\)。
我们先要让划分线前字典序最小,至少要满足 \(T\) 的所有后缀要么字典序严格大于 \(T\),要么是 \(T\) 的前缀。
考虑依然对 \(S^r\) 进行 lyndon 分解,则 \(T\) 应该是末尾几个完整的 lyndon 串拼合,不然矛盾。
经过分析,满足上述条件的情况下,\(T\) 最多包含两种不同 lyndon 串。同时为了字典序最小,假如 \(T\) 包含了某一种 lyndon 串,就应包含所有与它相同的串。
再讨论后面要不要翻转,一共 4 种情况,暴力求出来比较字典序即可。
@accepted code@
#include <cstdio>
#include <cstring>
#include <algorithm>
using namespace std;
const int MAXN = 5000000;
void solve1(char *S) {
int lenS = strlen(S);
for(int i=0,j=lenS-1;i<j;i++,j--)
if( S[i] < S[j] ) break;
else if( S[i] > S[j] ) {
for(i=0,j=lenS-1;i<j;i++,j--)
swap(S[i], S[j]);
break;
}
puts(S);
}
void lyndon(char *S, int *f, int lenS) {
int cnt = 0;
for(int i=0;i<lenS;i++) f[i] = 0;
for(int i=0;i<lenS;) {
int j = i, k = i + 1;
while( k < lenS && S[j] <= S[k] )
j = (S[j] == S[k] ? j + 1 : i), k++;
int t = k - j; cnt++;
while( i + t - 1 < k )
f[i + t - 1] = cnt, i += t;
}
}
void algorithmZ(char *S, int *f, int lenS) {
f[0] = lenS; int mx = 0, ps = 0;
for(int i=1;i<lenS;i++) {
f[i] = (i <= mx ? min(mx - i + 1, f[i - ps]) : 0);
while( S[f[i]] == S[i+f[i]] ) f[i]++;
if( i + f[i] - 1 > mx ) mx = i + f[i] - 1, ps = i;
}
}
char ans[MAXN + 5], T[2*MAXN + 5]; int f[2*MAXN + 5];
int cmp(int l, int r) {
int p = f[l];
if( p >= r - l + 1 ) return 0;
else return (T[l + p] < T[p] ? -1 : 1);
}// (s[l, r] == s[0, r-l] ? 0 : (s[l, r] < s[0, r-l] ? -1 : 1))
bool cmp2(char *S, char *T, int n) {
for(int i=0;i<n;i++) {
if( S[i] < T[i] ) return true;
else if( S[i] > T[i] ) return false;
}
return true;
}// S < T
void update(char *T, int lenS) {
if( cmp2(T, ans, lenS) ) for(int i=0;i<lenS;i++) ans[i] = T[i];
}
int get(int x) {
int p; for(p = x - 1; p >= 0 && f[p] == 0; p--);
return p;
}
void update2(char *S, int x, int lenS) {
for(int i=0;i<x;i++) T[i] = S[x-i-1];
for(int i=x;i<lenS;i++) T[i] = S[i];
update(T, lenS);
for(int i=x,j=lenS-1;i<j;i++,j--) swap(T[i], T[j]);
update(T, lenS);
}
void solve2(char *S) {
int lenS = strlen(S);
for(int i=0;i<lenS;i++) ans[i] = S[i];
for(int i=0;i<lenS;i++) T[lenS-i-1] = S[i], T[lenS+i+1] = S[i];
algorithmZ(T, f, 2*lenS+1);
int pos = 0;
for(int i=1;i<lenS-1;i++) {
int t = cmp(lenS + 1 + pos + 1, lenS + 1 + i);
if( t == 0 ) {
if( cmp(i - pos, lenS - pos - 2) == 1 ) pos = i;
}
else if( t == -1 ) pos = i;
}
for(int i=0;i<lenS;i++) T[i] = S[i];
for(int i=pos+1,j=lenS-1;i<j;i++,j--) swap(T[i], T[j]);
update(T, lenS);
for(int i=0;i<lenS;i++) T[lenS-i-1] = S[i];
lyndon(T, f, lenS);
int tmp = get(lenS - 1);
while( tmp >= 0 && f[tmp] == f[lenS - 1] ) tmp = get(tmp);
update2(S, lenS - tmp - 1, lenS);
if( tmp >= 0 ) {
int p = get(tmp);
while( p >= 0 && f[p] == f[tmp] ) p = get(p);
update2(S, lenS - p - 1, lenS);
}
puts(ans);
}
void print(int l, int r) {
for(int i=l;i<=r;i++)
putchar(T[i]);
}
char S[MAXN + 5];
int main() {
int k; scanf("%s%d", S, &k);
if( k == 1 ) solve1(S);
else {
int lenS = strlen(S);
for(int i=0;i<lenS;i++) T[lenS-i-1] = S[i];
lyndon(T, f, lenS);
int lst = lenS - 1, len = 0, tmp = 0;
while( k >= 2 && lst >= 0 ) {
int p = get(lst);
if( !(len == 1 && lst - p == 1) && !(f[lst] == tmp) ) {
if( k == 2 ) break;
k--;
}
print(p + 1, lst);
len = lst - p, tmp = f[lst], lst = p;
}
if( lst >= 0 ) solve2(S + (lenS - lst - 1));
}
}
@details@
直觉猜想和 lyndon 分解有关,然而想不到怎么处理 k = 2 的情况。。。
感觉考察了两个冷门的线性字符串算法。。。而且两个都是初见。。。
另外,正确性的证明什么的。。。