题目说明:
今日的一些高阶程式语言对于字串的处理支援越来越强大(例如Java、C#、Perl等),不过字串搜寻本身仍是个值得探讨的课题,在这边以Boyer- Moore法来说明如何进行字串说明,这个方法快且原理简洁易懂。
题目解析:
串搜寻本身不难,使用暴力法也可以求解,但如何快速搜寻字串就不简单了,传统的字串搜寻是从关键字与字串的开头开始比对,例如 Knuth-Morris-Pratt 演算法 字串搜寻,这个方法也不错,不过要花时间在公式计算上;Boyer-Moore字串核对改由关键字的后面开始核对字串,并制作前进表,如果比对不符合则依前进表中的值前进至下一个核对处,假设是p好了,然后比对字串中p-n+1至p的值是否与关键字相同。
如果关键字中有重复出现的字元,则前进值就会有两个以上的值,此时则取前进值较小的值,如此就不会跳过可能的位置,例如texture这个关键字,t的前 进值应该取后面的3而不是取前面的7。
程序代码:
#include<iostream>
#include<string.h> using namespace std; int SkipTbl[256]; void BuildSkipTable(char* input)
{
int length = strlen(input);
for (int i=0; i < 256; ++i)
{
SkipTbl[i] = length;
} for (int i=0; i < length - 1; ++i)
{
SkipTbl[input[i]] = length - i - 1;
}
} int Search(int pos, char* input, char* key)
{
int n = strlen(input);
int m = strlen(key); while (pos < n)
{
if (memcmp(input+pos-m+1, key, m)==0)
{
return pos - m + 1;
} pos += SkipTbl[input[pos]];
} return -1;
} int main()
{
char input[100] = {0};
char key[10] = {0};
cin.getline(input, 100);
cin.getline(key, 10); int m = strlen(key);
BuildSkipTable(key); int pos = Search(m-1, input, key);
while (-1 != pos)
{
cout << "Search, index=" << pos <<endl;
pos = Search(pos+m+1, input, key);
} return 0;
}