HihoCoder#1052:基因工程
时间限制:1000ms
单点时限:1000ms
内存限制:256MB
描述
小Hi和小Ho正在进行一项基因工程实验。他们要修改一段长度为N的DNA序列,使得这段DNA上最前面的K个碱基组成的序列与最后面的K个碱基组成的序列完全一致。
例如对于序列"ATCGATAC"和K=2,可以通过将第二个碱基修改为"C"使得最前面2个碱基与最后面两个碱基都为"AC"。当然还存在其他修改方法,例如将最后一个碱基改为"T",或者直接将最前面两个和最后面两个碱基都修改为"GG"。
小Hi和小Ho希望知道在所有方法中,修改碱基最少的方法需要修改多少个碱基。
输入
第一行包含一个整数T(1 <= T <= 10),代表测试数据的数量。
每组测试数据包含2行,第一行是一个由"ATCG"4个大写字母组成的长度为N(1 <= N <= 1000)的字符串。第二行是一个整数K(1
<= K <= N)。
输出
对于每组数据输出最少需要修改的碱基数量。
样例输入
2
ATCGATAC
2
ATACGTCT
6
样例输出
1
3
貌似自己很少做这种没有任何提示的题,之前做的也都感觉很简单。
话说人家的技术博客全是技术总结,我这怎么全是个人感受呢?
字符串操作题目,我自己是把情况分成了两种,如果输入的数字*2还小于等于字符串的长度,这种比较简单,从前往后比较即可,有多少个不同,result就加多少。
复杂的在后一种,比方说
ABCDAB
4
这种比较是
ABCD
与CDAB比较
实际上就是字符串中的
0位与2位
1位与3位
2位与4位
3位与5位
比较。
之后的想法是把0 2 4 这样的分成一组,1 3 5这样的分成一组,因为这些的值都要相等,比如0 2 4位分别是A C A,只需把2中的C变为A就行,实际上就是在这个组中要想相等就要少数服从多数,所以对于每组来说,求出每组出线最多的元素的次数,总的元素数-最多的次数,意思就是让其他组员屈服,都等于我的值。
代码:
#include <iostream>
#include <string>
#include <cstring>
#include <vector>
#include <algorithm>
#include <iterator> using namespace std; string test;
int fenge; int R(vector<char> a)
{
int start=a.size();
int count;
int b[27];
memset(b,0,sizeof(b));
int max=0;
for(count=0;count<start;count++)
{
b[a[count]-'A']++;
if( b[a[count]-'A']>max)
max=b[a[count]-'A'];
}
return start-max;
} void jiandan()
{
int start = test.length()-fenge;
int count;
int result=0; for(count=0;count<fenge;count++,start++)//找最多元素的出现的次数
{
if(test[count]!=test[start])
{
result++;
}
}
cout<<result<<endl;
} void fuza()
{
int start=test.length()-fenge;
int len=test.length();
int fenshu=len-fenge;
int count;
vector<char> a;
int result=0; for(count=0;count<fenshu;count++)
{
int temp = count;
while(temp<len)//分组,一组中的元素要统一相等
{
a.push_back(test[temp]);
temp=temp+fenshu;
}
result+=R(a);
a.clear();
}
cout<<result<<endl;
} int main()
{
int count;
cin>>count;
while(count--)
{
cin>>test;
cin>>fenge; if(test.length()>=2*fenge)
{
jiandan();
}
else
{
fuza();
}
} return 0;
}
版权声明:本文为博主原创文章,未经博主允许不得转载。