题目来源:基因工程

解题思路:假设基因序列长度为N,则需要计算基因序列前K个和后K个相同所需要的最少改变次数sum。

假设基因序列为 ATACGTCT (即M=8),K=6;interval=M-K=2;

0  1  2  3  4  5  6  7

sq1    A  T  A C  G  T  C  T

sq2    A  C G T   C  T

从上图可以看出,标有相同彩色的字符相同,sq1的下标为0的字符与sq2的下标为0的字符相同,即 sq1[0]==sq1[2],由此可以得出sq1[i]==sq1[i+interval],其中0<=i<=interval,因此此题可以转化为求要想使字符 sq1[i],sq1[i+interval],sq1[i+interval*2],... 全部变成相同字符,需要改变多少次。解决这个问题就很简单了,只需要分别统计所有字符出现的次数,然后用总数total减去字符出现最多的次数max,即temp=total-max;最后将所有的temp求和。

具体算法(Java版,直接AC)

 import java.util.Scanner;

 public class Main {

     public static void main(String[] args) {
Scanner scanner = new Scanner(System.in);
int T = scanner.nextInt();
while (T > 0) {
String gene = scanner.next();
int K = scanner.nextInt();
int interval = gene.length() - K;
int sum = 0;
for (int i = 0; i < interval; i++) {
int[] count = new int[4];//用来统计出现的次数
for (int j = i; j < gene.length(); j += interval) {
if (gene.charAt(j) == 'A') {
count[0]++;
} else if (gene.charAt(j) == 'T') {
count[1]++;
} else if (gene.charAt(j) == 'C') {
count[2]++;
} else if (gene.charAt(j) == 'G') {
count[3]++;
}
}
int total = 0, max = 0;
for (int j = 0; j < 4; j++) {
total += count[j];
max = max > count[j] ? max : count[j];
}
sum += total - max;
}
System.out.println(sum);
T--;
}
}
}
05-11 21:58