我正在创建一种算法,该算法生成从0到9999的数字(数字,如字符串),并在数组a [50000]中搜索其频率。
char key[4];
int freq;
for (int i = 0; i < 10000; i++) {
sprintf(key,"%04i",i); // save 4 digits in key, if i <1000 save leading 0's
freq = BruteForceStringMatch(key,a,n); //n length of a.
printf("%s-%i\n",key,freq);
}
free(a);
但是,当我运行该程序时,我得到了它。
.
.
.
9845-7
9846
-10
9847-4
9848-5
-139
9850-3
9851-6
9852-5
9853-4
9854-2
9855-7
9856-5
9857-4
9858-5
9859 -9
9860-3
.
.
.
9968-6
9969 -9
9970-5
9971-4
9972-7
9973-6
9974-6
9975-2
9976-7
9977-4
9978-2
9979-7
9980-3
9981-4
9982-3
9983 -9
9984-6
9985-7
998-8
9987 -9
9988-3
9989 -9
9990-4
9991-3
9992-5
9993-2
9994 -9
9995-5
9996-6
9997-7
9998-7
在随机位置上有制表符,有时键的最后一位被删除,还有139,113等,我不知道它们从何而来。我正在使用gcc版本5.4.0(GCC),并使用Windows 10和终端babun进行编译。
更多信息:
BruteForceStringMatch搜索a中的键的频率。
int BruteForceStringMatch(char key[4], char* a, int length ){
int freq=0;
int k;
for (int j = 0; j < length -4; j++) {
k =0;
while(k <4 && key[k] == a[j+k])
k=k+1;
if(k == 4)
freq++;
}
return freq;
}
我从一个具有5000位数的文件中获得了一个。
FILE *inputfile;
char c;
int largo = 0;
char *a = (char *)malloc(50000*sizeof(char *));;
char *b = (char *)malloc(50000*sizeof(char *));;
inputfile = fopen("archivo_1.tex", "r");
if (inputfile == NULL) {
fprintf(stderr, "Failed to open the file.\n");
exit(1);
}
if (inputfile) {
for ( int i=0; (c = getc(inputfile)) != EOF; i++){
a[i] = c;
//putchar(a[i]);
largo++;
}
fclose(inputfile);
}
最佳答案
在我看来,您的问题是您将“键”定义为仅四个字符,而应为五个-四位数字加上终止的null。这样null就会出现在“ freq”的第一个字节中……然后,在第5行中设置“ freq”时,printf(在第6行)会将该值视为“键”字符串的一部分。特别是,您可以在输出中看到值9859和8859,其中“ freq”的值恰好是9,这是制表符的ASCII代码。另外,对于值9846和“ freq”为10(恰好是换行符(即换行符)的ASCII值),在9849上,“ freq”为13(即回车),因此打印“ -13”在9849的前三个字符中。