我正在编写一个ac程序,该程序需要一个单词的文本文件,并且仅复制没有大写或标点符号且长度为4个或更多字符的单词。我已经测试了布尔函数int containsPunctuationOrCaps(char * word)和int longThanThree(char * word)布尔函数,它们都可以工作。但是,我的主要功能只能打印至少七个字符的单词,以后的所有内容都会被截断。
int main() {
char *currentWord = malloc(36);
int count = 0;
char *Words[3000];
FILE *fin, *fout;
fin = fopen(INFILE,"r");
if (fin==NULL) {
printf("INPUT FILE NOT FOUND\n");
return 1;
}
while(fgets(currentWord, sizeof(currentWord), fin) != NULL) {
if(!containsPunctuationOrCaps(currentWord) && longerThanThree(currentWord)) {
Words[count]=currentWord;
printf("%s\n",currentWord);
count++;
}
}
fclose(fin);
}
当我改变
char * currentWord = malloc(36);
至
char currentWord [];
它什么也没读。我该如何工作?
最佳答案
您将currentWord
声明为char *
,它指向动态分配的内存。 sizeof
在编译时求值,并求值为currentWord
类型所需的大小(以字节为单位)-在您的情况下,存储内存地址/指针所需的大小(显然在您的内存中为8个字节)系统。由于fgets
会附加一个终止的\0
字节,因此fgets
调用仅读取7个字符。
您可以用char *currentWord = malloc(36);
替换free
(注意:您永远不会char currentWord[36];
分配的内存),这将导致至少读取35个字符。但是,fgets
始终尝试读取直到行尾(或直到缓冲区已满),因此,currentWord
数组将包含多个单词。
您可以在空格处分割currentWord
,但是这需要在缓冲区的末尾添加其他检查逻辑(currentWord
的末尾是单词/行的末尾,还是缓冲区刚满并且单词继续? )。完成所需操作的最简单方法可能是逐字符读取文件(使用getc
,但应确保使用缓冲的I / O,请参见setbuf
)。读取每个字符时,请检查它是单词还是非单词字符(或EOF)。在前一种情况下,您将附加到缓冲区,而在后一种情况下,将输出符合条件的单词,但首先添加一个\0
终止符。 currentWord
缓冲区应该是动态分配的(除非您知道字长的确定上限),并且如果当前正在读取的字长于分配的内存可以容纳的长度,则可能必须重新分配它。