我正在编写一个ac程序,该程序需要一个单词的文本文件,并且仅复制没有大写或标点符号且长度为4个或更多字符的单词。我已经测试了布尔函数int containsPunctuationOrCaps(char * word)和int longThanThree(char * word)布尔函数,它们都可以工作。但是,我的主要功能只能打印至少七个字符的单词,以后的所有内容都会被截断。

int main() {
  char *currentWord = malloc(36);
  int count = 0;
  char *Words[3000];
  FILE *fin, *fout;

  fin = fopen(INFILE,"r");
  if (fin==NULL) {
    printf("INPUT FILE NOT FOUND\n");
    return 1;
  }
  while(fgets(currentWord, sizeof(currentWord), fin) != NULL) {
    if(!containsPunctuationOrCaps(currentWord) && longerThanThree(currentWord)) {
    Words[count]=currentWord;
    printf("%s\n",currentWord);
    count++;
    }
  }
  fclose(fin);
}


当我改变
     char * currentWord = malloc(36);

    char currentWord [];
它什么也没读。我该如何工作?

最佳答案

您将currentWord声明为char *,它指向动态分配的内存。 sizeof在编译时求值,并求值为currentWord类型所需的大小(以字节为单位)-在您的情况下,存储内存地址/指针所需的大小(显然在您的内存中为8个字节)系统。由于fgets会附加一个终止的\0字节,因此fgets调用仅读取7个字符。

您可以用char *currentWord = malloc(36);替换free(注意:您永远不会char currentWord[36];分配的内存),这将导致至少读取35个字符。但是,fgets始终尝试读取直到行尾(或直到缓冲区已满),因此,currentWord数组将包含多个单词。

您可以在空格处分割currentWord,但是这需要在缓冲区的末尾添加其他检查逻辑(currentWord的末尾是单词/行的末尾,还是缓冲区刚满并且单词继续? )。完成所需操作的最简单方法可能是逐字符读取文件(使用getc,但应确保使用缓冲的I / O,请参见setbuf)。读取每个字符时,请检查它是单词还是非单词字符(或EOF)。在前一种情况下,您将附加到缓冲区,而在后一种情况下,将输出符合条件的单词,但首先添加一个\0终止符。 currentWord缓冲区应该是动态分配的(除非您知道字长的确定上限),并且如果当前正在读取的字长于分配的内存可以容纳的长度,则可能必须重新分配它。

09-19 06:03