我正在尝试在php中读取.doc .docx文件。一切正常。但是在最后一行,我遇到了可怕的角色。请帮我。
这是某人开发的代码。

    function parseWord($userDoc)
{
    $fileHandle = fopen($userDoc, "r");
    $line = @fread($fileHandle, filesize($userDoc));
    $lines = explode(chr(0x0D),$line);
    $outtext = "";
    foreach($lines as $thisline)
      {
        $pos = strpos($thisline, chr(0x00));
        if (($pos !== FALSE)||(strlen($thisline)==0))
          {
          } else {
            $outtext .= $thisline." ";
          }
      }
     $outtext = preg_replace("/[^a-zA-Z0-9\s\,\.\-\n\r\t@\/\_\(\)]/","",$outtext);
    return $outtext;
}

$userDoc = "k.doc";

这是屏幕截图。

最佳答案

DOC文件不是plain text

尝试使用诸如PHPWord(old CodePlex site)之类的库。

nb:该答案已多次更新,因为PHPWord更改了托管和功能。

关于php - 在PHP中读取DOC文件,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/7358637/

10-13 01:18