我正在尝试在php中读取.doc .docx
文件。一切正常。但是在最后一行,我遇到了可怕的角色。请帮我。
这是某人开发的代码。
function parseWord($userDoc)
{
$fileHandle = fopen($userDoc, "r");
$line = @fread($fileHandle, filesize($userDoc));
$lines = explode(chr(0x0D),$line);
$outtext = "";
foreach($lines as $thisline)
{
$pos = strpos($thisline, chr(0x00));
if (($pos !== FALSE)||(strlen($thisline)==0))
{
} else {
$outtext .= $thisline." ";
}
}
$outtext = preg_replace("/[^a-zA-Z0-9\s\,\.\-\n\r\t@\/\_\(\)]/","",$outtext);
return $outtext;
}
$userDoc = "k.doc";
这是屏幕截图。
最佳答案
DOC文件不是plain text。
尝试使用诸如PHPWord(old CodePlex site)之类的库。
nb:该答案已多次更新,因为PHPWord更改了托管和功能。
关于php - 在PHP中读取DOC文件,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/7358637/