好吧,我放弃了。
我一直在胡思乱想,想办法从一个目标网站上检索数据,该网站的信息采用传统的中文编码(charset=gb2312)。
我一直像往常一样使用简单的HTML解析器,但它似乎没有返回中文字符,事实上我得到的只是嵌入在菱形形状中的一些奇怪的问号。
(就像这样)
声明php文件的编码除了去掉页面开头显示的一些不需要的字符之外,没有做任何事情。
我的意思是说:
header('Content-Type', 'text/html; charset=GB2312');
我找不到任何用中文写的数据,也试着用同样的运气。我可能漏掉了一些明显的东西,因为我在别处找不到任何相关的讨论。
提前谢谢。
最佳答案
您是否尝试过用mb_convert_encoding或iconv转换编码,例如。
$str = mb_convert_encoding($content, 'UTF-8', 'GB2312');
或
$str = iconv("UTF-8", "GB2312//IGNORE", $content);