我正在抓取某些站点,并具有要转换为纯文本以存储在数据库中的ASCII文本。例如我想要

I have got to tell anyone who will listen that this is
one of THE best adventure movies I've ever seen.
It's almost impossible to convey how pumped I am
now that I've seen it.

转换成
I have got to tell anyone who will listen that this is
one of THE best adventure movies I've ever seen. It's
almost impossible to convey how pumped I am now that
I've seen it.

我用手指搜寻了血腥的手指,有什么帮助吗?

最佳答案

您可以使用 html_entity_decode :

echo html_entity_decode('...', ENT_QUOTES, 'UTF-8');

几点注意事项:
  • 请注意,您似乎实际上是想从HTML编码的字符串(具有之类的实体)转换为ASCII AKA纯文本。
  • 此示例将转换为UTF-8,它是所有ASCII字符(即,字符代码低于128的ASCII兼容字符编码)。如果您确实希望使用纯ASCII码(从而丢失所有带重音的字符和外语字符),则应分别剥离所有有问题的字符。
  • 为了保持与不同PHP版本的兼容性,必须使用最后一个参数('UTF-8'),因为自PHP 5.4.0起默认值已更改。

  • 更新:Example with your text in ideone

    Update2:通过@Daan的建议将ENT_COMPAT更改为ENT_QUOTES。

    关于php - 在PHP中将ASCII转换为纯文本,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/10595691/

    10-09 20:35
    查看更多