我有以下变量内容:$content_content = '“I can’t do it, she said.”';
我想对其中的每个“单词”进行 preg_match,包括收缩,所以我使用 preg_match 如下:
if (preg_match_all('/([a-zA-Z0-9’]+)/', $content_content, $matches))
{
echo '<pre>';
print_r($matches);
echo '</pre>';
}
然而,似乎通过在正则表达式中包含 ’,它也捕获了双引号,如上面的命令输出:
Array
(
[0] => Array
(
[0] => ��
[1] => I
[2] => can’t
[3] => do
[4] => it
[5] => she
[6] => said
[7] => ��
)
[1] => Array
(
[0] => ��
[1] => I
[2] => can’t
[3] => do
[4] => it
[5] => she
[6] => said
[7] => ��
)
)
我怎么能包括 ' 而不包括“和”?
最佳答案
这是因为您在字符集中使用的“花哨”撇号是以二进制形式处理的;您需要使用其各自的 modifier 启用 Unicode 模式:
preg_match_all('/([a-zA-Z0-9’]+)/u', $content_content, $matches)
Demo
关于PHP preg_match 将花括号与其他类型的花括号不匹配。如何避免?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/27264053/