我有以下变量内容:
$content_content = '“I can’t do it, she said.”';
我想对其中的每个“单词”进行 preg_match,包括收缩,所以我使用 preg_match 如下:

 if (preg_match_all('/([a-zA-Z0-9’]+)/', $content_content, $matches))
 {
    echo '<pre>';
    print_r($matches);
    echo '</pre>';
 }

然而,似乎通过在正则表达式中包含 ’,它也捕获了双引号,如上面的命令输出:
Array
(
    [0] => Array
        (
            [0] => ��
            [1] => I
            [2] => can’t
            [3] => do
            [4] => it
            [5] => she
            [6] => said
            [7] => ��
        )

    [1] => Array
        (
            [0] => ��
            [1] => I
            [2] => can’t
            [3] => do
            [4] => it
            [5] => she
            [6] => said
            [7] => ��
        )

)

我怎么能包括 ' 而不包括“和”?

最佳答案

这是因为您在字符集中使用的“花哨”撇号是以二进制形式处理的;您需要使用其各自的 modifier 启用 Unicode 模式:

preg_match_all('/([a-zA-Z0-9’]+)/u', $content_content, $matches)

Demo

关于PHP preg_match 将花括号与其他类型的花括号不匹配。如何避免?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/27264053/

10-11 06:22