,所以首先让我看看我是否正确:
字符集是一组符号和编码。排序规则是一组用于比较字符集中的字符的规则。
我应该使用utf8mb4,因为mysql utf8是一个欺诈,最多3个字节,而不是PHP中真正的最多4个字节的实际utf8字符集。
因此,utf8mb4是一个字符集,而utf8mb4_unicode_ci/utf8mb4_bin是他的许多可用归类中的2个。
utf8_unicode_ci进行不区分大小写的比较和其他特殊的比较(例如,我听说它把法语中的所有重音弄乱了)。 utf8_bin区分大小写,因为它比较字符的二进制值。
现在的问题:
SELECT name FROM table WHERE BINARY name = 'MyNaMEiSFUlloFUPPERCases';
SELECT name FROM table WHERE LOWER(name) LIKE '%myname%'
谢谢 :)
最佳答案
您“把事情做好了”吗?是的,除了我认为utf8mb4_unicode_520_ci中的法语口音是“正确”的。
您的两个SELECTs
都将进行全表扫描,因此效率低下。原因是您要覆盖排序规则(对于#1)或将列隐藏在函数中(对于#2来说是LOWER
),或使用前导通配符(LIKE %...
)。
如果您想提高效率,请将name
声明为COLLATION utf8mb4_bin
,然后简单地进行WHERE name = ...
即可。
您是否认为其中的某些等价方式和顺序对法语“不正确”?
A=a=ª=À=Á=Â=Ã=Ä=Å=à=á=â=ã=ä=å=Ā=ā=Ą=ą Aa ae=Æ=æ az B=b C=c=Ç=ç=Ć=ć=Č=č ch cz
D=d=Ð=ð=Ď=ď dz E=e=È=É=Ê=Ë=è=é=ê=ë=Ē=ē=Ĕ=ĕ=Ė=ė=Ę=ę=Ě=ě F=f fz ƒ G=g=Ğ=ğ=Ģ=ģ
gz H=h hz I=i=Ì=Í=Î=Ï=ì=í=î=ï=Ī=ī=Į=į=İ ij=ij iz ı J=j K=k=Ķ=ķ
L=l=Ĺ=ĺ=Ļ=ļ=Ł=ł lj=LJ=Lj=lj ll lz M=m N=n=Ñ=ñ=Ń=ń=Ņ=ņ=Ň=ň nz
O=o=º=Ò=Ó=Ô=Õ=Ö=Ø=ò=ó=ô=õ=ö=ø oe=Œ=œ oz P=p Q=q R=r=Ř=ř S=s=Ś=ś=Ş=ş=Š=š sh
ss=ß sz T=t=Ť=ť TM=tm=™ tz U=u=Ù=Ú=Û=Ü=ù=ú=û=ü=Ū=ū=Ů=ů=Ų=ų ue uz V=v W=w X=x
Y=y=Ý=ý=ÿ=Ÿ yz Z=z=Ź=ź=Ż=ż=Ž=ž zh zz Þ=þ µ
More utf8 collations。
8.0 and utf8mb4 collations。
“520”(较新的)版本未将
Æ
,Ð
,Ł
和Ø
视为单独的“字母”,以及其他可能的东西。关于php - utf8mb4_unicode_ci与utf8mb4_bin,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/37364618/