我们注意到我们的应用程序中有一个关于绑定参数的奇怪行为。我们使用Java和JDBC来连接到Sql Server数据库。在表单元格中,我们具有值“ µ”,并将其与绑定参数(也设置为值“ µ”)进行比较。
现在,在诸如“ ... where value!=?”的sql语句中,其中“ value”是数据库中“ µ”的值,而?绑定变量(也设置为“ µ”),我们注意到我们得到了一条记录,尽管我们希望“ µ”等于“ µ”。
我们用于填充bind参数的方法是java.sql.PreparedStatement.setString(int,String)。
Some facts:
µ在不同编码中的字符值为:
ASCII (ISO-8859-1) : 0xB5
UTF-8 : 0xC2B5
UTF-16 (= Java) : 0x00B5
现在,我进行了一些调查,以查看数据库实际看到的字节。因此,我尝试了这样的sql语句:
select convert(VARBINARY(MAX), value), -- selects µ from database table
convert(VARBINARY(MAX), N'µ'), -- selects µ from literal
convert(VARBINARY(MAX), ?) -- selects µ from bind parameter
from ...
这三个值的结果是:
B500
B500
C200B500 <-- Here is the problem!
因此,数据库中µ的内部表示形式以及作为NVARCHAR文字的形式是B500。
现在我们不明白这里发生了什么。我们在Java变量中具有“ µ”的值(内部应为0x00B5)。当将其作为绑定变量传递时,似乎就好像它已转换为UTF-8(这使字节序列为0xC2B5)一样,然后数据库将其视为两个字符对待,从而使它成为字符序列C200B500。
使事情变得更加混乱:
(1)在具有不同数据库的另一台机器上,相同的代码按预期工作。这三行的结果是B500 / B500 / B500,因此将绑定变量转换为适当的B500。
(2)在同一台机器上,相同的数据库但不同的程序(但使用相同的jdbc驱动程序库和相同的连接参数)也可以按预期工作,得出B500 / B500 / B500的结果。
一些其他事实,也许它们很重要:
该数据库是Sql Server 2014
Java是Java 7
有问题的应用程序是在Tomcat 7中运行的Webapp。
Jdbc库是sqljdbc 4.2
非常感谢您帮助解决此问题!
最佳答案
我现在找到了解决方案。它根本与Sql Server或绑定无关,而是...
默认情况下,Tomcat 7不在UTF-8模式下运行(我当时并不知道)。我们所说的µ来自另一个通过Web服务调用提供此值的应用程序。但是,此应用程序默认使用UTF-8。因此,它正在发送UTF-8 µ,但是Web服务并不期望UTF-8,并认为它将是两个字符,并像这样对待它们,用0xC2和0xB5的字符填充内部String变量(这是,对于Sql Server,则为C200B500)。