我正在卷曲一个网站并将其写入.json文件;此文件输入到我的Java代码中,该代码使用json库解析该文件,并将必要的数据写回到CSV文件中,以后我将其存储在数据库中。
如您所知,来自网站的数据可以采用不同的格式,因此我确保以UTF-8
格式进行读写,但仍然会得到错误的输出。
例如,Østerriksk
变为�sterriksk
。
我正在Linux中进行所有这些操作。我认为存在一些编码问题,因为相同的代码在Windows中可以正常运行,但在Unix / Linux中则不能。
我很确定我的Java代码正确,但是我无法找出我做错了什么。
最佳答案
您正在按照ISO 8859-1读取数据,但文件实际上是UTF-8。我认为文件阅读器有一个参数(或设置)可以解决这个问题。
另外:curl不会在乎编码。 Java代码中确实存在错误。