我正在尝试从unicode提供的unihan.zip文件构建一个包含中文unicode数据的数据库。

但是,该文件仅提供分配的十六进制代码点中的字符。 (例如“ U + 547D”)。

我的想法是,在将其保存为CSV UTF-8格式之前,将其中的每个代码点(例如“ U + 547D”)手动转换(使用excel?)转换为“命中”,以使用phpmyadmin导入到我知道有效的mysql中。

只是想知道phpmyadmin或mysql是否能够接受此十六进制代码点格式作为导入此数据的更直接方法?

我已经搜索了很多这个答案,但是没有找到任何答案。我也尝试过以多种方式导入它,例如使用char函数,但是该表仅用“ 0x547D”而不是“命中”进行了更新。

任何对此的见解和帮助将不胜感激。

最佳答案

您可能要使用PHP将“ 0x547D”转换为十进制,然后创建utf-8格式的字符(如“命中”),然后再将数据保存到数据库中。如果是这样,请查看Portable-utf8.php库,其中包括utf8_chr()函数。

顺便说一句,谢谢您让我知道unihan.zip ...我正在寻找汉字的免费又好源。

关于php - 使用phpmyadmin将Unicode十六进制代码点数据导入MySQL,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/25641099/

10-10 01:37
查看更多