我需要存储大量的twitter tweets
哪种数据库类型最适合tweets→best guess和TEXT
我也要防止重复。最好的猜测是avarchar(255)
可能UNIQUE key
字符应该有效,但我们也有中文字符?(会节省很多空间)
另一个想法是,将所有tweets存储为varchar(140)
并添加另一列,其中tweets散列为md5,并在该列上添加TEXT
。
问题:
存储tweets的最佳mysql类型是什么?
最佳答案
编辑
twitter不再根据140个字符的限制计算用户句柄,among other things,因此varchar(140)
不足以存储包含用户句柄的长tweets的全部内容。
然而,经过检查,我仍然不能超过140个字符时,提到另一个Twitter用户通过他们的句柄。
原始答案varchar(140)
格式。utf8
效率会非常低。TEXT
会浪费太多空间。
这并不支持我的答案,但在技术和效率上都是interesting reading。
关于mysql - 从Twitter存储推文的MySQL数据类型,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/10455652/