问题描述
我有包含数百万条推文的推文 ID 的大型 tsv 文件,我想在 R 中对其进行内容分析.如何将推文的元数据(消息、用户、日期等)放入数据集而不使用查找每条推文?
I have large tsv-files containing the tweet-IDs of millions of tweets which I would like to content analyze in R. How do I get the meta data of the tweets (message, user, date etc) into a dataset without looking up every individual tweet?
我知道这在 Python 中是可能的,是否也可以在 R 中完成,因为我不太了解 Python.是否有用于此目的的 R 包?
I know this is possible in Python, is it also possible to do it in R since I do not know Python well. Is there a R package for this purpose?
推荐答案
如果您使用 rTweet 库(通常比 twitteR 更受欢迎,因为后者不再维护),您可以使用 lookup_statuses
函数来获取大量推文的元数据.
If you use the rTweet library (which is usually preferred over twitteR, as the latter is no longer maintained), you can use the lookup_statuses
function to get the metadata for large batches of Tweets.
这篇关于如何从 R 中的推文 ID 下载推文文本?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!