我正在使用twitter4j库访问公共twitter流。我正在尝试制作一个包含地理标记推文的项目,我需要收集大量的推文进行测试。
现在,我从Twitter获得未经过滤的流,并且只保存带有地理标签的Tweet。不过这很慢,因为VAST大多数推文都没有地理标签。我希望Twitter流仅向我发送带有地理标签的推文。
我尝试使用this question中提到的方法,在其中使用尺寸为360 * 180 *的边界框进行过滤,但这对我不起作用。使用该过滤器时,我没有收到任何错误,但仍然有99%的推文没有地理标签。这是我的做法:
ConfigurationBuilder cb = new ConfigurationBuilder();
cb.setDebugEnabled(true)
.setOAuthConsumerKey("censored")
.setOAuthConsumerSecret("censored")
.setOAuthAccessToken("censored")
.setOAuthAccessTokenSecret("censored");
TwitterStream twitterStream = newTwitterStreamFactory(cb.build()).getInstance();
StatusListener listener = new MyStatusListener();
twitterStream.addListener(listener);
//add location filter for what I hope is the whole planet. Just trying to limit
//results to only things that are geotagged
FilterQuery locationFilter = new FilterQuery();
double[][] locations = {{-180.0d,-90.0d},{180.0d,90.0d}};
locationFilter.locations(locations);
twitterStream.filter(locationFilter);
twitterStream.sample();
关于为什么我仍然收到没有地理标记的推文的任何建议?
编辑:我只是在将过滤器添加到Twitter流中重读了twitter4j javadoc,它说:“默认访问级别最多允许200个跟踪关键字,400个关注用户ID和10个1度位置框。”那么边界框可能只有1度宽?这与我遇到的原始信息不同。那是我的问题吗?我的过滤器请求太大,因此被忽略了吗?尝试使用时没有出现任何错误。
最佳答案
从过滤器流中获取,然后用示例流覆盖它。
删除最后一行:twitterStream.sample();