我有一个.csv文件。 csv文件中的每一行都包含文本和日期(也按日期排序)字段。通过迭代csv文件,我们计算每个日期的词频,并将词频发送到客户端,并使用html显示它们。
我正在使用Python3,Flask和Flask-SocketIO,但是仅显示最后日期的单词频率。调试信息可以在Pastebin LINK中看到。从调试信息来看,直到迭代结束,SocketIO似乎一直在发出事件而没有在客户端接收任何数据。我想要的是在迭代过程中发送和接收每个数据,因此我可以在客户端实时更新单词频率。使用SocketIO时我做错什么了吗?
感谢您的任何建议。
对于JavaScript:
$(document).ready(function(){
//connect to the socket server.
var socket = io.connect('http://' + document.domain + ':' + location.port + '/test');
//receive details from server
socket.on('connect', function() {
socket.emit('my_event', {data: 'I\'m connected!'});
});
socket.on('new_count', function(msg) {
console.log("Received count");
//get data
var tags = msg.data;
console.log(tags[0].key);
numbers_string = '';
for (var i = 0; i < tags.length; i++){
numbers_string = numbers_string + '<p>' + tags[i].key + ': ' + tags[i].value + '</p>';
}
$('#vis').html(numbers_string);
socket.emit("my_event", {data: "one update received!"});
});
});
对于Python代码:
day=""
@socketio.on('connect', namespace="/test")
def test_connect():
global day
print("clinet connected")
with open("static/sorted_examples.csv", 'r') as f:
reader = csv.DictReader(f)
day = ""
words = []
for row in reader:
text = row['text']
date_day = row['date_day']
words += text.split()
if date_day != day:
day = date_day
word_count = Counter(words).most_common(20)
words[:] = []
emit_data = [dict([("key", k), ("value", v)]) for k, v in word_count]
socketio.emit('new_count', {"data": emit_data}, namespace='/test')
最佳答案
该答案假定您正在使用实现协作式多任务处理的eventlet或gevent。emit()
调用是异步进行的,这意味着在eventlet或gevent下,如果希望由适当的后台线程立即对其进行处理,则需要释放CPU。
这实际上非常简单,只需在socketio.sleep(0)
之后添加一个emit()
。如果发现这对性能的影响太大,则可以选择每隔一个或更多个其他循环睡眠一次。基本上,您需要找到合适的平衡点。