我有一个.csv文件。 csv文件中的每一行都包含文本和日期(也按日期排序)字段。通过迭代csv文件,我们计算每个日期的词频,并将词频发送到客户端,并使用html显示它们。

我正在使用Python3,Flask和Flask-SocketIO,但是仅显示最后日期的单词频率。调试信息可以在Pastebin LINK中看到。从调试信息来看,直到迭代结束,SocketIO似乎一直在发出事件而没有在客户端接收任何数据。我想要的是在迭代过程中发送和接收每个数据,因此我可以在客户端实时更新单词频率。使用SocketIO时我做错什么了吗?

感谢您的任何建议。

对于JavaScript:

$(document).ready(function(){
    //connect to the socket server.
    var socket = io.connect('http://' + document.domain + ':' +     location.port + '/test');

    //receive details from server
    socket.on('connect', function() {
        socket.emit('my_event', {data: 'I\'m connected!'});
    });

    socket.on('new_count', function(msg) {
        console.log("Received count");
        //get data
        var tags = msg.data;
        console.log(tags[0].key);
        numbers_string = '';
        for (var i = 0; i < tags.length; i++){
            numbers_string = numbers_string + '<p>' + tags[i].key + ': ' +    tags[i].value + '</p>';
        }
        $('#vis').html(numbers_string);
        socket.emit("my_event", {data: "one update received!"});
    });
});


对于Python代码:

day=""
@socketio.on('connect', namespace="/test")
def test_connect():
    global day
    print("clinet connected")
    with open("static/sorted_examples.csv", 'r') as f:
        reader = csv.DictReader(f)
        day = ""
        words = []
        for row in reader:
            text = row['text']
            date_day = row['date_day']
            words += text.split()
            if date_day != day:
                day = date_day
                word_count = Counter(words).most_common(20)
                words[:] = []
                emit_data = [dict([("key", k), ("value", v)]) for k, v in word_count]
                socketio.emit('new_count', {"data": emit_data}, namespace='/test')

最佳答案

该答案假定您正在使用实现协作式多任务处理的eventlet或gevent。

emit()调用是异步进行的,这意味着在eventlet或gevent下,如果希望由适当的后台线程立即对其进行处理,则需要释放CPU。

这实际上非常简单,只需在socketio.sleep(0)之后添加一个emit()。如果发现这对性能的影响太大,则可以选择每隔一个或更多个其他循环睡眠一次。基本上,您需要找到合适的平衡点。

09-10 14:15
查看更多