第九次Scrum meeting
任务及完成度:
成员 | 12.31 | 1.1 |
陈谋 | 任务1040:完成stackoverflow的数据处理后的json处理(99%) 任务1114-1:完成对网页数据的处理和整合(100%) 任务1114-2:完成对pdf、ppt数据的处理和整合(50%) 由于最近一段时间比较忙,所以对于交流方面不是很畅通。 对于ppt的处理遇到了一定的麻烦,但是在后面的处理中应该可以比较快地解决这个问题 | |
卢惠明 | 任务1042-2:测试关键词的正确率、召回率和F值(100%) 任务1042-3:完成最终结果分析,并对算法进行一些改进(50%) 对于结果的分析并不是特别完整,还需要不断进行调整 | 任务1042-3:完成最终结果分析,并对算法进行一些改进 |
李剑锋 | 任务656:完成软件的UI处理,并让前后端程序以弱耦合的方式连接 (75%) 现阶段出现我们的程序想要完全弱耦合已经不太可能,但是我们会尽量让耦合度降到最小 | 任务656:完成软件的UI处理,并让前后端程序以弱耦合的方式连接 |
马腾跃 | 任务1046:测试程序的可靠性和稳定性 | 任务1046:测试程序的可靠性和稳定性 |
刘夕霆 | 任务1047:完成与手机客户端组的需求交流,并实时更新需求,并整理成一份文档(90%) 与手机客户端小组的联系一直是我们的重点,我们将会在这个阶段完成对手机客户端小组需要的数据的支持 | 任务1047:完成与手机客户端的需求交流,并实时更新需求,并整理成一份文档 |
仉伯龙 | 任务1050:整合在线组和手机客户端两组的要求,并和爬虫组进行沟通,完成相应的文档撰写(90%) 这个阶段能够接起来是最关键的,所以我们多次进行沟通交流,以确保最后能够成功连接成功 | 任务1050:整合在线组和手机客户端两组的要求,并和爬虫组进行沟通,完成相应的文档撰写 |
燃尽图:
开会照片:
代码提交记录:
关键词的正确率、召回率和F值:
系统输出的结果和人工标注的结果进行比较,采用的评价指标为正确率,召回率及F值;具体计算公式如下:
1)查准率(precision)是指人工抽取和自动抽取均判断为关键词的数目占整个自动抽取为关键词的比率,它反映关键词抽取系统准确抽取关键词的能力。
precision = |{人工标注的关键词} ∩ {系统的关键词}| / |{系统的关键词}|
2)召回率(recall)是指人工抽取和自动抽取均判断为关键词数占整个人工抽取关键词的比率,它反映关键词自动抽取系统发现关键词的能力。
recall = |{人工标注的关键词} ∩ {系统的关键词}| / |{人工标注的关键词}|
3)F测度值(F Measure)是查准率与召回率的调和平均值
F = 2 * precision * recall / (precision + recall)
F值最高时的实验结果:
查准率:0.6492847929865576
召回率:0.6336761475220368
F值: 0.6413855219961138