我相信我在Microsoft的学术知识API中遇到了两个错误。首先是当我使用CalcHistogram方法使用“会议实例实体”运行搜索时。我进行了搜索,指定了会议名称并为2008年以后的日期设置了开始日期。以下是我的代码(使用python):
'expr': "And(Composite(PCS.CN = 'AAAI'),CISD>'2008')",
我将要返回的属性指定为引用计数(CC)和会议开始日期(CISD)。问题是由于某种原因,结果不包括2009年以来的任何数据。
{"attribute":"CISD",
"distinct_values":9,
"total_count":9,
"histogram":[
{"value":"2008-07-13","logprob":-25.000,"count":1},
{"value":"2010-07-11","logprob":-25.000,"count":1},
{"value":"2011-08-07","logprob":-25.000,"count":1},
{"value":"2013-07-14","logprob":-25.000,"count":1},
{"value":"2014-07-27","logprob":-25.000,"count":1},
{"value":"2015-01-25","logprob":-25.000,"count":1},
{"value":"2016-02-12","logprob":-25.000,"count":1},
{"value":"2017-02-04","logprob":-25.000,"count":1},
{"value":"2018-02-14","logprob":-25.000,"count":1}]
}]
这令人迷惑,因为它每隔一年就有一次信息。但是,AAAI确实在2009年召开了一次会议,API为其提供了信息。当使用过滤器作为会议和年份(在这种情况下为AAAI和2009)来查询论文时,我会获得论文的完整列表。为什么今年不包括在会议即时搜索中?
我遇到的第二个错误是某些论文缺少数据。我可以找到要搜索的特定论文,但是它们缺少发布会议或期刊上的信息。
{
"expr":"Ti = 'decontamination of mutually contaminated models'",
"num_entities":1,
"histograms":[
{"attribute":"AA.AuN",
"distinct_values":2,
"total_count":2,
"histogram":[
{"value":"clayton scott","logprob":-21.161,"count":1},
{"value":"gilles blanchard","logprob":-21.161,"count":1}]
},
{"attribute":"J.JN",
"distinct_values":0,
"total_count":0,
"histogram":[]
},
{"attribute":"C.CN",
"distinct_values":0,
"total_count":0,
"histogram":[]
}]
}
在这里,我从2014 AISTATS(国际人工智能与统计会议)会议上搜索了一篇论文。我使用DBLP数据库找到了这篇论文,并且在这里包括了链接:
http://dblp.uni-trier.de/db/conf/aistats/aistats2014.html
如您所见,Microsoft API返回了该论文的正确作者,因此它显然在其数据库中具有一些信息。但是,它不包含有关会议或期刊名称的信息。
响应将不胜感激。先感谢您,
肖恩
最佳答案
第一个错误
我们目前不认为AAAI 2009是独立的会议实例。您仍然可以从AAAI 2009中找到论文的原因是,因为我们已经在AAAI 2009中发表了论文,我们只是没有将它们链接到离散的会议实例。我们仍然将它们链接到AAAI系列,这就是查询“ AAAI 2009”起作用的原因(我们的查询解析器将“ AAAI”识别为会议系列,将“ 2009”识别为发布年份)。
第二个错误
对于论文Decontamination of Mutually Contaminated Models,我们只是没有将其与JMLR(机器学习研究杂志)或AISTATS(国际人工智能与统计会议)混为一谈。实际上,我们目前甚至还没有将AISTATS视为会议系列。
我已经与我们的团队一起提出了这两个错误,我们将在未来的一次数据刷新中努力解决这些错误。
顺便说一句,Microsoft Academic Knowledge API中的数据是我们Microsoft Academic网站的强大动力。我提到这是因为该站点具有非常方便的“反馈”功能,该功能使报告此类数据问题变得容易(如果需要,可以匿名)。我可以向您保证,我们会非常认真地对待图中的此类数据错误,并希望快速解决这些错误。