Closed. This question is off-topic。它当前不接受答案。












想改善这个问题吗? Update the question,所以它是用于堆栈溢出的on-topic

9年前关闭。



Improve this question




请推荐您认为是数据库管理,信息系统,数据挖掘等领域中最重要或最喜欢的论文。

我认为以下是重要的里程碑:
  • 周围发生的一切-迈克尔·斯通布莱克(Michael Stonebraker),约瑟夫·M·赫勒斯坦(Joseph M.Hellerstein)
  • Dynamo: Amazon’s Highly Available Key-value Store - Giuseppe DeCandia, Deniz Hastorun, Madan et al
  • Bigtable: A Distributed Storage System for Structured Data - Fay Chang, Jeffrey Dean et al.
  • MapReduce: Simplified Data Processing on Large Clusters - Jeffrey Dean and Sanjay Ghemawat
  • Brewer的猜想以及一致,可用,耐分区的Web服务的可行性
  • Parallel database systems: the future of high performance database systems - Jim Gray
  • 分布式系统中崩溃恢复的正式模型-Skeen,D. Stonebraker,M
  • 最佳答案

    由于我是stackoverflow的新手,所以我不能发布两个以上的超链接!因此带有链接的版本位于http://www.reddit.com/r/compsci/comments/ghc0w/please_recommend_must_read_favorite_papers_in/c1no849

    zamanbakshi推荐的书,《交易处理:概念和技术》(Gray and Reuter),确实非常好。我随身携带了这么多东西,以至封面掉下来了-这是精装书。当然,它在某些主题上有些过时了,但比起大多数后来的书,例如Weikum和Vossen的《事务性信息系统》,这本好书要好得多,我不得不承认。

    如果我没记错的话,格雷和路透社的文字并未涵盖莫汉的重复历史恢复技术,这是必不可少的。参见ARIES / NT:基于嵌套事务的预写日志的恢复方法和ARIES:使用预写日志支持细粒度锁定和部分回滚的事务恢复方法,至少,但Mohan的大部分论文值得读。

    Bernstein等人的书《数据库系统中的并发控制和恢复》已经绝版,但您可以从其Microsoft Research页面下载。

    David Lomet和已故的(或失踪的)Jim Gray也有很多不错的出版物。

    《红皮书》第二版(我拥有的第二版)中没有的一些重要论文:

  • 对ANSI SQL隔离级别的批评(1995)Gray等。
  • 复制的危险和解决方案(1996)Gray and Helland
  • 通用隔离级别定义(2000)Adya等。

  • 我认为值得关注的最新论文是Cahill,Röhm和Fekete的“快照数据库的可序列化隔离”(2009)。这是一种非常简单的技术,效果非常好。我希望可以在某些DBMS中实现它。在搜索相关内容时,我遇到了这个有趣的阅读 list 。它主要包含与闪存相关的内容,但也有一些令人感兴趣的常规论文,包括最近的Stonebraker论文。

    我建议跳过Date的“第三条宣言”。我对此感到非常失望。我认为他从未做过任何面向对象的编程。他的早期有关关系型DBMS的书籍和文章很好,即使有些重复。

    Dalí主存储器存储管理器的体系结构很好地描述了主存储器DBMS。一开始,非行动一致的,非WAL的检查点让我震惊。

    以下是关于不一致的分布式数据管理(对于非常非常大的数据)的一些说明:
  • BASE:酸性替代品(2008)Pritchett
  • 分布式事务之外的生活:背叛者的见解(2007)Helland
  • 08-18 02:12