最近的Azure announced Data Lake Gen 2预览版。据我所知,Gen 1和Gen 2之间的主要区别(就功能而言)是对象存储和文件系统同时访问同一数据。其他差异包括价格,可用位置等。任何人都可以解释Gen 1和Gen 2之间的其他主要差异吗?
最佳答案
基本上,将gen2视为gen1的超集,再加上blob存储的所有最佳部分:层,HDFS和对象存储API,大概可以有效处理超过35K文件的管理并有效处理许多小尺寸和细流写类型操作..加上它更便宜。
我正在尝试在一些细节上弄清楚一些,但与此同时没有找到太多尝试这些链接:
https://azure.microsoft.com/en-us/blog/a-closer-look-at-azure-data-lake-storage-gen2/
https://docs.microsoft.com/en-us/azure/storage/data-lake-storage/introduction
关于azure - 第一代Azure Data Lake与第二代,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/51782502/