想改善这个问题吗?更新问题,以便editing this post用事实和引用来回答。
5年前关闭。
Improve this question
我正在尝试评估Datameer和Altreyx是否满足我们的大数据分析需求。这两种工具的优缺点是什么?
最佳答案
首先,请充分披露:我是Datameer技术产品营销的高级主管,因此请适当怀疑我的观点。值得一提的是,我还为ZDNet撰写了有关大数据(但不涉及Datameer)的文章,并且曾担任Gigaom Research的大数据和分析研究总监。所以我对BI /大数据市场了解一两件事。
顺便说一句,让我说Alteryx和Datameer实际上是完全不同的产品。即使我们的消息有时听起来很相似,我们也会做不同的事情。
Alteryx的出色工作是允许用户以图形方式设置工作流以进行数据转换,然后在设计完成后运行这些工作流。 Alteryx通过Hive及其ODBC驱动程序连接到Hadoop,从而将数据移出Hadoop进行处理。
Alteryx使用类似于集成开发环境(IDE)的UI作为Windows桌面应用程序运行。如果您是开发人员,或者甚至是某种类型的 super 用户(例如,喜欢不时编写一些代码的人),那么您将完全可以在家。
另一方面,Datameer可以在Hadoop上本地运行。 Hadoop实际上不是我们的引擎,而不是通过Hive连接并将数据从Hadoop转移到我们的引擎中,这才是最有意义的。除了使用图形工作流程之外,我们还使用电子表格隐喻,允许用户在工作表中输入公式,以实现数据转换/整形/清理。除了使您执行整个工作簿以查看结果之外,我们的智能采样功能还可以在设计时引入数据,因此在决定从头到尾执行整个工作簿之前,您可以与数据的一部分进行交互工作。
Datameer在Web浏览器中运行,而不是在桌面应用程序中运行,从而使我们能够在Windows和Mac OS(例如)之间以及在运行Android,iOS或Windows的平板电脑上运行跨平台。 Datameer可以各种配置在本地运行或作为服务运行。使用我们的Personal和Workgroup产品,您可能会使用这些产品处理较小的数据量,因此我们绕过Hadoop,并在内存中执行您的工作簿。
我们有高级模块,可以做一些有趣的事情。 Smart Execution可以简化您必须自己做出的一些Hadoop决策,包括是否使用MapReduce,Tez或我们的本地内存引擎。我们的Smart Analytics模块可让您使用机器学习算法更好地了解您的数据,而我们的工作非常短。
Alteryx本质上包装R来提供机器学习服务,并且这样做本身就是为了进行预测分析,而不是为了数据发现。 Alteryx中的ML功能比我们的更全面,但是它们基于插入到数据流中的R函数,而我们的ML功能是向导驱动的。我们的机器学习功能集更小,而且我们相信更简单。从我们的 Angular 来看,适用80-20规则。
Alteryx在整合消费者和空间数据以计算和可视化诸如特定行驶时间半径之内的位置等方面做得非常出色。 Datameer没有类似的功能。另一方面,我们确实有60多个本机连接器可连接到各种RDBMS,DW,NoSQL,社交和SaaS数据库和服务,并且它们都在包装盒中。 Alteryx可以与之集成的数据集,每个席位的成本相对较高,至少就该公司网站上的标价而言(位于http://www.alteryx.com/products/pricing)。
Alteryx是具有十年历史的BI产品,在与市场相关的大数据功能方面,该公司做得很好。 Datameer是围绕大数据用例和技术从头开始设计的。因此,确实,我们与众不同。您能用这两种产品做同样的事情吗?当然。您还可以使用Excel宏和用C进行编码来完成相同的工作;这就是计算的原理。但是我们的方法却大不相同。