Closed. This question is opinion-based。它当前不接受答案。












想改善这个问题吗?更新问题,以便editing this post用事实和引用来回答。

6年前关闭。



Improve this question




我们是学生,他们试图处理大约1.4亿条记录的数据大小,并尝试运行几种机器学习算法。我们是整个云解决方案和mahout实现的新手。目前我们已将它们设置在postgresql数据库中,但当前的实现无法扩展,并且在进行大量性能调整后,读/写操作似乎非常缓慢。因此,我们计划寻求基于云的服务。

我们已经探索了一些可能的选择。
  • 亚马逊基于云的服务(Mahout实现)
  • 带有scikits的Picloud学习(我们计划在NumPy中使用HDF5格式)
  • 如果有其他选择,请推荐其他选择。

  • 这是以下问题
  • 哪个可以为我们带来更好的结果(时间转换)并且具有成本效益?请提及我们任何其他替代方案。
  • 如果我们设置亚马逊服务,我们应该如何设置数据格式?如果使用dynamodb,成本会上升吗?

  • 谢谢

    最佳答案

    PiCloud建立在AWS之上,因此无论哪种方式,您最终都将使用Amazon。问题是您需要编写多少基础架构才能将所有内容连接在一起。 PiCloud提供了一些免费用法,可以逐步进行,因此您可能一开始就可以尝试一下。我自己并没有使用过它,但是很明显,他们正在尝试为机器学习类型的应用程序提供易于部署的功能。

    看来这似乎是在寻求结果,而不是成为一个云项目,所以我会考虑使用除直接EC2之外的亚马逊其他服务之一,或者考虑使用其他类似PiCloud或Heroku的软件或其他可以帮助引导的服务。

    08-24 13:34