我已经在本地安装了PredictionIO,使用我根据自己的需求修改的通用建议模板对引擎进行了培训,一切看起来都很好。

既然我知道这可以满足我的需求,那么我希望将其部署到生产环境中,不幸的是,关于它的文档并不多。

理想情况下,我想将所有内容都部署在AWS上,文档中有一部分对此进行了描述,但是由于CloudFormation模板已禁用,因此没有用。

我当时正在考虑使用Docker来实现它,但是我缺乏有关整个堆栈的知识,想了解以下内容:

  • 数据应存储在哪里? hbase似乎是“数据库”,与其余服务器(事件服务器,预测服务器)位于同一服务器上是否危险?
  • 如何缩放? 我需要在负载均衡器后运行多个PredictionIO实例吗?如果是这样,如何实现?
  • 什么是好的分布式体系结构? 为了扩展,我很确定我们需要将EventServer与PredictionServer分开,这样做的好方法是什么?

  • 希望有人能帮忙。谢谢。西里尔

    最佳答案

  • 数据应存储在哪里?

  • 根据PredictionIO网站:



    该网页中也提到了


  • 它如何缩放?

  • predition-io google group有一个很好的答案,他们将缩放分解为独立的部分
  • 什么是好的分布式体系结构?



  • 分离摄取层,处理层和服务层通常被认为是一种好习惯,但是您确实需要注意不要过度设计。这在很大程度上取决于您的特定用例,请不要忘记您所做的每个分离都会给系统增加更多的复杂性(部署,监视等)。

    09-11 23:52