我一直在关注 Databricks,因为它与 Kinesis 等 AWS 服务集成,但在我看来,SageMaker 是 Databricks 的直接竞争对手?我们大量使用 AWS,是否有任何理由将 DataBricks 添加到堆栈中或 odes SageMaker 充当相同的角色?

最佳答案

SageMaker 是一个很好的部署工具,它简化了很多配置容器的过程,你只需要写 2-3 行代码就可以将模型部署为端点并使用它。 SageMaker 还提供了支持 Python 和 Scala(sparkmagic 内核)开发的开发平台(Jupyter Notebook),我在 jupyter notebook 中安装了外部 Scala 内核。总的来说,SageMaker 提供端到端的 ML 服务。 Databricks 为 Spark 开发提供了无与伦比的 Notebook 环境。

结论

  • Databricks 是一个更好的大数据(scala、pyspark)开发平台。(无与伦比的笔记本环境)
  • SageMaker 更适合部署。如果您不处理大数据,SageMaker 是一个完美的选择(Jupyter notebook + Sklearn + 成熟容器 + super 简单部署)。
  • SageMaker 提供“实时推理”,非常容易构建和部署,非常令人印象深刻。您可以查看官方 SageMaker Github。
    https://github.com/awslabs/amazon-sagemaker-examples/tree/master/sagemaker-python-sdk/scikit_learn_inference_pipeline
  • 关于apache-spark - AWS Sagemaker 与 Databricks 的用例有何不同?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/55132599/

    10-16 16:34