分享主题:Hulu大规模容器调度系统Capos
分享人介绍:杨华辉,Hulu senior software developer,目前在Hulu beijing cloud infrastructure组,主要从事分布式容器调度,分布式存储方面的研发。
分享摘要:Hulu是美国领先的互联网专业视频服务平台,目前在美国拥有超过2000万付费用户。Hulu总部位于美国洛杉矶,北京办公室是仅次于总部的第二大研发中心,也是从Hulu成立伊始就具有重要战略地位的分支办公室,独立负责播放器开发,搜索和推荐,广告精准投放,大规模用户数据处理,视频内容基因分析,人脸识别,视频编解码等核心项目。在视频领域我们有大量的视频转码任务;在广告领域当我们需要验证一个投放算法的效果时,我们需要为每种新的算法运行一个模拟的广告系统来产出投放效果对比验证;在AI领域我们需要对视频提取帧,利用一些训练框架产出模型用于线上服务。这一切都需要运行在一个计算平台上,Capos是Hulu内部的一个大规模分布式任务调度和运行平台。
主要内容:
Capos系统模块设计
Capos使用方式以及作业启动流程
Scheduler的任务调度和offer match策略
Metadata的raft-based key value store
编程方式的AppMaster
分享群:DockOne技术交流微信群
DockOne每周都会组织定向的技术分享,欢迎感兴趣的同学加微信:liyingjiesd,或者扫描下方二维码加群主微信,进群参与分享,进群暗号『加群』。如果已经在DockOne技术交流群那等待晚上的分享即可。