今日,Sort Benchmark 在官方网站公布了 2015 年排序竞赛的最终成绩。其中,阿里云用不到 7 分钟(377 秒)就完成了 100TB 的数据排序,打破了 Apache Spark 的纪录 23.4 分钟。Sort Benchmark 有全球科技公司“计算奥运会”之称,更早之前 Hadoop 的记录是 72 分钟。

  据介绍,Sort Benchmark 的排序竞赛包含 4 项比赛,其中 GraySort 和 MinuteSort 主要评测计算系统的规模和效率,是 4 项比赛中含金量最高的两项。每一项比赛又分通用目的排序(Daytona)和专用目的排序(Indy)两个类别。阿里云飞天分布式计算系统,在这两项重量 级比赛中打破了全部 4 项世界纪录。

  GraySort 评测的是超大规模数据量排序的速度,飞天用了 377 秒对 100TB 数据完成排序,也就是说 1 分钟能够完成 15.9TB 的数据排序,去年 Apache Spark 成绩为 4.35TB/分钟。MinuteSort 评测的是系统在 1 分钟内能够完成排序的数据量,飞天用 1 分钟完成了对 7.7TB 数据的排序,去年冠军三星为 3.7TB。

DT时代即将到来-LMLPHP

DT时代即将到来-LMLPHP

运算速度平均每年提高1.5倍。按此算下来100TB,在5年后,只需要1秒就能完成排序。彼时,计算时代将会到来,很多意想不到的改变更加令人激动,计算机智能也将会前进一大步。现在从事软件开发的工程师和学校里计算机相关专业的学生,应该从数据技术和人工智能上着手,才能赶在这个时代的前面,创造属于自己的传奇。

04-30 05:52