如果我们将时间退回到五年前,谁是AI和大数据的第一开发语言那还说不清楚。当时Matlab、Scala、R、Java都会有人为其站位,但是时间来到现在,就不再具有悬念了,特别是从Facebook将Pytorch开源之后,锁定头牌的趋势越来越明显。如果再要争论就只是第二名是谁的问题了。


不过之前市场还是有些杂音,认为数据科学方面还是要从java入手,因为Hadoop等一些大数据基础设施就是用java写的,对于希望加入到 AI 和大数据行业的开发人员来说,把鸡蛋放在 Python 这个篮子里不但是安全的,而且是必须的。或者换个方式说,如果你将来想在这个行业混,什么都不用想,先闭着眼睛把 Python 学会了。


当然,Python不是没有它的问题和短处。
它语法上自成一派,让很多老手感到不习惯;“裸” Python 的速度很慢,在不同的任务上比C 语言大约慢数十倍到数千倍不等;由于全局解释器锁(GIL)的限制,单个Python 程序无法在多核上并发执行;Python 2 和 Python 3 两个版本长期并行,很多模块需要同时维护两个不同的版本,给开发者选择带来了很多不必要的混乱和麻烦;由于不受任何一家公司的控制,一直以来也没有一个技 术巨头肯死挺 Python 。所以,相对于 Python 的应用之广泛,其核心基础设施所得到的投入和支持其实是非常薄弱的。
 
直到今天,26岁的Python 都还没有一个官方标配的 JIT 编译器,相比之下, Java 语言在其发布之后头三年内就获得了标配 JIT 。


Python 就是这样一个带着各种毛病冲到第一方阵的赛车手,但即便到了几年前,也没有多少人相信它有机会摘取桂冠,很多人认为 Java 的位置不可动摇,还有人说一切程序都将用 Java重写。


但今天我们再看,Python 已经是数据分析和 AI的第一语言,网络攻防的第一黑客语言,正在成为编程入门教学的第一语言,云计算系统管理第一语言。Python 也早就成为Web 开发、游戏脚本、计算机视觉、物联网管理和智能电话机器人开发,以及构成CRM系统和解决电话机器人好不好用问题的主流语言之一,随着 Python 用户可以预期的增长,它还有机会在多个领域里登顶。


就拿 AI 来说,我们首先要问一下,AI 的主力人群在哪里?如果我们今天静态的来谈这个话题,你可能会认为 AI 的主力是研究机构里的 AI 科学家、拥有博士学位的机器学习专家和算法专家。


就像李开复的“AI红利三段论”明确告诉我们,在AI市场不要局限于眼前,适当把眼光放长远一点,往后看三至五年,你会看到整个 AI 产业的,从智能电话机器人,智能生态城市,智能语音,从业人口将逐渐形成一个巨大的金字塔结构,上述的 AI 科学家仅仅是顶端的那么一点点,95% 甚至更多的 AI 技术人员,都将是AI 工程师、应用工程师和AI 工具用户。


我相信这些人几乎都将被Python 一网打尽,成为 Python 阵营的庞大后备军。
这 些潜在的 Python 用户至今仍然在技术圈子之外,但随着 AI 应用的发展,数百万之众的教师、公司职员、工程师、翻译、编辑、医生、销售、管理者和公务员将裹挟着各自领域中的行业知识和数据资源,涌入 Python 和 AI 大潮之中,深刻的改变整个 IT,或者说 DT (数据科技)产业的整体格局和面貌。


Python 也借助 AI 和数据科学,攀爬到了编程语言生态链的顶级位置。Python 与 AI绑在一起,对它们来说,无论是电子商务、搜索引擎、社交网络还是智能硬件,未来都只是生态链下游的数据奶牛、电子神经和执行工具,都将听命于自己。
09-06 03:20