Yahoo这一路曾经出过很多好技术

然而,任何人如果只是把 Yahoo 当作一家缺乏聚焦的企业来看也许忽视了公司内部的那些创新—偶尔甚至还有一些很好的产品创意。就拿搜索来说吧,我们说的不是付费搜索,而是指代表实际搜索结果的蓝色链接。Stata 在担任 CTO 之前曾做了很多年的搜索,他说 Google 曾告诉他,Google 对 Yahoo 相对小的团队(且人员大都不需要斯坦福的学位)能够跟住 Google,甚至在某些领域挑战极限是如何的吃惊。

大部分工作都是在他 2004 年到 Yahoo 之前完成的,是收购 Inktomi 的成果,但最令他感到自豪的时刻之一发生在他到 Yahoo 之后:Google 停止显示其索引的 URL 数量的那一刻,因为他宣称 Google 意识到在这方面自己无法拉开 Yahoo。跟微软的交易里面有一件事是大家都没注意到的,即 Yahoo 几乎也跟 Google 也达成了类似的交易,直到政府出面阻止。Stata 认为,要说 Google 交易有可能的话,其唯一的理由是 Yahoo 对搜索的态度是如此的无情。(他还指出,如果你看看现在 Yahoo 的搜索引擎就会发现,它仍然负责页面设计以及在侧栏展示的所有附加信息)

早在 2005 年的时候 Yahoo 就试图要成为社会化搜索的领导者,因此才收购了 Flickr 和 Delicio.us,并发布了像 Yahoo Answers 那样的新服务。该公司甚至还考虑过按照用户的社交网络来进行搜索结果排名,Stata 说,但最终还是无法摆脱内容,因为它从来都未能产生足够庞大的社交图谱来启动这项排名。(尽管要是 Yahoo 360 不是独立于搜索团队而建,并且能利用流行的 Yahoo Messenger 服务的话将会是另一个故事)

“如果没有维基百科的话,我们可能会过得更好,尤其是 Answers,”他补充说。

Yahoo 为用户对首页内容进行个性化的努力相当令人印象深刻—至少从理论上来说如此—哪怕是在他们低估了自己的媒体公司心态的情况下。那时候 Yahoo 已经收集了大量有关用户的数据,以及 Yahoo 上面哪些类型的文章受欢迎的数据。该公司的搜索专家推断 Yahoo 可以通过开发机器学习算法来预测哪些文章会受到哪一类读者的欢迎,然后定向针对这些来对首页内容进行自动定制。

然而,Stata 解释说,该公司最终不得不选定一种办法来让人类编辑及定向算法进行协作,一起来选出 Yahoo 首页的最佳页面,然后将其呈现给合适的读者。有时候,他们会对文章进行简单的 A/B 测试,然后让被测试受众点击的内容分发到更广的范围。

“我们对圣诞节试了 6 种办法,然后想创建内容分类器,但还是失败了,”Stata 说:“……流行的就是流行的(没有类别之分)。”

David Ku 认为内容优化的随意性结果是 Yahoo 在搜索方面的相对失败。内容个性化已经有一些已知的技术,但就像广告一样,这些技术有助于了解谁在特定时间在找什么,或者是带着目的的个性化,如 Facebook 关注于你的朋友那里流行些什么游戏

“如果是针对我的话,”Ku 说:“那么个性化最好要好点。”

不管怎样,一切以Hadoop为轴心

Yahoo 最成功,也是最出名的的一项技术努力也许要数 Hadoop,正是 Yahoo 帮助培育了这个开源大数据平台并让它在 2011 年时成长为成熟的企业平台。

Yahoo 投入了成百上千万美元(也可能高达数十亿)到 Hadoop 的开发当中,而后者也赢得了从定向内容到搜索的 Yahoo“每个点击背后”的使能者之荣誉,可以说基本上是这样的,至少从这些点击涉及到分析、定向内容或搜索结果这些方面来说是正确的。Yahoo 是在 2006 年引进 Hadoop 的,为的是帮助对页面进行索引,以便能与 Google 在搜索上进行竞争(Hadoop 终于在几年之后为搜索提供支撑),但后来它证明自己在 Panama(Yahoo 为广告商、内容优化、定向广告及许多其他用户提供的分析工具)的后期迭代升级方面也能提供足够的支持。

Hadoop 刺激了 Yahoo 基础设施的若干变化,引导打造富含数据和设计的在线体验的新方式,Ku 说。在整个公司范围内,有一个提供内容与分析数据之间的连续循环,从而能为用户、广告商及 Yahoo 带来更好的结果。

尽管如此,这并不保证得到广泛采用,因为 Yahoo 的部门之间往往是独立运作的,对于相同的技术会有不同的想法,Stata 说。实际上,他承认,搜索团队对此跟其他任何人一样难逃其咎—在集中精力与 Google 作战时搜索团队采取了一种“地堡心态”。Hadoop 是第一个出自搜索并流向各个方向且被认为有用的东西。

“它的确从技术上帮助将公司凝聚到了一起,”Stata 说。

Usama Fayyad 是在 Hadoop 尚未完全在 Yahoo 内部起势的 2008 年离职的。他承认从某些方面来说 Hadoop 是个救世主,完全适合于某些工作,但他也指出 Hadoop“肩负的担子过重”。“Hadoop 几乎就像是一种宗教信仰,”他说。

在他离开之前,Yahoo 在关系数据库、NoSQL 数据库,甚至一种名为 Everest 的列式数据库(为与定向广告相关的大数据查询而设计)上投入重金。Yahoo 决定把很多的负载全压到 Hadoop 身上,这部分是由于对该技术着迷,部分是因为要通力协作专注于更少的事情上,而他则把 Yahoo 的这种做法视为是用推土机去推一颗石子。

的确,Bassel Ojjeh 的新公司 nPario 就因为聚焦 Hadoop 的决定而受益,此举也让达到产品质量的时间比预期更长了一点。 nPario 利用了 Everest 技术作为其分析引擎的一部分(现在是在 Hadoop 上面跑 Everest),有一段时间把 Yahoo 当作自己的一个客户。

当你讨论的是这样一个大规模的系统时,Fayyad 解释说,它最终会变成一个与技术问题程度相当的业务问题:“维护(Hadoop 集群)的成本跟计算创造出来的价值相比是否值得?”对于 Yahoo 和许多其他公司遵循相同路径的特定负载来说,答案很有可能是否定的。

他暗示 Yahoo 因为 Hadoop 而失去了几位最好的数据科学家,这些人看到在其他地方针对更为合适的技术进行特定计算的机会。(也就是说,Yahoo 的投入可能为他人利用 Hadoop 技术做了嫁妆)

最后,想让用户浏览仍需要一个理由

无论是致力于 Hadoop 也好,投入重金到 Panama 上也罢,或者是 Yahoo 那些数不清的收购(包括新任 CEO Marissa Mayer 做出的那些),在公司不能早点认识到自己的处境并致力于门户以外的任何一件事情的情况下,讨论这些决定是否明智基本上是没有意义的。不管是做搜索的 Google,还是后面做社交的 Facebook 等,其他公司对于消费者会如何使用自己来访问 web 都有着一个更加清楚的愿景,然后成为了大家优先选择的接入点。

你需要“某个理由说明为什么你要让那个服务成为你生活的一部分,” David Ku 说。缺乏聚焦的 Yahoo 没有用信息或朋友来勾住你,而是提供(平庸的)服务及内容的融合,最终没法为吸引用户使用提供充分的理由。

“Yahoo 没有把下一代用户作为自己的定位,” Ojjeh 说:“真的,Yahoo 是给我这种年纪的人用的。”

Ku 认为新任的 CEO Mayer 迄今为止对于 Yahoo 是有好处的,至少她为一家一度停滞的公司注入了活力和动力,并且真心想要改善用户体验。然而,她仍需要为公司寻找核心业务(嘿,也许就是媒体也说不定呢!),并找到把它集成进用户生活中的方法。他指出,微软和 Google 早已根植到设备的世界里并利用这些设备作为消费者接入点了。

不过,即便这些年 Yahoo 误入歧途且排名已经大幅下挫,但 Mayer 并非无米下锅。该公司仍然有一些非常棒的技术、技术人员以及对数据的学院知识。还有着亿万用户和通过它的各种服务而来的访客。

“我仍在创业……一切都是白手起家,” Fayyad 说:“想象一下,要是你给我一个客户群然后说,‘OK,Usama,你可以拿这 700 万用户起步。你打算怎么做?’我会怎么做?我会告诉你,绝对会让你大吃一惊。”

[本文编译自:gigaom.com]

05-04 10:55