3年、40次演讲、14万字:李彦宏的AI简史

星夕 · 2019-10-31 10:59

在称霸了整个PC时代的百度看来,改变命运的下一个机会已经不是互联网的下半场,而是AI的上半场——但这一切首先取决于,百度和AI是否能给这个世界带来更好的改变。

15679491997871.jpg

AI之门并不是天然就对人类敞开的,它在很久以来一直大门紧闭、门庭冷落,被认为是一个对实际应用帮助不大的领域。

但是总有人格外有恒心毅力,他们不肯离去,反复叩击大门,从推开一道门缝,到打开AI的世界,这个过程的参与者成千累万,但是带头的是极少数人。

李彦宏一定是其中的一位。

今年的“乌镇时间”已经告一段落。李彦宏和过去五年一样,如约而至。Robin今年的主题依然是AI。

这距离上个世纪90年代在美国留学的李彦宏第一次认识“AI”,已经过去了30年之久。

在称霸了整个PC时代的百度看来,改变命运的下一个机会已经不是互联网的下半场,而是AI的上半场——但这一切首先取决于,百度和AI是否能给这个世界带来更好的改变。

在乌镇大会的企业家高峰论坛上,李彦宏分享道:

数字经济在经历了PC的发明与普及,PC互联网,移动互联网这三个阶段后,正在进化到以人工智能为核心驱动力的智能经济新阶段,智能经济将给全球经济带来新的活力,是拉动全球经济重新向上的核心引擎。

本文整理了2017-2019年李彦宏的40篇内部和外部的公开发言。在这14.3万字的资料中,还原了他从AI预言家、敲门人直到被昵称为“AI先生”的全过程。

30年前:二手车、吃鸡、无用的AI

2019年10月20日,乌镇,这一天互联网核心巨头们都会向世界展示他们的最新战略和核心理念。人们也期待着“六次进镇”的李彦宏会说点什么。

李彦宏坦言自己是一个“人工智能乐观主义者”,同时他对中国的人工智能发展充满信心。

这其中的原因,更多在于他的观察。他认为,虽然中国互联网人口不再增加,但是这些人每天上网产生海量数据,他们产生的数据,用来训练各种各样的机器学习的模型,效果会非常好。因此,在这点上来看,中国发展AI具有得天独厚的条件。

而在今年的乌镇大会上,李彦宏继续为他心中的AI愿景“站台”。

李彦宏今年带来的新词汇叫“智能经济”,虽然这个词看上去和听起来都显得很普通,但在这个词的背后,却蕴含着他在过去3年时间中的39次公开发言的精髓思想,同时也饱含着他预测AI对人类未来生活产生巨大改变的激情。这也是百度对于产业智能化这盘棋局的一次清晰的观点呈现。

李彦宏认为,人工智能驱动下的智能经济将在三个层面带来重大的变革和影响:

首先是人机交互方式的变革。“如果说过去20年是人们对手机的依赖程度不断提高的20年,那么在未来20年,将是人们对手机依赖程度不断降低的20年。”

在智能经济时代,智能终端会远远超越手机的范围,包括智能音箱、各种可穿戴设备、无处不在的智能传感器等,应用与服务的形态也会发生与之相应的变化。人们将会以更自然的方式和机器、工具进行互动和交流。

其次,智能经济也会给IT基础设施层带来巨大的改变。李彦宏判断,传统的CPU、操作系统、数据库将不再处于舞台的中央,新型的AI芯片,便捷高效的云服务,各种应用开发平台、开放的深度学习框架、通用的人工智能算法等,将成为这个时代新的基础设施。

还有,智能经济会催生很多新的业态。交通、医疗、城市安全、教育等等各行各业正在快速的实现智能化,新的消费需求,新的商业模式将层出不穷。

说到这里,李彦宏眼前仿佛看到了30年前的一幕幕画面。

1990年,留学时代的李彦宏,开着一辆二手的本田车、每周用电饭煲做一次红烧鸡块,然后分七天吃完。

就是在这样清苦的留学生时代,他却喜爱上了人工智能。当他向自己在布法罗大学的老师表示,自己对于人工智能方向很有兴趣,他的老师却告诫他,人工智能这门课没用,将来靠学好这个是找不到工作的。

他的老师得出这个结论也不是没有道理,站在当时的时间点上,人工智能确实在工业界没有实际的应用。虽然在理论上讲有一套方法论,但无法落地,是比较没有价值的学科。

虽然人工智能在那时并不被人所认可,但李彦宏还是保留了他对人工智能的兴趣,在读研究生期间,他曾发表过一篇论文,核心内容是用人工智能的方法加强OCR的图像识别效率。这就是李彦宏和AI的初见。

10年前:生而不同的技术派,开启AI元年

刚创立百度时,谁也不会把百度和AI联系在一起。但在这十年,更多的人看到了李彦宏已经在人工智能这条路越走越深。

人们总是以为变化会突然出现,但其实所有的变化都是一点一点发生的。

这几天,有一篇叫《这十年到底发生了什么》的文章在网上爆红,作者释放了一个核心观点:

这十年,中国在互联网领域从凡事都Copy美国,开始变成了创新者。因为庞大的存量市场,使得中国在验证任何一个互联网商业模式上都有巨大的规模优势。

其实,关于这一趋势,李彦宏大概在8年前就做出了精准的预测,他2012年在硅谷的华源科技协会演讲中说:“由于中国互联网公司和互联网市场规模庞大,中国用户可能先于美国消费者认识和遭遇到某些特定挑战和难题,中国互联网业界可以通过创新来解决这些问题。中国互联网的发展将摆脱模仿模式,产生更多本土化的发明和创新。”

这个提前八年的预测,现在已经完全被证实了。在过去的八年里,百度早已先他人而行。不知道是什么时候,李彦宏把自己的个性签名改成了“生而不同”,而正因为这样,百度也同样拥有了这样的属性。

在C2C(copy to china)成为主流的中国互联网创业潮中,百度几乎是唯一一家依靠技术创新而跻身前列的公司。从这个角度来看,百度无疑是一个异数。

李彦宏曾经说过“我们的竞争对手不收购技术公司,他们只为产品和用户规模付费,不为技术付费,只有百度为技术付费”。事实上,百度早期的核心产品中文搜索引擎,无论是爬虫、页面排序、个性化调整权重、反作弊、推荐机制、分词和自然语言的处理等,无一不是技术驱动。

对于AI,大多数人、甚至大多数企业,都以为2016年才是AI的元年,因为这一年阿尔法狗战胜了人类棋手,让人们第一次真实的看到了AI的实力。

然而,这个时间点或许需要往前推6年,因为早在2010年,百度就开始了AI的布局,成为中国最早深度布局AI的先行企业。

有很多人认为,百度是“错过”了移动互联网,才提前布局人工智能的。其实,这是一个完全错误的认知。2010年,也就是PC互联网的极峰时期,百度已经在使用机器学习重新调整百度的搜索算法,并先后进行了自然语言处理、机器翻译、数据挖掘等技术的研发工作,这都是人工智能的范围。

百度对于AI的倾注,源于李彦宏对它的那份执着的钟爱,而在这份钟爱背后也不失他对AI冷静的技术判断。

大概在2012年的10月,百度的一位高管向李彦宏演示了基于深度学习技术对于搜索的改进,在AI的加持下,搜索排序的质量得到显著的提升。

李彦宏当即写了一封邮件,他在信中鼓励全百度的产品经理去了解AI技术的最新趋势。其实也就在这个时刻,李彦宏关于成立深度学习研究院的想法也愈发强烈。

同样在2012年,百度的“以图搜图”功能在C端开始大受欢迎。从本质上来说,这意味着计算机开始理解除了文字以外的另一种重要人类表意体系的开始。

作为一个超级园艺爱好者,李彦宏本人对这种“以图搜图”用来识别各种植物的功能大加赞赏。

选择深度学习作为方向,并不是一个“拍脑袋”就做出的决定,毕竟这是一个被业内人士称为“黑盒”的深邃领域。

以其中比较典型的深度神经网络为例,一方面相比于传统的视觉和语音识别方面有了很大的提高,也具有较好的Transfer Learning(迁移学习)性质;但是模型正确性验证复杂且麻烦,某些深度网络在训练和线上部署时都需要GPU支持,需要更多的资源、时间和钱来实现。

这就意味着,这是一个可能高效但也很花钱的决定,但在李彦宏的坚持下,百度深度学习研究院在2013年初就成立了,李彦宏亲自担任院长。

他先是对外界解释了自己的“食言”,因为很长一段时间里,他都坚持认为商业公司不要搞什么研究院,即使搞了也是“一种PR”。

但这次完全不同,因为对于AI领域来讲,要学习和摸索的东西真的太多,正如李彦宏说的那样:“深度学习这一波起来之后,我觉得是完全不一样的东西,它需要在理论上、算法上,在很多方面有长远的布局和突破,所以从那个时候开始,我们大规模地投入去吸引人才,去推进算法,才决定做研究院。”

他还很谦虚的说:“(当院长)原因不是因为我多么的懂深度学习,而是因为我这块牌子能够招来更多的懂得深度学习的专家和科学家。”

此后,百度建立百度研究院,其中的深度学习研究院改为深度学习实验室;2014年4月,百度成立了大数据实验室(BDL),同年5月又成立硅谷人工智能实验(SVAIL),这些机构和2015年起不断扩容的百度美国研究中心一道,成为百度在海外招揽人才的重要组成部分。

一位参与深度学习实验室的人士回忆道,“那是中国最早从事深度研究学习的研发机构。当时业界还是有挺多质疑的,在深度学习上投入这么多,是不是太激进了?”

后来发生的事,大家都知道了。百度深度学习实验室培养了一大批顶尖的人工智能人才,也一度成为中国AI行业中最大的人才集聚地。

对AI的重视程度也直接反应在真金白银的投入上。李彦宏在2017年的一次演讲中提出:“在中国五百强企业当中,我们论收入肯定不是排在第一的,但是论研发占收入的比例,那绝对是第一的。而这个研发的投入,应该说绝大多数都已经投入到人工智能上了”。

5年前:纵论AI

2017年有场著名的峰会,主持人是吴鹰。BAT的三大掌门齐聚,他们谈起了人工智能。当问到马化腾时,他谦虚的说:“其实,Robin在人工智能上走得更靠前,相对来说,我们还是落后不少,去年刚开始才成立了这个团队。”

马化腾这样说,这其中也有着他对百度在人工智能上的关注。毕竟在2015年和2017年,发生了两件和AI、和百度有关的大事。

先是在2015年的“两会”上,李彦宏率先提出了建立“中国大脑”的提案,提出要推动人工智能跨越发展,抢占新一轮科技革命制高点,这在整个中国的产业界,都具有强烈的前沿色彩。

念念不忘,必有回响。2017年的3月2日,“深度学习技术及应用国家工程实验室”揭牌仪式在百度大厦举行,这被认为是当初 “中国大脑”概念的最终落地,也被认为是中国将人工智能发展提升到国家战略的重要标志。

李彦宏回想到这些,激动地说:“当时用了‘中国大脑’这么一个词,实际上就是希望以国家的力量去建立一个全世界最大规模的深度学习计算平台,用最多的服务器、最优秀的算法,给中国的开发者、创业者、学者提供一个很好的研究深度学习各个方面应用的硬件环境和软件环境,或者是基础设施。这件事情已经时隔两年,国家实验室由百度来牵头,我觉得我很满足”。

而这一年,他的三个政协提案全部都和AI有关。

在2017年的百度开发者大会上,百度正式发布了DuerOS开放平台,包括智能设备开放平台和技能开放平台。而支撑这两个平台的则是DuerOS对话核心系统,通过帮助开发者最大程度降低对话式人工智能系统的应用门槛,实现“唤醒万物”。

李彦宏开始以一种狂热的状态在中国产业界四处奔走,传播他对AI的理念。他时常语出惊人,做出了很多超前的论断:

——移动互联网的机会已经不再有了,新的机会属于人工智能,这不是移动互联网的延续,是一次新的工业革命;

——将来“中国制造”要想变得有竞争力、要想真正转型升级的话,最需要依靠的是人工智能技术,而不是大数据、云计算、物联网;

——我跟以色列总理内塔尼亚胡在会谈的时候提出一个观点,互联网只是前菜,人工智能才是主菜,因为它们对这个社会的改变,在本质上不是一个量级的。互联网只是使得原来存在的方式更加有效,而人工智能是把原来的不可能变成了可能。

多次在重要场合对人工智能的发声,是李彦宏对于AI的强烈预见。从BAT的发展历程看过去,人工智能最早在百度的视野里出现,是一个必然。

首先,是搜索引擎的应用形态,是最有可能催生出和人工智能结合的需求点的,这就使得百度必然比别的企业更早看到人工智能的价值。

以前对人工智能到底有没有用,答案不是唯一的。但是,如果说全世界有什么企业可能最早看到人工智能的潜力,那一定是做搜索引擎的公司。“最近的20年,技术创新在哪些地方是最有影响力的?或者说它的贡献是最大的呢?我们可以看到,在过去20年IT技术的创新中,基本上每一次大的创新都是来自搜索引擎公司”。李彦宏如是说。

其次,是百度在技术上的领先性。阿里云成立于2009年,起初的目的是为了去IOE化,而这个时候的百度,早就超越了IOE,有了自己的云计算、存储和数据库,而且成本更低、效果更好。 

搜索引擎推动IT继续往前走,把大规模索引网页的技术抽离出来,就成为了通用的云计算;此外,最早大规模使用GPU芯片(来深度学习)的就是百度。今天业界都很清楚,GPU更适合做人工智能方面的计算,再往前走了用FPGA来做,这些都是搜索引擎公司首先遇到了这些问题。

李彦宏总结性的说:“在百度的实践中,我们捕捉到了一些蛛丝马迹,提前五六年去看到了,新的计算架构跟人工智能软件的结合会迸发巨大的力量”。

一位AI领域的创业者这样评价李彦宏,“他有很多非常超前的思考,随着时间的推移他的这些话其实都变成了产业界的洪流。”

如今,数字经济时代,百度又一次站到了人工智能产业发展道路的最前端。

未来:李彦宏的AI进化论

在过去的几年间,李彦宏可谓是中国AI产业里最为积极的布道者之一。

“Mr. AI”坐无人车上五环的身影注定写入中国无人驾驶发展的历史。对于向来低调,追求务实的李彦宏来说,一次次亲自为AI站台绝对是出于对它的“真爱”。

由于极力去进行国家层面、社会层面普及推广人工智能,李彦宏也如愿得到了一个“AI先生”的称号。

相比于李彦宏的AI布道,人们更关心的是,这一次他能再次以技术驱动者的身份引导百度再创辉煌吗?

从微观层面来说,这种判断没有错。的确,人工智能对于百度有很具体的意义,正如李彦宏曾就对此阐释过:内容分发的核心就是人工智能。 

“今天,无论是搜索、还是信息流,所用的技术完全都是人工智能技术。所以当我讲内容分发是我们核心的时候,其实主要还是指——搜索依然是我们的核心,但其中最核心的部分就是人工智能,信息流则是搜索自然的一个延伸。所以核心中最核心的部分就是人工智能,百度对于人工智能是非常重视的。”

他也告诉互联网的同行,AI时代的思维方式是一个降维攻击。“如果你能用AI的思维做互联网产品,那你就实现了降维攻击。”

但是,抛开这些具体层面的考虑,更值得关注的是,李彦宏作为过去二十年里始终站在科技前沿的科技创业家,他对于人工智能的判断有更宏观的层面:人工智能对社会和国家的科技前沿发展都具有重要意义。

2018年,李总理在政府工作报告里提到人工智能,这令李彦宏兴奋。他说:“过去五年,中国的经济成长很大程度上受益于互联网的推动,但是未来,中国经济的成长,可能要更多的依赖人工智能的技术的发展。因为互联网本身的发展在中国已经遇到了瓶颈”。

在这一背景下,百度将AI能否给世界带来更好的改变作为其研发人工智能的成败衡量标准。

为此,百度对于人工智能选择了更加开放的态度。李彦宏判断,人工智能是一个非常大的产业,而且会持续很长时间。大概未来20年到50年都是一个快速发展人工智能的时期。在这种时代大潮下,显然不是一个公司能够把所有的事情都做下来的。

“百度先进入了这个领域,能够提供一些平台,给一些没有这么多计算资源、不是这么有长远研发能力的机构,(让他们)去做他们擅长的事情,他们对于很多垂直领域可能比我们解更加深刻,让他们去做的话,会推动整个人工智能技术的发展。”李彦宏这样说。

就这样,我们看到了百度的战略方向,无论是在无人驾驶、开放平台还是在AI生态的搭建上,都具备生态赋能的属性,其中鲜明的指向之一是向B端赋能。

在这样的赋能下,让越来越多的企业在百度搭建的“生态树”上成长起来,开枝散叶,这应该就是李彦宏和百度心中未来的样子。

(文章来源:锌财经  作者:星夕)