地平线机器人科技余凯、搜狗王小川他们如何看待人工智能与人机大战?

创客猫 · 2016-03-16 11:02

我们讲人工智能可以做很多很多事情,但是是不是可以有一个相对简单的框架使我们能够研究它、刻画它?

地平线机器人科技创始人兼CEO余凯

在“全球大数据峰会 Global Big Data Conference 简称为 GBDC”大会上,地平线机器人科技创始人兼CEO余凯分享了关于如何利用大数据进行深度学习的演讲。以下为演讲中关于人工智能的部分。

我记得1956年“人工智能”这个词被提出,到今年正好是六十年时间。在六十年的时间基本可以划分为两个阶段:基于规则的人工智能,这个一直到八十年代末,那个典型的叫专家系统。到八十年代末开始到现在,有更多的是基于数据驱动的人工智能。这样的话,大数据这两个关键的支撑在过去的二十多年的时间去推动这个领域去往前发展。

我们讲人工智能可以做很多很多事情,但是是不是可以有一个相对简单的框架使我们能够研究它、刻画它?这样一个简单的框架我们用一个映射来描述,就是从X到Y的映射。比如说X的话,是Image,Y是Obgect,这就是简单的图像识别。如果X是Speech,Y是Texts,这个就是简单的语音识别。如果X是Language,Y是ParseTree这就是自然语言的处理。如果是各种传感器在汽车上面把路上的信息都搜集过来,实时的做决策,X就是传感器受到的数据,Y就是控制的的决策,我们看不同人工智能的问题,基本可以用一个相对简单的框架,从X到Y的框架来数。学习问题在这里面是怎么回事呢?就是你有一堆的训练样本,这堆训练样本告诉你,如果是这样的输入,它的输入是什么?比如这样的一个图像,它的输出是它的一个标注,是什么?这样的话学习一个映射函数,这个映射函数告诉你,有了这个映射函数就会回答这样的问题,比如给了下面这幅图像,让它的输出是什么。这样就是从学习到应用,就是从数据中学习模型,然后运用这个模型的过程。

最简单的一个极致的模型,是也许的一个问题,就是说我们给你六个训练样本,六个例子,纵轴是输出,横轴是输入。我们把背后蕴含的规律给找出来,这个规律可能是这样的,这个规律好不好,有没有更好?如果是这样的规律,我们觉得怎么样?可不可以做的更好?其实所有的规律都解释了我们的样本,但是哪个是真实的?所以这里反映到机器学习和人工智能很本质的问题,就是学习的空间的复杂度的问题。

(小贴士:余凯博士,地平线机器人技术创始人&CEO,国际著名机器学习专家,中组部国家“千人计划”专家,中国人工智能学会副秘书长。他是前百度研究院执行院长,创建了中国企业第一家人工智能研发机构 — 百度深度学习研究院,直接向CEO李彦宏汇报。)

(来源于:数据猿)

0925daf8f39af4d.jpg

搜狗CEO王小川

在最近大热的谷歌AlphaGo对弈李世石的人机大战中,搜狗CEO王小川也表达了自己观点。以下为分享全文,来源于凤凰科技。

万众瞩目的人机大战已经完成两回合,机器超出大多数人的想象获胜了,而且是大胜,棋坛震动。另一方面,我们又听到这样的声音:“一开始是李世乭占优,中盘被大逆转”,“是李世乭几次失误才输的”,“机器这一手业余五段水平,哈哈”。

这类观点背后的一个漏洞是,这些评价都基于人类棋手百年来积累下来的共识经验来判断。另一种细想极恐的解释是:机器一开始就占优而人类棋手以之前的经验并没意识到,待到醒悟时已经来不及了。机器这一步棋厉害到人类棋手从来没想到过。

赛后从Google传来的消息已经证明了后一种观点:至始至终白棋都在占优!也就是说以机器的视角看:“人类呀,这盘棋不是啥逆转,我一开始就吃定了你的。你以为我的昏招只是你!没!看!懂!”

你没看懂!我相信确实发生了这样的事情,人不仅是没有预料到机器的下棋能力,更是机器已经落子了我们还没看懂为啥这么下,反而评价不高,这是多么大的差距!现在到了需要思考人和机器谁更懂棋而不只是谁更会下棋的时候了。

AlphaGo已经表现出十二段的水准,而我们还在遮羞“逆转”、“失误”以及“嘲笑”,这就是被吊打而不自知。

无招胜有招的宇宙流

机器和人下棋有什么区别呢?人类下围棋是靠的“搜索”+“计算”+“棋感”。传统意义上,计算机没有棋感只能靠搜索,这对于围棋的海量变化和可能性完全不适用,也是我们之前不看好机器下围棋的终极理由。而这个棋感配合一定的计算,就变成了对局势判断的抽象概念,比如“厚薄”、“虚实”、风格“稳健或强硬”、策略“缠绕攻击、弃子整形”以及每步棋的招式“跳、长、靠”等等等。这些概念的引入:当前棋局->局势抽象判断->走棋招式抽象选择->局势抽象验证->落子,大大减少了搜索量。谈论这些抽象概念,就像是武功开始比试流派和招式,成为这项智力游戏的乐趣所在。

因为深度学习,世道变了。深度学习最大的魅力就是抽象能力,通过对3000万局人类对弈数据的学习,机器建立了一套抽象局势和落子招式的棋感。

既然机器掌握了棋感,一个未被大家深入讨论的问题是:机器会把局势、棋形抽象成多少类呢?会把落子策略和招式抽象成多少类呢?

答案是0!

这就是机器与人在抽象时最大的不同。当我们抽象出多个概念来,每一种概念便是一种简化,一方面忽略了全局信息,一方面也排斥了其他概念,也是在丢失信息。

打一个比方,我们都知道光的波粒二象性,光既是波又是粒子。当我们把光描述成波,就会忽略了粒子特性,如果把光描述成粒子,就会忽略波的特性。但是如果同时表达这两个属性,对人的理解就是很大的挑战了。

而深度学习下的概念抽象,Value Network同时既保留了全局信息,又兼顾了局部信息,直接对应到局势评分。Policy Network对应的走棋的抽象,兼顾了所有的招式并融会贯通,直接对应到落子的概率。

这便是小说里写的无招胜有招,真实地在围棋里再现。

以前我们赢机器,是因为我们有“抽象概念”而机器没有。现在我们输给机器,也是因为我们太有“抽象概念”,太细碎失去了整体,机器建立了大统一的抽象概念。

更多强调,这种无招胜有招,并不只是“见招拆招”,而是在时空双重维度上的“终极大招”。之前我们有质疑机器没有“大局观”,在深度学习框架下,机器不仅是有大局观,而是全局观,包含了全部细节的全局。再有,这个全局观不只是棋盘空间上的全局,而是每一步局势的判断以及落子的选择都是指向最终赢棋的概率提升,这是时间维度的全局观。

这种全局观下,棋感与搜索的交织融合,每一步搜索中包含棋感、每一步棋感后都进行搜索,便打造出完全超越人理解的走棋逻辑来。

有了这种超越人的时空全局观,机器就会走出一些人没法解读的匪夷所思的招式来,这些招式要么超越我们的定式,要么在招式下计算更精准,要么两者兼有。

这便是无招胜有招的宇宙流。

Google心机婊的棋外棋

Google这次人机大战获得了空前的关注,一方面是这个事情本身足够吸引眼球,号称人类棋类智慧的最后一块堡垒被攻破,具有足够的象征性意义,另一方面是Google进行了深谋远虑的市场运作。

从前几日樊麾的口述可以看到,他在2015年11月就败给AlphaGo,但是保密协议规定他不能对外透露。而等到2016年1月Nature杂志刊登了Google研发成功基于深度学习的围棋机器时才公布此事,两事情碰到一起互相佐证迅速引爆了媒体的关注。

再往深里想,为什么会找到樊麾?因为能造成最大的争议:职业棋手以及欧洲“冠军”的身份,看起来很有种,但是又只是二段棋手,与九段的世界冠军形成强烈的反差和悬念,又使得这次首尔的胜利极其突然。

真够心机!

往下有两个继续心机的预测:

1、有可能Google会放水让李世乭赢1-2局,不至于人类太难看。

2、赢了李世乭之后,鸣金收兵迅速解散AlphaGo团队宣布人工智能进军医疗领域,为下一个战场造势,并且避免后起的各家基于深度学习的围棋机器挑战AlphaGo,Google输不起赢了也无趣,没必要陪着玩。

那后起的围棋机器怎么出头呢?没机会挑战Google,挑战世界冠军也不是大新闻了。我的一个建议是设立一个“刷副本”赛:挑战一位世界冠军,同时运行其他网友随时从这个棋局的任何复盘位置进入接着下。不是觉得人有失误么,悔棋修正了失误继续来。这样会有看头,彻底体现机器怎么碾压人类智商。

程序狗的春天

这次关心人机大战真是万人空巷,也是几家欢喜几家愁。

最受伤的是职业棋手,段位越高伤害越大。你懂的,生命的意义受到冲击。

最被激励的应该是拥有人工智能理想的程序狗,会更加相信自己代表的先进生产力能改变世界。比赛前,我调研了我司好些做机器学习的工程师,他们大多表示相信机器未来会赢,但这次做不到。科技行业主流的声音也是这样,不相信自己手中掌握的武器有如此能耐。两场比赛后,已经有工程师给我发微信表示要更加努力了。

这是一场人工智能的启蒙运动,让大众接受和相信了机器的力量,也会促进人工智能的研发以及应用。

此外也会有对人工智能如何帮助人、取代人、伤害人的讨论。这是好事,我们开始没那么自大,开始更好地思考“我是谁”,“我要到哪里去”了。

这场比赛的意义足够深远,或许百年后看,是21世纪最大的历史事件之一。

很幸运,我们参与见证了这场世纪之战。

(小贴士:王小川:搜狗公司CEO、国内顶尖人工智能专家。1994年,王小川参加“几何定理机器证明”课题研究组,首次在微型机下完成初等几何命题的全部证明。1996年王小川代表中国参加第8届国际信息学奥林匹克竞赛(IOI),并获得金牌。)