张亚勤:解读21世纪的智能计算

  张亚勤

  事实上,“智能计算”是一个内蕴相当丰富的概念-长期以来,分布于世界各地的计算机科研人员都在因循不同的方向、通过各异的途径来设法接近这一概念的实质。

  一些基本的事实或许有助于我们理解智能计算的意义和发展现状。1997年,IBM旗下的 华裔科学家许峰雄博士所研制的一台名为“更深的蓝”的“计算机棋手”,出人意料地战胜了被誉为“历史上最伟大的国际象棋大师”的人类对手卡斯帕罗夫。仅仅在1/4个世纪以前,如此令人不可思议的事情大抵还只能在科幻小说里看到。然而,在许峰雄与其同仁的共同努力之下,计算机最终轻松地完成了这一先前看似“不可能的任务”。一时之间,大家都在思索同一个问题:击败人类世界冠军的计算机是不是可以说已经具备了某种程度的“智能”呢?毕业于卡内基梅隆大学的许峰雄博士在解释这一疑问时曾这样说,“一切都基于一个信念”-许博士把整个弈棋的过程假定为某种在数学上可以描述并搜索的过程,于是,只需要把“如何表述”弄清楚,剩下的只要计算机运算速度足够快就可以了(“更深的蓝”是一台超级并行处理计算机,多达256块芯片的配置以及先进的并行算法使之可以在每秒钟运算2亿步棋)。人们兴奋不已,有些人开始尝试设计有朝一日能够战胜中国最有实力的围棋选手的计算机。时至今日,人类开发出的最好的围棋程序也只能排在人类选手的负五段。

  历史发展到今天,在瞬息千里的技术奇迹已渗透到我们生活中的每一个角落的时候,新的疑问产生了:制造像“更深的蓝”这样的计算机–使计算机选手的运算能力足够强大,并有能力向人类选手挑战,这样便能够完全阐释智能计算的意义了吗?

  不久以前曾吸引了国内外多所知名高校参与的“机器人足球赛”仿佛是从另一个角度向我们昭示着智能计算的发展方向。以往科学家们的梦想是制造出尽可能像人的机器-“深蓝”是借助精准的算法以及人类大脑无法企及的运算速度来模仿棋手的思维;而机器足球运动员(或是索尼生产的机器狗)则是应用方兴未艾的传感技术,并结合多年来科学家们在智能机器研究方面的的一些研究成果,来尝试实现对人类复杂行为的模仿。因而,我们可以得出结论,看似风马牛不相及的机器棋手和机器运动员其实都是沿袭了同一条智能计算研究轨迹后的产物。

  微软中国研究院的几个小组正从另一个方向努力着-有一个课题是“人脸的识别与绘制“,研究者们试图使计算机能够做一些比走路、端水、下棋、踢球更为复杂、更具不确定性的事情,例如绘画。绘画是使人的内在精神外化的一种艺术。当一位画家为某人画素描时,往往只需观察片刻,之后聊聊数笔,一幅形神兼备的人物轮廓便跃然纸上。看上去很简单,但这种行为本身却不止限于思维的作用;同时,如何向计算机描述画家的创作过程本身也是一个棘手的问题。微软研究院科学家的思路是用所谓“基于采样和统计学习的方法”来使计算机变得“聪明”。把数以百计的不同画家的多幅作品作为样本,这样当我们给计算机“看”一张新的照片时,它会自己去与采样库比较并产生一张新的速写(统计结果)。人们还兴奋地发现,机器所产生的作品是可以不断修改完善的-我们给它输入的数据越多,它所绘制的图片便越逼真。

  由上述几个事例我们可以了解到智能计算的两条不同途径。传统的研究思路是“自上而下”式的,它的目标是让机器模仿人-相关的研究往往相信人脑的思维活动应该可以通过一些公式和规则来定义,因此希望通过把人类的思维方式翻译成程序语言输入机器,来使机器有朝一日产生像人类一样的思维能力。这一理论定义了早期人工智能的所有研究和努力。不能说这种思路对智能计算的发展毫无贡献,包括斯坦福国际实验室(Stanford Research International – SRI)于1969年研制的世界第一台“智能机器”(Shakey),以及之后MIT人工智能实验室等机构的多项突破在内的研究成果都很好地说明了这一点。然而,在“深蓝”及其后继者创造出“象棋神话”之后,类似尝试的局限性也日益显现出来。一些科学家开始提出:人对于自我意识的机制尚且缺乏深彻的了解,更遑论把这套机制完全照搬到机器中的奢望;换言之,人类思维的规则几乎是不可能被完全破译的,所以机器所能够接受的永远都只是残缺不全的“人的智能”,再强大的机器也不可能再现人类思维的复杂机制。

  如果我们仔细考究智能计算的发展历程,便会发现传统的人工智能研究可以算得上是成功的应用均集中在诸如电话应答、带宽预测、股票分析等方面,而成功的应用恰恰建立在注重积累和统计-而非规范-的自然语言处理以及语音识别等技术的基础上。故此,顺理成章的,假设机器可以学习便成为了智能计算的另一条思路。呱呱坠地的婴儿必须经历向家人、学校以及社会学习的过程,才能从本能阶段过渡到意识阶段,再由意识阶段过渡到思维阶段-成长的过程几乎等同于知识积累的过程,也就是不断扩大知识库的过程,况且成年人对于生活的正确认识,在相当大的程度上是建立在“统计学习”的基础之上的-如果机器也可以沿着这样的途径去“成长”,那么我们可以想象,至少图灵测试便可能在某些特定领域成为现实。另一个譬喻是教育方式,传统的研究思路有点像“灌输式教学”,其弊端在于忽视了培养机器学生的自我学习能力。在现实中,被这种教学模式所困扰的人类学子只能自行找寻规律,但恐怕计算机不会聪明到这种地步,因此,我们在把更多的知识和思维规范传授给计算机的同时也需要更多地把方法、统计数据传授给它。从具体的操作步骤来看,首先研究者需要把那些最简单的人类行为规则翻译为机器能够理解的语言,在此基础上不断把更多的行为模式传授给机器,这样机器就处在某种不断学习完善的状态下,学到的越多,机器就越“聪明”,直至最终人们无法准确定义机器可能做出的回馈-这也就是我曾提起过的智能人工的概念(Intelligent Agent)。这一“自下而上”的新的研究方向正引起来自各方面越来越多的关注。

  有趣的是,“自下而上”这一新的研究方向的一些基础性理论是由专注于研究量子力学的物理学家约翰·霍普佛德(John Hopfield)提出的。70年代末,他在一次偶然出席的人工智能年会上惊奇地发现,济济一堂的学者们居然无法清晰解释其研究项目的理论规范。于是他想到既然物质结构可以用量子力学的理论去剖析,那么人脑的神经元运动是否也有着与原子运动相仿佛的规律,再深入想想,如果让机器的“思维运动”去模仿人脑的神经元运动,不就在某种程度上找到了让机器更像人的可行途径了吗?约翰·霍普佛德的发现最终构成了智能计算的物理学支点。另一个支点是伯克利大学的一位数学教授、模糊集合的创立者Lofti Zadeh提出的所谓“软计算”的概念,这一概念恰好抓住了人脑思维的模糊性和不确定性的特征。

  由此我们可以发现,智能计算实际上是一门跨越包括物理学、数学、计算机科学、电子机械、通讯、生理学、进化理论和心理学等等学科在内的深奥科学,那么,在现今的阶段,我们对于智能计算的研究已经达到何种境界了呢?这个问题的答案建立在人类对智能层次的认识基础上。让我们把智能的形态粗略地划分为三个层次,最底层即所谓“操作层”,这一层的智能特征表现为本能,对人类来说便是呼吸心跳、血液循环、咽食排泄等,但若“智能”仅限于此,那便只能是植物人;中间一层是所谓“感知层”,这一层的智能特征表现为感觉和知觉,对人类来说便是视听、嗅味、触等能力、记忆力和简单地传递信息的能力;最上层是所谓“认知层”,这一层的智能特征表现为复杂的思维与行动能力,对人类来说便是通过语言相互交流,通过观察作出判断、推理,设定目标并设法完成它们。目前,我们已经很欣喜地看到一些由智能计算研究所带来的便利-例如我们的桌面办公系统具备了“拼写检查”和“自动更正”功能,这大大减少了那些我们不经意的错误;又如在网上冲浪时,我们大可不必在恒河沙数般繁多的网页中逐页查询感兴趣的信息,利用智能检索功能(当然现在还不完善)你便可以很轻松的找到你所确实需要的内容。但必须承认,我们有关智能计算的种种研究大都还处在初级阶段,我们所研究出的智能机器大约还只介于操作层面与感知层面之间。工业用机器人只是能够精准地完成某些动作,“深蓝”或“更深的蓝”只能在国际象棋这一特殊环境下精准地“思维”,至于“会与主人沟通的机器狗”以及“会踢足球的机器人”也还只是可以精准地重复制造者预设的语言或动作而已。

  无论是人工智能,抑或是智能人工,目前来看暂时都还很难使“智能机器”真正具备人类的常识-例如分辨人们音容笑貌(也许还需要20年),当然也就更谈不上产生属于机器自身的“自我意识”(也许需要50年甚至更久)。不仅可以执行目标,而且可以自行制定目标的智能机器何时诞生,一切都取决于智能计算的进一步发展。但我们可以大胆预测的一点是,在某些特定专业领域,肯定会出现那种使人类的脑力和体力空前解放的机器助手。这些智能计算机的智商或许比不上一名5岁的儿童,但其所具备的专业知识却会远远超过那一领域世界上任何一位专家。

  我们正在向着同一目的地、以各自不同的方式努力跋涉、上下求索着。除了先前提到的“人脸识别与绘制”,微软中国研究院还有多个小组正在各自感兴趣的领域努力工作着。例如他们正在研究一项代号为MiXP的技术。科研人员探讨着利用智能设备记录整个人类历史的可能。试想一下,把自己的一生完整地记录下来已不再是幻想,事实上,提供包括声音、文本、图象在内的个人信息的存储、记录等功能,即便是现有的技术条件也已经能够办到。我们所探索的只是如何使这一切更其完美、更其个性化……其实,我们是在试着创造一个比你亲近的人更了解你的喜好和习惯的智能“伴侣”。

  我们正在研究应用几何线条和图形来表述复杂视频信息的技术,在并不久远的未来,智能机器可以替代你联通时装店并试穿新衣,尽管几乎可以肯定,你的身材要比机器苗条的多,但最终你会发觉自己的新衣纤肥合度。

  我们正在研究基于各种终端的智能传输技术。这种技术使你得以借助任何一种设备随时随地与朋友或其他计算器件相互传递信息。智能机器甚至可以根据网络的实际情况自行决定信息的传输形式。我们正在研究更加先进的多媒体智能检索技术,应用该技术的机器将明确了解主人的心意。例如,同样在搜索栏键入“Window”,当你准备升级操作系统时,呈现在你面前的绝不会是一大堆房屋租售或装修的信息;而当你准备装修居室时,呈现在你眼前的也肯定不会是微软下一版软件的介绍文字。我们还在研究新一代的自然语言技术和语音技术,结合其它研究成果,希望未来的计算机能够看懂你的表情,识别你的声音,从而作出恰如其分的反应……

  比尔·盖茨所预测的智能计算发展前景乃是机器最终“能看会想,能听会讲”,其实,无论是人工智能,还是智能人工,只要能够殊途同归,造福于人类,那么所有的努力便都是有价值的。今后十年,智能机器作为真正意义上的办公助手和生活良伴,将使我们的生活完全改观,另一方面,“聪明机器”的出现,也决不会成为人类的灾难。因为在智慧与创造力方面,永远是人类最有发言权。

【发表评论】【通讯论坛】【短信和E-Mail推荐】【】

  免费试用新浪15M收费邮箱 赶紧行动!
  订阅短信头条新闻,第一时间、突发事件、重大新闻尽在掌握!

思想的重量-权威学术报告专题

 相关链接

无线网络OSS问题(2002/10/29 16:28)
全球软交换市场现状及预测(2002/10/29 16:26)
中国呼叫中心市场发展趋势预测(2002/10/29 16:23)
英特尔通讯事业部李旭东简介(2002/10/28 15:26)
微软亚洲研究院院长张亚勤揭密智囊团(2002/10/28 10:53)
英特尔:将摩尔定律引入通信领域(2002/10/27 16:07)
沈懿博士:柳传志应该怎样讲中国企业的故事(2002/10/21 15:19)
北京大学网络经济研究中心简介(2002/10/17 17:00)

张亚勤:解读21世纪的智能计算

张亚勤:解读21世纪的智能计算

张亚勤:解读21世纪的智能计算

未经允许不得转载:经纬人工智能实验室|中国人工智能第一媒体平台,专注人工智能、机器人、物联网、云计算等新兴技术信息资讯! » 张亚勤:解读21世纪的智能计算

赞 (0)
分享到:更多 ()

评论 0

评论前必须登录!

登陆 注册