欢迎访问:新清华

日期选择

走进“无人区”——探索人工智能之路
人文清华
新清华

2024年06月14日

2330

本期8

文章25

字号【 加大 还原 减小

走进“无人区”——探索人工智能之路

新清华 2024年06月14日 第2330期 人文清华

●张钹

张钹在人文清华讲坛。


编者按

什么是人工智能,它经过了怎样的历程,现在和将来会如何发展,又将如何影响人类社会和我们每个人?清华大学人工智能研究院名誉院长、中国科学院院士张钹做客人文清华讲坛,发表题为“走进‘无人区’——探索人工智能之路”的演讲,解读人工智能的发展历程,指出实现通用人工智能任重道远,应大力加强基础理论研究,坚持不懈地努力探索。本报摘编部分演讲内容,邀读者跟随张钹院士一同思考如何迎接人工智能时代的挑战。


什么是人工智能?很多人认为,人工智能是用机器来模拟人类的智能。这个理解是不对的。迄今为止,全世界对于什么是智能没有统一的认识,因为我们对大脑了解还非常少。

人工智能的两条路径

  人工智能经过多年的探索发展出了两条道路,一条是行为主义道路或行为主义学派、唯物主义学派。这个学派主张用机器模拟人类的智能行为。“智能”和“智能行为”是两个完全不同的概念。“智能”是指在我们大脑里面的运作过程,我们对它的了解非常少。“智能行为”是智能的外部表现,我们可以观察到它,便可以模拟它。现在的人工智能发展的是机器智能的道路,跟人类的智能并不完全一样,只是行为上相似。
  人工智能还有另外一个学派——内在主义学派或唯心主义学派,主张必须用机器模拟人类大脑的工作原理,即类脑计算。
  这两个学派不存在谁对谁错的问题,因为他们按照不同的思路去探索人工智能的道路。前者主张,除了人类这条道路外,机器或其他方法也可以发展出一条智能的道路;后者主张,通向智能只有模拟人类这一种方法。两个学派目前都处于探索阶段。
  人类探索人工智能最早是在1956年,人工智能研讨会在美国召开,经过8周的讨论,定义了人工智能,认为要让机器能像人一样思考,并主张用符号推理、符号表示来进行。

人工智能的三个阶段

  从1956年到现在,人工智能的发展不到70年,可分成三个阶段。
  第一代人工智能是想让机器像人类一样思考。人工智能的创始人提出了“基于知识与经验的推理模型”。70年代初,美国人制作了一个名为MYCIN的医疗诊断系统,它能像人类一样进行推理,但是所有的知识都要靠人类传授给它,它没有自学能力。把知识传授给计算机时,必须要构造出一个计算机能理解的符号系统,这种系统在当时构造起来很困难,费时费力,其应用和产业化比较有限,所以那个时候被称为“人工智能的冬天”。
  在第一代人工智能的发展处于低潮时,第二代人工智能开始出现。第二代人工智能主要基于人工神经网络。人工神经网络模型在1943年被提出,主要想模拟人类脑神经网络的工作原理。这个模型在早期时比较简单,所以能做的事情比较少。第二代人工智能初期的进展也很缓慢。
  清华大学从1978年开始进入人工智能领域,成立了人工智能与智能控制教研组,是中国最早研究人工智能的机构。当时约有30位老师参与其中,绝大部分来自于自动控制领域。当年,招收了第一批人工智能领域的硕士研究生。1985年,智能机器人实验室建立。当时要用PUMA560机器人,在非常困难的情况下把它买来了,这是全国第一台进口的机器人设备。1986年国家设立了“863”计划,把智能机器人作为发展主题之一。清华大学开始参加智能机器人主题的“863”高技术研究。同时,我们从1987年开始筹建,到1990年正式成立了智能技术与系统国家重点实验室。
  我们建立了两个理论。一是问题求解的商空间理论和粒计算理论,在国际上很有影响力。2005年,我们在清华大学发起、组织了国际粒计算会议,后来每年开一次,延续至今。二是在人工神经网络方面,我们做了很多早期的工作,在模型和学习算法方面做出了很好的成果。此外,我们从1990年开始做自动驾驶车,那个时候叫移动机器人,是国内最早进行自动驾驶研究的单位,也是国际上很早开展自动驾驶研究的单位,相关研究一直延续至今。
  第一代人工智能主要在符号主义的指导下进行,目的是模拟人类的理性行为。第二代人工智能主要是用人工神经网络来模拟人类的感性行为。
  过去,我们主要通过编程的方法让计算机学习识别,结果不理想。后来,我们收集大量图像和语音资料,做成训练样本,让计算机观察、倾听和学习,测试结果很好,这就是基于大数据的机器学习。计算机用来观察和倾听的工具就是人工神经网络,利用人工神经网络将数据分类,这样就实现了识别。多层的神经网络叫做深度神经网络,用这个神经网络进行学习叫做深度学习。在一项测试中,微软基于机器学习的图像误识率为3.57%,而人类的误识率是5.1%,机器超过了人类的水平。
  深度学习使第二代人工智能繁荣兴起。清华大学有很多师生参与到这类研究中,以朱军为代表的年轻队伍提出了一个概率学习的理论和模型,在贝叶斯的理论上加了一个维度,即后验分布。基于这个理论,我们制作了一个开源的编程库,可以供全世界的人使用,获得了广泛好评。
  第二代人工智能也存在问题,它识别东西只能区别不同的物体,并不能真正认识每个物体,因此它是不安全、不可信、不可控、不可靠、不易推广的。2016年,依据这种情况,我们提出必须发展新的人工智能——第三代人工智能。
  第三代人工智能的基本思路是必须要发展人工智能理论。人工智能到现在为止没有理论,只有几个模型和算法,而且都存在很多缺陷。因此,必须要发展理论,这样才能发展出安全、可控、可信、可靠和可扩展的人工智能技术。
  第一代人工智能运用了知识、算法、算力三个要素,第二代人工智能主要应用数据、算法和算力三个要素。为了克服前两代人工智能的问题,我们主张把知识、数据、算法和算力这四个要素同时利用起来,国际上也很赞成这个主张。但是外国的观点与我们不同,他们强调数据的作用,即机器的作用,而我们强调知识的作用,即人类的作用。我们认为,人类对人工智能的作用应该比机器更加重要。ChatGPT能够如此成功,就是因为它充分运用了知识、数据、算法、算力四个要素。
  大语言模型的强大性能主要依靠两个“大”:大模型和大文本。ChatGPT具有强大的语言生成能力,可以生成语意上连贯的、类似人类语言的文本,并且内容方面不受领域的限制,在开领域实现了人机自然语言对话。ChatGPT包含非常深的神经网络,共有96层;其次是非常宽的神经网络,能够一次性输入2000多字(token)。现在的文本不是用符号表示,而是用语意向量表示,向量就是一个数,所以计算机算起来非常容易。OpenAI的主要贡献是提出了自监督学习方法。以前想要机器进行学习,要将文本做预处理,工作量太大,因此无法进行大量的学习。自监督学习方法是文本不经过任何处理就可以给到机器进行学习。这使我们进入了新的时代——生成式人工智能时代。
  大语言模型是迈向通用人工智能的第一步,要达到通用人工智能必须满足三个条件。第一,系统完成的任务必须跟领域无关,ChatGPT只是在对话、自然语言处理方面做到与领域无关,大量其它的问题还做不到跟领域无关。第二,跟任务无关,什么任务都要会干。第三,要建立一个统一的理论。
  我们认为,从大语言模型迈向通用人工智能至少需要四个步骤。第一步是跟人类进行交互,跟人类对齐。尽管现在ChatGPT说的都是人话,但是不见得是正确的,需要人类帮助它纠正。与此同时,我们希望它具有创造性,就得允许它犯错误。
  第二步是多模态生成。在开领域里生成语意上连贯的、类似人类语言的文本是语言领域的突破,紧接着,在空间上实现连贯就会有图像领域的突破,在时空上实现连贯就会有视频领域的突破。上述突破只有在系统的规模增大到一定程度之后才会出现,这种从量变到质变的现象,叫做涌现。
  第三步是做AI智能体,跟数字世界交互。大语言模型再好,也只是能说而不会做,我们要让它在数字世界里做具体的任务,做完任务可以根据结果和反馈来推动大模型的发展。
  第四步是做具身智能,跟客观世界交互。智能光有“脑袋”能够思考还不够,还要有“身体”,动脑又动手,才能和客观世界联结在一起。

人工智能的产业发展

  大模型今后如何发展?第一是向各行各业转移,做垂直领域的大模型。第二是经过微调,到产业里应用。第三是跟其他的技术结合,发展新的产业。
  大模型的局限性表现为,其所有工作都是外部驱动的,不会主动做;其输出的质量不可控,而且不知道输出的内容是对还是错,所以不可信;受外部影响太大,我们要它怎么做它就怎么做。
  我们提出了第三代人工智能的三空间模型。过去文本和图像语音分别在不同的空间里做处理,空间之间不联系。现在我们有了大模型,组成了中间的空间,把整个感知、认知连起来,为发展人工智能的理论提供了非常好的条件。
  人工智能是探索“无人区”,其魅力就在于它永远在路上。我们不能因为它的进展而过于乐观,也不能因为它的挫折而沮丧,而是需要坚持不懈地努力探索。 (来源:人文清华讲坛)

  • 语音播报
  • 一键复制
  • 导出
清华大学新闻中心版权所有,清华大学新闻网编辑部维护,电子信箱: news@tsinghua.edu.cn
Copyright 2001-2020 news.tsinghua.edu.cn. All rights reserved.