鲍里斯·约翰逊回答首相提问
评论

我们能打败OpenAI的聊天机器人吗?

图片来源:英国议会/杰西卡·泰勒/路透社

ChatGPT更多地暴露了我们的缺点。

我们应该让鲍里斯·约翰逊做图灵测试吗?现在有了OpenAIChatGPT问题浮出水面时,我们不得不质疑,我们能否分辨出这位前首相在辩论和演讲方面的水平与人工智能之间的区别。

ChatGPT是在一些大的要求下推出的,比如能够理解和创建正确的软件代码以及可靠的报告和文章。但它的主人不太确定它在工作上有多出色——也许更重要的是,当它做得不好时,它是否有能力解决问题。

不需要很长时间就能找出底层AI(在ChatGPT的情况下,是OpenAI的GPT-3的略微删减版)的不足之处。算术是比较明显的弱点之一。尽管大型语言模型可以处理非常简单的和——问1 2 + 2,你会期望它是正确的——但任何需要更多推理来计算的东西通常都会让它们出错。这在很大程度上与模型的结构和训练方式有关。2加2很简单,因为这是一个经常出现在文本中的短语。更大的数字往往会让模型难倒,因为它们从未接受过复杂的数字传输训练。

有一种方法可以绕过这个问题,用GPT-3这样的模型来识别麻省理工学院CSAIL的研究人员这里的技巧是,在询问你想要的结果之前,给模型提供一些精心选择的提示。然而,这更像是DeepMind计算机科学家伊恩·古德费罗(Ian Goodfellow)经常引用的一个例子:聪明的汉斯(Clever Hans),这是一匹表演马,据说它对算术有兴趣,在回答一个问题时,它会正确地跺几下蹄子。事实上,汉斯只是理解了主人在关键时刻提供的信息。

ChatGPT的幸运之处在于,人们通常不会要求它充当世界上最昂贵、能耗最高的计算器。相反,它最终被测试在人类觉得棘手或懒得研究的任务上。这就是这种语言的真正问题所在。

ChatGPT令人不安的部分不是它有多好。它不会花很长时间来检查发现的语言模型,在其核心,它没有真正知道这是做什么。它可以把它看到的概念联系在一起,但它们之间的联系是微弱的。但这确实足以让它大谈特谈一些事情,让人们认为它做得很出色。它在这方面的能力正暴露出人类社会在多大程度上围绕着不合理的推理和听起来含糊不清的垃圾展开,哲学家哈里·法兰克福(Harry Frankfurt)在他的著作中描述了这个问题1986年的文章在之后的书中:在胡说

几年前,IBM选择公开辩论作为其人工智能辩手项目(Project Debater AI)能力的展示,这也许并不令人惊讶。辩论的形象比它的现实要好得多,这本身就反映了那些在公开辩论中表现出色的人的说服力。更倾向于情绪化的语言和以积极或消极的方式构建问题,而不是实际的证据。事实证明,这是导致机器输掉比赛的重要原因,但主要是因为观众太清楚这是一台机器在拿分,而不是在一个完全合理的论点通常会成为障碍的环境中,策略选择本身就很糟糕。

接受报纸采访印度比赛结束后,“辩手计划”的对手哈里什·纳塔拉扬解释说:“我之所以能够击败这台机器,是因为我对人类情感及其运作方式有了更多的思考。准确地说,机器确实谈论了情感。它询问了穷人是什么感觉,并指出了一个人所遭受的可怕条件。但观众从来没有感受到这是真实的,原因很明显,这些情感不是来自机器的真实情感。”

作为人类,我们所面临的问题是,我们并不像我们想要假装的那样经常使用推理技能。这一论点是丹·斯珀伯和雨果·默斯尔这本书的核心《理性之谜这本书在一些机器学习圈子里很受欢迎,它与丹尼尔·卡尼曼(Daniel Kahneman)在自己的圈子里写的书略有不同思考,快与慢这本书也经常出现在机器学习阅读列表中。

支持ChatGPT等功能的语言模型几乎是在本能层面上工作的:将看似有联系的元素连接起来,因为它们在文本中经常紧密地出现。对于一些人工智能研究人员来说,这与卡纳曼的系统1相关,尽管华盛顿大学计算机科学教授Yejin Choi等人认为,在“快速思考”系统1之前的反射-动作感知阶段与当今人工神经网络中发生的情况更接近。

系统2,或完全推理,不是今天的人工智能模型所做的事情。要实现这一目标,几乎肯定需要对现有架构进行补充,如果不是完全改变,也可能需要在研究界所谓的人工通用智能方面取得更大的进展。然而,正如Sperber和Mercier在他们的书中经常指出的那样,当我们与这些机器竞争时,我们的问题是,我们在日常环境中并不经常使用像系统2这样的东西,即使系统2看起来在起作用。我们只是假设我们和其他人都需要。

2019年,主持人杰里米·瓦恩约翰逊赞许地描述道在他成为首相之前的几天里,他来到了一些颁奖典礼上,并在现场发表了一篇演讲,主要是将“证券化”等快速学会的关键词与电影《大白鲨》(Jaws)中一些长期被人们记住的取悦大众的词结合起来。你不得不怀疑,我们相对于机器的唯一优势是,我们更容易成为令人信服的人类。但随着演员说出的话、一段深度伪造的视频或被写进书面电子邮件,这种优势很快就会消退。

就目前而言,博斯沃思议员卢克·埃文斯发现,在周二(20日)的圣诞节休会辩论中,他使用了ChatGPT会议提供的丘吉尔语言的脚本th12月)。西卡迪夫议员凯文·布伦南问道:“这是这位可敬的先生自己写的,还是人工智能写的?”

埃文斯回应说,这代表着不可思议的进步,“但随之而来的是自主权、责任、公平、安全、道德甚至创造力所有权等巨大问题……这种智能的问题在于,我们有可能创造一个回音室。”现在,当一个16岁的孩子写一篇关于英国脱欧的论文时,这个算法会给出一个答案,这个答案会被阅读并输入一个评分算法。”

避免这种恶性循环的一个优势是,ChatGPT很可能会犯一些严重的错误。但是,考虑到我们自己的偏见、观点和对细节的缺乏关注,我们会注意到吗?我们什么时候才能要求证明他还活着?

报名参加E&T新闻电子邮件让像这样的精彩故事每天都发送到你的收件箱。

最近的文章

Baidu
map