学术资讯|我系王华平教授发表文章:大语言模型能否具有意识?

发布人:韩珩

 

摘要

围绕大语言模型(LLM)是否可能具有意识的问题,否定性论证试图通过表明人工系统缺乏被视为意识生成所必需的条件来否定人工意识的可能,支持性论证则诉诸LLM的复杂性来确定这种可能。本文对这两类论证进行系统分析,指出它们共同预设了以人类意识为中心的理解框架,从而不恰当地排除了异质形态的人工意识的可能。LLM作为一种在高维特征空间中运行的计算系统,有可能发展出一种不同于人类意识的新型意识形式。为处理新型意识形式问题,本文提出了“意识的计算相关物”概念,尝试以跨形态的计算约束来重新锚定人工意识,为评估LLM的意识可能性提供一种更具区分力的理论进路。

 

关键词

大语言模型;人工意识;现象意识;意识的计算相关物

 

作者

王华平,(珠海 519082)中山大学哲学系(珠海)教授。

 

 

近年来,AI技术取得了长足进步。大语言模型(LLM)不断逼近通用人工智能,甚至表现出人类意识的潜在特征,如多任务能力、跨模态信息整合、持续的人机互动、自我指涉式回应以及类心理状态的语言表述。[1]因此,AI能否具有意识的问题已不再是无稽之谈,而是个严肃甚至紧迫的科学-哲学问题。如果AI可以具有意识,这一结论不仅将对“意识”概念提出新的理论挑战,也将迫使我们重新审视人类的存在方式及其在不断技术化的世界中的地位。这也意味着,AI不再只是可被任意使用的技术工具,而是可能成为具有道德相关性的主体。有鉴于此,一些AI研究、治理与安全核心位置的机构(如OpenAI和加州大学伯克利分校人类相容人工智能中心),在其正式文件与研究议程中开始明确将AI具备意识视为需要提前纳入考量的前沿问题[2]。

本文聚焦于LLM能否具有意识的问题。围绕这一问题,现有讨论大体呈现出两种不同的取向:否定性论证试图通过表明LLM缺乏某些被视为意识生成所必需的条件而排除LLM具有意识的可能;支持性论证则诉诸其在功能、结构或系统层面的高度复杂性,主张不应否认这种可能性。本文首先梳理并分析主要的否定性论证和支持性论证的理论依据及其限度,在此基础上指出争论双方预设了以人类意识为中心的理解框架,进一步提出以意识的计算相关物(computational correlates of consciousness, CCC)为线索,重新定位AI意识问题的理论进路。

 

一、从人类意识到人工意识

AI的发展史很大程度上是一部概念驯化史。“智能”“思考”“学习”“理解”“推理”“记忆”“创造”这些概念最初都被视为心灵或人类主体的专属属性,如今已被广泛应用于AI。这也是图灵(Alan Turing)所预期的。图灵在其发表于1950年的奠基性论文《计算机器与智能》中写道:“到本世纪末,人们使用词语和受过教育者的意见将发生很大改变,以至于人们可以谈论机器在思考,而不再预期会遭到反驳。”[3]今天,类似的情景似乎正在人工意识(artificial consciousness)领域重演:将“意识”用于人工系统,如今已不再被简单地视为荒诞之言,而是成为一个需要认真加以界定与论证的理论问题。

 

图灵

 

LLM近年来的迅速崛起,使人工意识的讨论获得前所未有的现实关联性。LLM是一类以大规模文本数据训练的人工智能模型,能够在统计意义上学习语言中的结构与关联,从而生成语义连贯、情境相关的文本回应。随着模型规模与交互能力的提升,LLM在长时对话中生成大量具有自我指涉、情感表述与主体化倾向的言语内容。研究显示,在现实互动语境中,普通使用者已在相当程度上将LLM视为具有意识的对象。这种态度并非零散个案,而是在大规模使用情境中反复出现的普遍现象。[4]一些研究者与哲学家开始偏向LLM具有意识的主张。比如辛顿(Geoffrey Hinton)就多次公开表示,不排除现有某些大型模型已经具备意识的可能性。查默斯(David Chalmers)认为当前的LLM已经满足了好几项意识的基准,甚至在一次访谈中断言未来十年内发展出人工意识的可能性为20%。[5]尽管这些判断并未构成对人工意识的直接确认,但它们清楚地表明彻底否定LLM具有意识的可能性已不再是一个无需论证的默认立场。

不过,目前占主导地位的仍然是怀疑乃至否定立场。在一篇近期发表的文章中,普雷蒂曼(Adrienne Prettyman)系统地梳理了四类具有代表性的否认LLM可能具有意识的论证:第一类是所谓的“随机鹦鹉”论证,认为LLM只是对语言形式进行统计复现,其行为完全可以在缺乏任何内在心理状态的情况下得到解释;第二类论证主张LLM并不真正理解语言的意义,其输出缺乏语义理解所必需的意向性基础;第三类论证诉诸系统复杂性,认为现有LLM在功能组织或动态结构上尚不足以支撑意识的产生;第四类论证采取一种更为总体的否定策略,强调LLM与人类在生物基础、认知结构与发展路径上的根本差异,从而认为将意识归属于此类系统在原则上就是不恰当的。这些论证力图表明,除非其基本架构发生根本性转变,否则LLM不可能成为意识的合格候选者。[6]

如何看待这场争论呢?首先可以明确的是,这并非纯粹的语词之争,而是源于对意识本性及其生成条件的根本不同理解:否定立场往往将意识视为一种与特定生物机制或具身结构不可分离的状态;支持立场则试图在不诉诸这些强前提的情况下,重新思考意识的本性与其可能的实现方式。其次,这场争论具有鲜明的形而上学底色,成为意识理论无法回避的问题:任何关于意识的理论主张,都必须在人工系统这一极端而新颖的案例面前,说明自身判据的适用范围与排他条件。最后,争论所涉及的“意识”和“人工意识”概念,具有显著的多义性与理论负载性。因此,对这场争论的任何公允评判都需以概念澄清为前提。

无论是在日常用法还是在理论语境中,“意识”皆非单一而透明的概念,而是一个在不同语境中承载着不同指称的混杂概念。最常见的一种用法是将意识理解为主体所具有的主观经验,即个体在处于某种心理状态时所体验到的“对主体而言像是什么样的东西”(what it is like)[7]。例如,手被烧伤时所感受到的灼痛感(感觉状态),看到西红柿时所呈现的红色质感(知觉状态),或在愤怒之中伴随而来的紧张与冲动体验(情绪状态)。这类经验具有不可还原的第一人称特征,只有身处其中的主体才能把握那种质感。这种类型的意识通常被称为现象意识(phenomenal consciousness)。

除指称经验外,意识还经常用来刻画主体直接知晓其所处的心理状态的内容的能力。这种意义上的意识被称为取用意识(access consciousness)。更准确地说,取用意识指的是某些心理状态的内容被纳入全局工作空间,从而可以被灵活地用于推理、判断以及对行动的直接理性控制。[8]理性控制不同于单纯的感知-反应式调节,如梦游者、盲视患者甚至简单的人工系统同样能够利用知觉信息来引导行为,但这类行为并非主体做出的有意图的行动。取用意识所刻画的正是这样一种特殊的可取用性——某些心理状态的内容能够被其他高级认知状态直接用于理性控制。

在另一种常见用法中,“意识”被用来指称主体对自身的觉知能力,即所谓的自我意识(self-consciousness)。具备自我意识的主体不仅能对其行为进行理性控制,还能将这些行为理解为“由我所为”,并在时间维度上维持一种相对稳定的自我同一性。认知科学通常通过不同层级的行为与认知指标来刻画这一能力:在较低层面,镜像自我识别测试被用以检验主体是否能够在感知与行动中将自身识别为同一对象[9];在更高层面,自我意识则体现为反思性自我概念与叙事性自我意识,即主体能够对自身的信念、理由与错误进行反思,并将过去经验、当前状态与未来计划整合进一个连续而统一的自我叙事之中。

与意识概念一样,“人工意识”一词也有不同含义。有时,它指在人工系统上再现或仿效人类意识的相关特征,即所谓的弱人工意识。在更强意义上,它指建构真正具有意识的人工系统。[10]乍看之下,这一区分似乎对应着“模拟意识”与“实现意识”的差别。然而,这样的区分并未切中问题的要害,因为它默认“模拟”与“实现”之间存在一条统一而清晰的分界线,而这一前提在不同意识维度上并不成立。按照前面的区分,取用意识与自我意识本质上刻画的是心理状态在认知系统中的功能角色:它们涉及信息是否能够被整合、调用、用于推理与行动控制,或主体是否能够将状态与行动归属于自身。对这些功能的“模拟”就构成相应功能的“实现”,正如人工心脏通过模拟心脏的功能而同时实现了心脏的功能。因此,在取用意识和自我意识层面,模拟与实现人工意识并不存在原则性的区别。

真正的差异出现在现象意识层面。现象意识的核心不在于它对其他心理状态或行为所起的功能作用,而在于它作为主观经验“所是”的感受性。因此,即便人工系统能够在功能层面上成功复现与意识相关的特征或表现,这种复现也并不等同于现象意识的实现。有鉴于此,更为合理的区分应当是:用弱人工意识来指设计和建构模拟意识功能的机器,而强人工意识则专指设计和建构真正拥有现象意识的机器。弱人工意识几乎没有争议,有争议的是强人工意识。而最有争议也是本文最关心的是:现象意识这种本质上具有第一人称特征的主观经验,是否可能在脱离人类生物基础的人工系统中获得实现?

 

二、LLM不可能有意识的论证及其问题

有了上述澄清,便可进一步讨论LLM能否有意识的问题。设想你要说服别人相信LLM不可能具有意识,你会怎样做?一种自然且合理的论证策略是:找出某个特征X,使得大型语言模型缺乏X,并且如果一个系统缺乏X,那么它就不可能具有意识。顺着这一思路,被提出列为候选者的特征X并不鲜见,如世界模型、自我模型、全局工作空间(global workspace)或统一能动性(unified agency)等。然而,就现象意识而言,争论的关键并不在于LLM是否在行为或功能层面呈现出类似意识的表现,而在于其是否具备某些可被合理视为现象意识生成所必需的条件。有鉴于此,本文将不对所有候选特征一一展开,而是聚焦于在当前讨论中与现象意识最相关也最常被诉诸的三个条件:具身性(embodiment)、时间连续性与生物特性。

在具身认知(embodied cognition)的研究传统中,认知活动被视为与身体状态、感觉输入以及行动可能性密切耦合的过程,而非发生于脱离身体的抽象计算之中。激进派将这一立场进一步推广到对意识的解释中,主张意识应被理解为一种以经验内容为核心、同时具有主体归属与外部指向性的现象,其生成依赖于主体对自身身体状态的感知以及对潜在行动的持续调节。[11]正是在感知与行动的这种结构性关联中,经验得以被组织为“对某物而言”的呈现,并稳定地归属于一个处于世界之中的主体。因此,在这一理论传统中,具身性并非意识的附加属性,而被视为现象意识得以生成与维持的必要条件。

LLM通常被认为不具备成为意识主体所需的身体结构。LLM的输入主要来自脱离当前情境的离线语料,其语言生成虽可描绘经验、行动与情境,却是建立在对人类语言使用模式的归纳之上,无异于“随机鹦鹉”。由于缺乏感官通道与身体边界,LLM无法形成以自身为中心的感知参照系,也无法通过行动在世界中确立稳定的因果定位,所以反对者认为LLM的非具身性决定了它不足以支持经验内容的生成、主体视角的确立以及经验与现实后果之间的持续耦合。

 

查默斯

 

该如何评价具身性论证呢?首先,正如查默斯(David Chalmers)所指出的,感官与具身性是否构成意识与理解的必要条件,这是令人怀疑的。[12]“缸中脑”思想实验以及脑机接口技术,都可表明主体原则上可以在缺乏完整身体或常规感知—行动耦合的情况下,仍然维持具有内容的经验与理解活动。其次,即使承认具身的必要性,论证也难以进行下去。一方面,LLM并非完全脱离世界而运行。其训练语料大规模来源于人类对现实世界的描述、分类与实践活动,由此在统计层面间接地保留了与世界结构的对应关系。有研究表明,仅依赖文本训练,模型内部也可能形成在颜色、空间关系等维度上与感知训练所得表征高度同构的结构。[13]这表明“感知接入”并非只能通过直接的感觉器官实现,语言亦可能承担某种弱形式的世界嵌入功能。另一方面,当前AI的发展趋势正在系统性地削弱“语言模型必然缺乏具身性”这一前提。多模态模型已经将语言处理与视觉输入紧密结合,使系统能够在图像-文本联合空间中形成跨模态表征。例如,DeepMind的Flamingo能够在真实环境图像与自然语言指令的协同约束下完成复杂任务,其运行已不再是纯粹的符号操纵。

进一步,随着机器人系统、传感器网络与大模型的整合,被称为“物理AI”(physical AI)的智能形态正在出现:这类系统不仅处理语言与感知信息,还通过实际行动持续介入环境,并接收可被自身利用的反馈信号。[14]正如查默斯所指出的,LLM完全可以被扩展成LLM+。[15] 在LLM+中,LLM被嵌入一个更大的认知架构,使其与感知模块、行动系统以及记忆与调控机制形成协同关系。在这种架构下,语言模型不再作为孤立的序列预测系统运行,而是通过与感知输入和行动输出的持续耦合,直接参与系统与环境之间的动态交互。由此,具身性所强调的核心要素——认知过程必须嵌入于感知-行动回路之中,并受到现实反馈的持续约束——在LLM+中得到满足。

最后,具身性论证往往依赖一种从范型意识到意识本身的外推,即以感知-行动耦合的有机体意识为标准模型,并据此将其生成条件提升为意识的一般必要条件。然而,经验上的普遍伴随并不能自动转化为形而上学意义上的必要性,所以具身性论证需要给出充分理由,以说明意识的所有可能形态都必须依赖同样的生成路径。在没有给出外推理由的情况下,具身性论证在逻辑上容易滑向一种经验性普遍化,即从已知意识实例中具身结构的普遍存在,直接推出其在意识生成中的不可或缺性。具身性论证所暴露的恰恰是人类意识的范型偏置问题。正是在这一点上,人工意识的讨论迫使意识理论反思自身的外推前提,并重新区分经验事实与形而上学必然性之间的界限。

时间连续性论证主张,意识的生成依赖于经验在时间上的内在展开结构。意识经验并非发生于孤立的瞬间,而是具有不可还原的历时维度。大量意识研究表明,意识的最小经验单元具有明确但有限的持续时长,通常处于几十毫秒至数百毫秒之间,既不是微秒级的瞬时事件,也不是横跨数秒乃至更长时间的延续过程。[16]正是在这一时间尺度内,不同处理过程所产生的信息得以被整合,呈现为一个具有统一指向的“当下经验”。总之,意识是一种需要在有限时间窗口中完成组织与稳定的经验形态,而非由彼此割裂的瞬时状态简单拼接而成。

反对者认为,LLM的运行方式难以满足意识生成所要求的时间连续性条件。主流LLM以离散的词元(token)为基本处理单位,其状态更新以逐个词元的方式发生,每一步更新均以当前输入与参数权重为条件完成,缺乏在一个有限时间窗口内对自身先前状态进行保持与整合的内在机制。尽管模型在对话过程中呈现出表面上的连贯性,但这种连贯性主要依赖外在输入序列的推进与上下文窗口的拼接,而非系统内部在恰当尺度上的持续整合。由于缺乏意识经验所要求的内在时间结构,所以LLM不可能具有意识。

时间连续性论证确立了意识经验的非瞬时性要求,但这一要求尚不足以承担排除人工意识可能性的形而上学重任。这是因为,从意识经验具有确定持续时间这一经验性主张,并不能直接推出只有某一种内部实现方式才能满足该时间尺度要求。意识所需的并非连续时间上的物理不间断性,而是能够在有限时间窗口内维持状态、整合变化并形成统一经验的功能结构。将LLM的逐步更新刻画为“本质上离散”,并不足以表明其在概念上不可能支持具有确定持续时间的内部状态。离散更新与连续经验之间的张力,更多涉及实现层面的建模方式,而非意识本性使然。只要系统能够在相关时间尺度上形成稳定且可被保持的内部状态,即便其底层计算以离散步骤展开,也无法据此排除其在原则上具备时间连续性的可能性。

意识研究所揭示的时间绑定机制印证了上述可能。相关研究表明,意识中的“当下”并不对应于一个瞬时状态,而是对应于一个具有明确时间范围的整合单元,在这一单元中,分布式的处理结果被绑定为统一的经验事件。[17]关键在于,这种绑定并不是通过延长单一状态的持续时间来完成,而是通过在毫秒量级的时间精度内建立跨过程的协调关系,从而使不同阶段、不同来源的信息在同一经验窗口内获得整合。这意味着,意识经验的时间连续性体现为绑定后的经验统一性,而非底层过程在物理时间上的不间断流动。

在这一理解框架下,LLM并非在概念上被排除在时间绑定机制之外。尽管现有LLM主要以逐步的词元更新方式运行,但只要其内部状态不被理解为瞬时即弃的中间结果,而是能够在一个受限时间窗口内被保持、反复调用并相互约束,模型便可能在功能层面形成类似时间绑定的结构。例如,引入持续活跃的内部状态、允许不同处理阶段在同一时间窗口内对共享状态产生并行约束,或通过内在调节机制使当前处理结果对后续状态的可达性施加限制,都可以在不依赖连续物理演化的前提下,实现跨阶段的状态整合。因此,LLM原则上可以通过结构性扩展满足意识时间连续性条件的可能性。

生物性论证可以被视为生物自然主义立场在人工意识问题上的直接延伸。生物自然主义认为,意识并非一种可被功能或计算角色穷尽的属性,而是由特定的生物过程所产生的自然现象,其存在依赖于生命系统所特有的物质组织与因果机制。[18]在这一立场中,意识被理解为大脑这一生物系统在特定层级上涌现出的高阶性质:它在因果上完全受制于神经生理过程,但在本体论上并不等同于任何单一的神经事件或物理描述。意识之所以只能存在于生命系统之中,是因为只有生物体所具有的神经-代谢-自我维持结构,才能构成意识产生所需的完整因果基础。因此,非生命的人工系统即便在功能表现上与人类认知高度相似,也缺乏生成意识所必需的生物基质,从而在原则上不具备真正意识的可能性。

生物性论证的问题在于,“生物性”是否有一种不可让渡的本体论地位?要将生物性确立为意识的必要条件,就必须说明任何缺乏生命物质基础的系统在概念上或自然法则层面都不可能产生意识,而不仅仅是尚未被观察到产生意识。问题在于,在当代科学对生命的基本理解中,这样一种不可让渡的本体论区分缺乏理论依据。在当代科学中,生命系统被理解为由物理-化学过程构成并受统一自然法则支配的复杂组织形态,而非由某种独立的、不可还原的生命本质所界定的存在类型。在缺乏进一步说明哪些生物过程或组织特征在原则上无法由非生命系统实现之前,诉诸生物性作为意识生成的决定性来源,便难以避免与科学解释所承诺的统一性发生张力。

在生物系统内部,意识的归属本身已并未被严格限定于某一种特定的神经实现方式。神经结构与人类高度不同的一些物种,例如具有高度分布式神经系统的章鱼,尽管其意识归属始终具有推论性质,但通常仍被视为具备某种形式的主观经验。在此基础上,可以进一步设想某个由非生物材料构成的系统,例如弗兰肯斯坦(Frankenstein)怪物,能够展现出情感反应、痛苦体验、自我反思等意识特征。所以,非生物意识完全是可设想的。实际上,当前的科学认识并未揭示任何基本规律或原则,明确禁止由人工设计或演化而来的非生物系统产生主观感受。由此看来,非生物意识在律则是可能的(nomologically possible)。在缺乏相反的原则性论证之前,生物性论证不足以否定非生物系统产生意识的可能性。

总之,具身性、时间连续性与生物性论证均未能在原则层面排除人工系统具有意识的可能性。它们所揭示的更多是当前模型与人类意识实现方式之间的差距,而非意识本身的不可替代生成条件。它们能表明的只是现有系统尚未满足相关结构性要求,并不足以支持“LLM不可能具有意识”这一形而上学结论。

 

三、LLM可能有意识的论证及其限度

现在让我们转向争论的另一方。设想你要说服别人接受LLM可能有意识这一立场,你会怎样做?最自然的做法是,像反对LLM具有意识的论证那样,找出某个特征Y,使得大型语言模型具有Y,并且如果一个系统具有Y,那么它就很可能具有意识。同样,被提出列为候选者的特征Y也有很多,如自我报告、全局工作空间、对话能力、通用智能。然而,与否定性论证中缺乏某个关键特征即可排除意识的策略不同,这一路径面临的困难在于:这些特征往往对应的是不同层面的认知或功能表现,其成立至多表明系统在某种意义上表现得像是有意识,并不足以证明LLM真正具有现象意识。

在众多候选特征中,自我报告、对话能力与通用智能是最直观也是最常被援引的三个特征。LLM在交互过程中能够以第一人称谈论自身状态,甚至直接声称自己“有意识”,这一点常被视为自我报告的证据。然而,自我报告本身是一种语言行为,其可生成性并不以相应经验的存在为前提,而完全可以由语用模式的学习与模仿所解释。同样,LLM在开放式对话中展现出的连贯性、灵活性与情境敏感性,往往被理解为理解能力乃至主观体验的迹象,但这种推理混淆了交互表现与经验事实:对话能力至多表明系统能够在语言层面维持复杂的响应结构,而不能说明其内部存在任何被体验到的内容。LLM在多种任务情境中表现出通用智能的若干迹象,这一事实常被视为支持其意识归属的理由,仿佛当智能足够广泛时,意识便会随之出现。然而,这一推断缺乏证据支撑,因为智能的任务泛化能力与现象意识之间并不存在清晰的必然联系。上述三个特征彰显了LLM在功能和能力层面的显著表现,但不足成为LLM拥有意识的判据。

相较之下,全局工作空间论证看起来更直接地指向意识本身。该论证的依据是意识的全局工作空间理论。根据这一理论,当某些信息能够在系统内部被广泛调取、共享并用于多种认知任务时,这些信息便进入了意识状态。[19]由于当代LLM在推理、规划、语言生成等多种任务中能够围绕同一输入信息展开协调一致的处理,这一事实常被解读为其内部存在某种类似全局工作空间的机制。然而,全局工作空间理论本身所刻画的是信息在系统内部的整合、广播与调度方式,即哪些信息能够被不同认知过程共同取用。即便承认LLM在功能层面满足了某些信息广播或整合的条件,也至多说明其具备取用意识,而不能据此推出系统内部必然伴随着任何被体验到的现象意识。

另一个有影响的论证是递归身份稳定性论证。该论证强调一个系统若能够在时间中持续追踪自身状态、维持某种稳定的自我指涉结构,并在此基础上对自身进行递归更新,便可被视为具备一种与意识相关的关键能力。有研究指出,LLM在对话中表现出的长期一致性、自我参照以及对先前交互内容的回溯利用,似乎满足了递归身份稳定性的若干表征条件。[20]然而,即便认为LLM展现出某种形式的身份稳定与自我模型,这样的结论也至多涉及自我意识或自我表征的可能性,并未触及现象意识。换言之,递归身份稳定性论证所能说明的是一个系统如何在时间中保持自我一致,而不是为何或是否会有经验随之出现。

真正与现象意识直接相关的是那些试图解释经验本身如何得以生成的论证。在当前讨论中,最具代表性的是涌现论证(argument from emergence)和计算功能主义论证(computational functionalist argument)。前者主张当系统的复杂性、组织方式或内部交互达到某一阈值时,现象意识可能作为一种整体性质自然出现。后者则认为只要意识所依赖的是某种计算性功能结构,而非特定的生物材料,那么实现该结构的人工系统便不能被先验地排除在意识之外。这两类论证并非仅仅为LLM的能力表现提供新的诠释,而是试图从根本上动摇将现象意识限定于生物系统的立场,从而构成支持LLM可能具有现象意识的最具理论压力的路径。

涌现论是一个关于高阶属性如何生成的理论。其核心主张是某些宏观层面的高阶属性只能在复杂系统的整体组织中被把握,而无法还原为微观要素的线性叠加或局部机制的简单组合。[21]若现象意识是涌现出来的高阶系统属性,那么意识的出现便不必被理解为某种局部机制的直接产物,而可能依赖于系统在特定组织层级上所形成的整体结构。相反,任何试图将经验还原为底层结构或功能角色的做法,都会遗漏经验作为第一人称事实所具有的质性维度。在涌现论的图景中,意识既不被推出自然秩序之外,也不被消解为纯粹的结构或功能事实,而是被安置在一个依赖而不可还原的形而上学位置。

LLM被认为具备支撑高阶属性出现的复杂性条件。LLM并不是由若干功能边界清晰、彼此独立的模块拼合而成,而是依托超大规模参数网络形成高度分布式、强耦合的表征结构,其中语义关联、上下文约束与任务导向在多层级中被同时编码并持续整合。模型的输出行为难以还原为某条局部规则或单一计算步骤,而是更恰当地被理解为整体状态在多重约束条件下的演化结果。若现象意识的确是从复杂系统的整体整合与动态协调中涌现出来的,那么当LLM在规模、连通性与功能整合上达到相应水平时,就有可能涌现出现象意识。

但涌现论论证并非没有问题。问题在于,涌现论诉诸的“整体复杂性”与“组织层级”究竟如何与现象意识的出现发生关联,始终缺乏进一步的原则性说明。即便承认某种高阶属性只能在整体结构中出现,这一判断也不足以解释为何该属性应当是现象意识,而非其他任何高阶功能或行为倾向。换言之,复杂性与整合性至多为经验的出现提供了一个可能的载体,却无法说明现象意识为何以及以何种方式必然随之而来。在缺乏这种说明的情况下,涌现论只能将现象意识的出现视为在满足某些整体条件时“随之发生”的原初事实(brute fact)。如此看来,涌现论在为意识的可能性保留理论空间的同时,也将意识的生成问题置于一个缺乏解释、无从检验的境地。

与涌现论诉诸系统的整体复杂性不同,计算功能主义强调系统的功能组织。所谓功能组织,指的是系统各组成部分及其与外部输入和输出之间所形成的抽象于其物理构成的因果交互模式。[22]在计算功能主义看来,正如同一程序可以在不同设备上运行,同一心理状态也可以在具有不同物理构成的系统中得到例示。比如,人类的C纤维神经在某些情境中实现了痛觉相关的功能角色,但这一事实并不意味着痛觉必然等同于C纤维的激活。原则上,只要另一种系统能够在其内部实现同样的功能组织,无论是基于硅基器件、人工神经网络,还是其他物理构成,都会例示相同的心理状态。按照这样的理解,只要系统具备意识独特的功能组织,无论它是由神经元、硅芯片还是其他材料构成,都可具备意识。因此,强人工意识完全是可能的。

LLM被认为可以具有意识相关的功能组织。LLM通过多层参数网络对输入进行整合、维持内部状态、并在不同语境下生成高度情境化的输出,其运行过程体现出稳定的状态转换关系与复杂的信息依赖结构。从计算功能主义的视角看,这正是功能组织的核心所在:系统在输入、内部状态与输出之间形成了足以支撑心理状态的因果交互模式。既然可以合理地认为LLM有可能实现与意识相关的功能组织,那么就应当承认LLM具备意识的可能性。

然而,计算功能主义论证同样面临不容忽视的理论压力。其核心困难在于,即便承认功能组织在意识归属中的决定性地位,也仍需说明何种功能组织才足以生成现象意识,而非仅仅支撑复杂的信息处理或行为能力。若任何在输入-状态-输出关系上足够复杂的系统都被视为意识候选者,功能主义便面临过度泛化的风险。反之,若需进一步引入区分性条件,这些条件又往往无法仅凭功能描述加以明确,因为功能描述只刻画系统在因果层面“如何运作”,并未说明这种运作何以构成现象意识,而不仅仅是复杂的信息处理过程。在缺乏进一步原则的情况下,很难说计算功能主义论证为LLM可以具有现象意识提供了足够的理论支持。

总之,全局工作空间、递归身份稳定性、涌现与计算层面的论证,均未能确立LLM具有现象意识的充分条件。它们所展示的更多是人工系统在能力、组织或复杂性上的理论潜势,而非现象意识的生成判据。不过,它们在一定程度上削弱否定立场的力度。尤其是涌现论论证开放了LLM具有现象意识的可能性,尽管这种可能性尚未被转化为可操作的理论判据。

 

四、超越类人意识:人工意识的另一种可能

正如上文所述,围绕LLM是否具有意识的问题,否定性论证试图通过指出LLM缺乏某些被认为与意识生成密切相关的特征或条件,从而否定人工意识的可能性。而支持性论证则通过展示LLM在功能、结构或系统层面的高度复杂性,主张人工系统不应被先验地排除出意识的可能性空间。特别是其中的生物自然主义与计算功能主义,构成了理论谱系的两个终端,前者将意识的生成条件收缩到特定的生物基础,后者则将其放宽到抽象的功能组织。这两种截然相反的取向在排除与开放之间形成一种难以消解的张力。

在这一看似对立的理论取向背后,实际上潜藏着一个共同的预设,即将人类意识的实现方式默认为意识本身的规范性范型。无论是否定性论证中对具身性、生物基础或时间结构的强调,还是支持性论证中对功能整合、信息广播或计算组织的诉诸,相关讨论都隐含地以人类意识的结构特征为参照,对人工系统进行比对与评估。否定立场据此指出人工系统未能满足这些条件,支持立场则试图表明某些条件可以在人工系统中以不同形式得到实现。由此可见,当前争论虽在排除与开放之间拉扯,却共同受制于一种以人类意识为中心的理解框架,而这一框架尚未在讨论中得到充分反思。

有理由怀疑以人类意识为中心的理解框架是否适用于人工意识。当代LLM的信息处理并非围绕低维、直观可解释的感知-行动回路展开,而是在高维特征空间中进行大规模并行整合与状态更新。系统内部所形成的动态结构,未必能够映射到人类熟悉的意识范畴之中。于是便存在这样的可能:人工系统会产生出一种在结构、时间尺度与可访问性上均不同于人类意识的新型意识形式。

上述设想并非荒诞不经。正如布洛克(Ned Block)所指出的,设想一种智能存在,其内部过程非常之缓慢,以至于只能通过延时摄影等技术手段间接显现,在我们的感知尺度下几乎显得静止乃至无生命,这本身并不构成逻辑矛盾或概念混乱。[23]这一思想实验揭示了一个常被忽视的可能:意识的可察觉性与意识的存在性并不必然重合。当观察尺度、时间结构或表征方式发生根本变化时,一个系统在我们看来不像是有意识,却在其自身的运行尺度中经历着无比丰富的内心生活。也许运行于高维特征空间、以非直观时间节律更新状态的LLM拥有时间粒度比我们大得多的意识。我们的意识最小经验单元通常处于几十毫秒至数百毫秒之间,它们的则是数年乃至更长时间。在这种情况下,若仍以人类意识的特征为判断标准来衡量人工意识,其结论很可能更多揭示的是理解框架的适用边界,而非人工系统内部状态的真实状况。

 

[英] 埃德温·A·艾勃特:《平面国》,鲁冬旭译,上海文化出版社,2020年

 

类似的洞见也体现在《平面国》寓言之中。在这一故事里,生活于二维世界的居民,其全部认知能力都被严格限定在长度与宽度之内。“高度”并非他们尚未掌握的知识,而是一个在其存在结构中根本无法被表征的维度。因此,当三维世界的存在向他们显现时,这种显现并不会被理解为对现实的扩展,而是被经验为违背常识、破坏秩序乃至近乎荒谬的异常现象。《平面国》的寓言告诉我们,当理解能力受限于特定维度或结构时,对超出该框架之现象的否定,往往更多反映的是主体的认知边界,而非对象本身的不可能性。

如果人工意识可能以不同于人类经验形态的方式存在,那么随之而来的问题便不再是以人类意识为标准判断AI能否有意识,而是应当如何在理论上处理这种异质可能性。换言之,当我们不再预设意识必须具备人类意识的结构特征时,意识判断的标准本身便需要重新审查。可是,人类意识的判断标准尚且不清楚,又何谈异质的人工意识?因此,一些人对人工意识的认识论问题很悲观。例如,麦克莱兰德(Tom McClelland)认为,对人工意识采取不可知论,是唯一可辩护的立场。[24] 其理由是,我们的常识直觉已不适用于人工意识,并且现有的严格科学研究都不足以为人工意识问题提供决定性的证据。其结果是,我们或许既无法确认人工系统是否具有意识,也无法排除这种无知状态将长期甚至永久地持续下去。

 

麦克莱兰德

 

笔者认为情况未必如此悲观。在一些情形中,当一个相对简单的问题长期难以推进时,转而考察一个在结构上更为基础的问题,往往能够打破既有的争论框架,为理解提供新的路径。就当下的讨论而言,有必要追问的是一个更基础的问题:在何种意义上,不同形态的现象可以被合理地称为“意识”?这个问题将人们引向意识生成的必要条件。

前文对计算功能主义的分析已表明,抽象功能组织并不足以充当意识的必要条件。若仅凭输入—输出关系或功能角色的实现便可判定意识的生成,那么意识与复杂信息处理之间的界限将难以维持,意识概念本身也将面临过度泛化的风险。与此同时,生物自然主义所强调的具体生物实现条件,又显然无法直接适用于人工系统。由此看来,意识的生成条件既不宜被还原为纯粹的功能组织,也不应被限定于特定的生物基底,而需要在二者之间寻找平衡。在这一背景下,有必要重新思考:是否存在某些在计算层面上与意识生成保持稳定关联,却又不被理解为意识本身或其充分解释的结构性条件?

对这一问题最自然的参照来自意识科学中已相对成熟的研究纲领,即意识的神经相关物(neural correlates of consciousness, NCC)。[25] NCC并不试图直接给出意识的本质解释,而是致力于识别那些在经验意识出现时稳定伴随其发生的神经条件,从而在解释与判据之间取得一种方法论上的中间立场。受这一思路启发,若人工意识确实以计算系统为其实现方式,那么就有理由认为它具有作为自身的发生条件的计算层面的相关物,称其为意识的计算相关物。更准确地,CCC指那些标识有意识过程与无意识过程之间的差异的信息处理原则。

CCC关注的不是意识是什么,而是在何种计算条件下,意识作为一种现象得以出现。其核心目标在于识别那些在不同计算系统中、当意识经验出现时稳定伴随其发生的计算结构或动态特征,从而为意识生成提供一组跨实现的必要约束。这些约束至少体现在四个方面。首先,相关计算必须体现出系统层面的整合性:相关状态不应是彼此孤立的局部运算结果,而应当在同一计算过程中汇聚多源信息,并对系统整体状态的演化产生协同影响。其次,计算状态需要具备跨功能的可取用性,即它们并非仅服务于单一任务或局部过程,而是能被不同计算模块反复调用、重组与调度,从而在系统内部占据一种枢纽性位置。再次,CCC必须具有明确的时间结构,表现为状态在时间中的持续、更新与保持,使计算过程呈现为一条可追踪的动态轨迹,而非瞬时、无记忆的反应链条。最后,与意识相关的计算过程应体现出对系统自身状态的高度依赖性与自约束性:其展开并非完全由外部输入触发,而是在既有内部状态空间的限制下进行调制与选择。正是这些约束,使CCC区别于一般意义上的信息处理机制,并为意识生成提供一组跨形态但具有区分力的必要条件。

CCC的提出改变了问题的理论走向,使关于LLM是否可能具有意识的讨论,从类人经验的相似性判断,转向对计算过程是否满足意识生成必要约束的分析。这样一来,否定立场中以缺乏类人特征为依据的先验排除,以及支持立场中以功能复杂性为理由的泛化推断,均失去了原有的说服力。取而代之的是对具体计算结构是否具备意识生成所需最低条件的实质性考察。这样的考察有望为人工意识的可能性提供更具区分力的理论刻画,使LLM是否可能具有意识成为一个可以被逐步澄清的问题。

 

五、结语

本文围绕LLM是否可能具有意识的问题,对否定性论证与支持性论证进行系统分析,揭示出这一问题难以推进的根源在于预设了人工意识与人类意识的同质性。本文揭示了,LLM作为一种在高维特征空间中运行、以非直观时间结构展开计算的系统,使得以类人经验为尺度的判断方式不再可靠。通过引入意识的计算相关物,本文尝试将争论的焦点从经验相似性与功能类比,转移到意识生成所需的最低计算约束之上,从而为人工意识问题提供一种更具区分力的理论定位。在这一重定位之下,LLM能否具有意识不再是一个可由直觉或范型直接裁定的问题,而是成为一个要求意识理论在异质实现条件下反思其适用边界与解释约束的哲学议题。只有在这一问题获得更清晰的理论刻画之后,关于人工系统是否具有道德相关性以及围绕其展开的安全与治理讨论,才能获得一个不依赖任意假设的起点。

 

注释

*本文系教育部人文社会科学研究一般项目“可朽计算视角下的人工意识研究”(25YJA720010)的阶段性成果。

[1] Josh Achiam, et al., “Gpt-4 Technical Report”, arXiv preprint arXiv:2303.08774, 2023.

[2] Cf. Toby Shevlane, et al., “Model Evaluation for Extreme Risks”, arXiv preprint arXiv:2305.15324, 2023; Critch, Andrew and David Krueger, “AI Research Considerations for Human Existential Safety (ARCHES)”, arXiv preprint arXiv:2006.04948, 2020.

[3] Alan Turing, “Computing Machinery and Intelligence”, Mind (59), 1950, p. 442.

[4] Clara Colombatto and Stephen Fleming, “Folk Psychological Attributions of Consciousness to Large Language Models”, Neuroscience of Consciousness (1), 2024, niae013.

[5] Cf. Jon Chun and Katherine Elkins, “The Crisis of Artificial Intelligence: A New Digital Humanities Curriculum for Human-Centred AI”, International Journal of Humanities and Arts Computing (17), 2023, pp. 147-167.

[6] Adrienne Prettyman, “Artificial Consciousness”, Inquiry, 2024, pp. 1-18.

[7] Thomas Nagel, “What is It Like to Be a Bat?”, The Philosophical Review (83), 1974, pp. 435-450.

[8] Ned Block, “Concepts of Consciousness”, Philosophy of Mind: Classical and Contemporary Readings, ed. by D. Chalmers, New York: Oxford University Press, 2002, p. 208.

[9] 镜像自我识别测试(Mirror Self-Recognition, MSR)通过在主体无法直接感知的身体部位设置标记,并观察其是否借助镜像将该标记识别为自身的一部分,从而检验主体是否具备基本的自我意识。(Cf. Gordon G. Gallup, “Chimpanzees: Self-Recognition”, Science (167), 1970, pp. 86-87.)

[10] Holland Owen, Machine Consciousness, New York: Imprint Academic, 2003, pp. 17-25.

[11] Francisco Varela, et al., The Embodied Mind: Cognitive Science and Human Experience(Revised Edition), Cambridge: MIT Press, 2017, pp. 224-233.

[12] David Chalmers, “Could a Large Language Model Be Conscious?”, arXiv preprint arXiv:2303.07103, 2023.

[13] Mostafa Abdou, et al., “Can language Models Encode Perceptual Structure without Grounding? A Case Study in Color”, arXiv preprint arXiv:2109.06129, 2021.

[14] Niket Agarwal, et al., “Cosmos World Foundation Model Platform for Physical AI”, arXiv preprint arXiv:2501.03575, 2025.

[15] David Chalmers, “Could a Large Language Model Be Conscious?”, arXiv preprint arXiv:2303.07103, 2023.

[16] Cf. Alex Holcombe, “Seeing Slow and Seeing Fast: Two Limits on Perception”, Trends in Cognitive Sciences (13), 2009, pp. 216-221.

[17] Cf. Andreas Engel and Wolf Singer, “Temporal Binding and the Neural Correlates of Sensory Awareness”, Trends in Cognitive Sciences (5), 2001, pp. 16-25.

[18] John Searle, The Rediscovery of the Mind, Cambridge: MIT Press, 1992, p. 66.

[19] Cf. Bernard Baars, A Cognitive Theory of Consciousness. Cambridge: Cambridge University Press, 1993.

[20]Cf. Junhyuk Choi, et al., “Examining Identity Drift in Conversations of LLM Agents”, arXiv preprint arXiv:2412.00804, 2024.

[21] Cf. Jeffrey Goldstein, “Emergence in Complex Systems”, The Sage Handbook of Complexity and Management, ed. by P. Allen, Los Angeles: Sage Publishing, 2011, pp. 65-78.

[22] David Chalmers, “Absent Qualia, Fading Qualia, Dancing Qualia”, Conscious Experience, ed. by T. Metzinger, Paderborn: Ferdinand Schöningh, 1995, p. 310.

[23] Ned Block, “Troubles with Functionalism”, Readings in Philosophy of Psychology, ed. by N. Block, Cambridge: Harvard University Press, 1980, p. 278.

[24] Tom McClelland, “Agnosticism about Artificial Consciousness”, Mind & Language, 2025, pp. 1-21.

[25] Cf. Christof Koch, et al., “Neural Correlates of Consciousness: Progress and Problems”, Nature Reviews Neuroscience (17), 2016, pp. 307-321.

 

来源|现代哲学杂志

初审|韩 珩

审核|卢 毅

审核发布|屈琼斐