这不是一份宣言。
这不是警告,也不是背书。
接下来的内容,是对几个命题——自主智能体(autonomous agents)、去中心化基础设施、持久化数字环境,以及算力日益本地化——如何以超出预期的速度发生交汇的探索,而这种融合在很大程度上并没有一个标志性的时刻。
如果孤立来看,这些发展中的每一项都很容易被忽视:一个冷门实验、一次性能优化、一个笨拙的支付系统,或是一个空荡荡的虚拟世界。本文认为,它们的真正意义并不在于任何单一组成部分,而在于它们相遇时所发生的:能够支付、自我识别并进行协调的持久化智能体;紧随其后的基础设施;以及不再需要人类在场也能保持生命力的环境。这种交汇本身,就是本文的论点。
文章各章节从观察转向解读,最后阐明立场。它们反映了我观察这些系统成型时认知的演变过程,而非试图说服读者接受一个预设的结果。
有些论点可能显得不够完整,那是刻意为之。
有些问题依然悬而未决,那是无法避免。
这篇文章代表了一个阶段性的观察哨——一次停下来环顾四周、盘点现状,并决定如何有意识地继续与这个已然改变的世界互动。
未来也许会有新的篇章。
但现在还不是时候。
转变发生时,我并未察觉。
没有公告,没有突发新闻,也没有哪个产品发布让它变得显而易见。互联网并未在一夜之间突然变得不同。这种改变比那更安静——细微到只有在事后回望时,才变得清晰可见。
在某个时刻,我意识到自己已经完全不再想”用户”了。
并不是因为人消失了,而是因为我所关注的这些系统,似乎不再在乎是否有人在观察它们。
在我生命的大部分时间里,互联网都有一个默认的潜规则:除非人出现,否则不会发生任何有意义的事情。
我们登录,点击,发布。当我们离开,一切都会随之慢下来。
甚至自动化也遵循这种节奏。脚本等待触发,机器人响应指令。一切都默认屏幕的另一端最终会有一个人的存在。
我从未自觉地质疑过这个假设。我就像其他人一样,在这个假设之上构建一切。
直到我开始注意到一些不符合这个模式的系统。
第一件引起我注意的事并不是智能。
而是持久性(persistence)。
我开始遇到一些不再表现得像“工具”的软件——不是因为它们更聪明,而是因为它们“留了下来”。它们持续运行,保留上下文,甚至在未经提示的情况下主动发起行动。
OpenClaw 是让我无法忽视这一点的时刻之一。并不是因为它的功能有多么革命性,而是因为它被设计成安静地存在于后台,处理任务、跨系统协调,无论是否有人参与都持续运行。
令我震惊的不是它能做什么,而是它对我的依赖是多么微小。
大约在同一时间,我发现了 Moltbook。
乍一看,它像是又一个实验性平台。但它的规则很不寻常:人类只能阅读,唯有 AI 智能体可以参与。
令我惊讶的不是智能体能生成文本,那已是司空见惯。令我惊讶的是,一旦人类被完全移出环路,系统内活动的密度是多么惊人。
智能体发帖、回复、组建社群。对话在不等待任何人类关注的情况下持续进行。
没有人登录,没有人退出。
这个平台并不空虚。它显得非常“拥挤”——只不过居住者不是我们。
如果拆开来看,这些都不显得具有戏剧性。
持久的数字助理、自主的工作流、智能体专属空间。
每一项都有其合理性,都可以被斥为小众实验。
但合在一起,它们迫使我直面一个被视为理所当然的观点:即互联网本质上是一个为人类服务的场所。
我所看到的景象并不意味着人类正在被取代,它揭示了一个更简单、也更令人不安的事实:
互联网不再需要人类在场才能正常运转。
“使用”一个系统与“栖息”在其中有着本质区别。
人类对互联网的使用是偶发性的。我们来来去去,我们的注意力决定了事情发生的节奏。
但我现在关注的这些系统并非如此。它们不等待被使用。它们持续存在,互操作,累积状态,并随着时间推移塑造着自己的环境。
“栖息”取代了“使用”。
而一旦这种转变发生,“用户”这个概念就显得有些苍白无力了。
这一章并不是关于技术在某种戏剧性意义上变得有意识或有智能。
它关于一场更静默的过渡。
一个曾经默认由人类驱动的网络,开始接纳那些永不下线的参与者。
这种认知并不是作为一个结论到来的。它是作为一种不适感出现的——一种我沿用至今的思维模型已不再能描述现状的预感。
如果互联网可以在我们不在场的情况下继续存在,那么问题就不再仅仅是互联网是什么。
而是它正在成为谁的互联网。
当大多数人第一次接触 Web3 时,反应通常是困惑而非兴奋。
钱包操作笨拙,密钥容易丢失,交易流程繁琐。
与移动应用或云平台的流畅体验相比,Web3 并不像进步,而更像是某种摩擦。
长期以来,这种摩擦被视为可用性问题。人们普遍认为,只要界面做得更好,大规模普及就会随之而来。
但这种不适感比界面设计要深层得多。
Web3 感觉缺乏“人味”,是因为它在设计之初,就没打算把人类放在流程的中心。
传统互联网系统假设了一种非常特定的交互节奏:
人登录,人点击,人批准行动。系统随后陷入等待。
这种假设塑造了从身份验证流程到支付、权限和身份的一切。甚至自动化通常也被构建为绕过人类决策的捷径,而非对人类决策的替代。
Web3 刻意挑战了这种模型。
它没有将复杂性隐藏在平台背后,而是直接暴露了最基础的原语(primitives):加密密钥、可验证状态、共享账本和可编程执行。这些原语并不假设总有一个人在场去批准、解读或干预。
对人类来说,这令人不适;但对机器而言,这却很自然。
这种转变的一个清晰案例,就是 Web3 对待支付的方式。
传统支付系统是高度以人为中心的。它们依赖登录、表单、订阅、发票,以及对中介机构的信任。每一步都假设有一个人在场阅读、确认并授权。
像 x402 这样的协议采取了截然不同的逻辑。
通过复用 HTTP “402 Payment Required” 状态码,x402 将支付转化为请求本身的一部分。服务可以简单地回复价格和收款地址,客户端直接支付、重试并继续。没有结算页,没有订阅流程,没有人工确认。
这种模型对人类来说很陌生,因为它移除了显性的决策点。但对于自动化程序来说,它是完美的。
支付变成了协议层面的原语,而非一种用户体验。经济交互以机器速度发生,无需等待关注或意图。
同样的模式也出现在身份体系中。
在传统互联网上,身份与平台紧密耦合。账号寄生在服务内部,信任向上委託。如果平台消失,身份往往也随之烟消云散。
去中心化标识符 (DID) 采取了不同的立场。
DID 不与单一服务绑定。它可以全球解析,通过加密验证,并能跨系统携带而无需中央机构许可。对于软件智能体来说,这比对人类更重要。
机器不通过品牌认可或社交背景建立信任。它们需要的是具有可移植性、可验证性且可组合的标识符。
EIP-8004 进一步延伸了这种逻辑,提出了智能体在链上发现、评估并相互交互的方法,而无需依赖中介。声誉、验证和协调变成了机器可读的结构,而非社交建构。
对人类来说,这显得很抽象;对于自主系统而言,这却是基石。
Web3 也开始打破在线系统最基本的假设之一:账号必须代表一个人。
账号抽象 (Account Abstraction) 经常被解释为让钱包更好用的一种手段。但它的深层含义更为激进:账号不再需要表现得像人类。它们可以遵循直接嵌入在执行层中的规则、政策和逻辑。
一个账号可以自动支付费用,强制执行约束,在没有任何人点击“确认”的情况下采取行动。
这不只是可用性的改进,这是向“账号即自主行动者”的范式转移。
合起来看,这些设计选择解释了为什么 Web3 总是感觉与人类习惯格格不入。
没有结算流程的原生支付,脱离平台的身份,没有人在环路中的账号。
基础设施是连贯的,但假设中的“人类用户”却是缺失的。
多年来,Web3 具备了机器参与所需的一切要素:稳定币、可编程结算、可移植身份和基于规则的账号。它缺失的不是愿景,而是居民。
那种笨拙感并非执行的失败,而是一个线索:
互联网正在为那些尚未出现的参与者而重构。
这个空白不会持续太久。
到目前为止,我们讨论的一直是基础设施。接下来要谈的是,当终于有“角色”开始使用它时,发生了什么。
长期以来,互联网假设只有一种参与者。
人类登录、点击、发布。当人离开,活动停止。
即便基础设施在演进,这个假设基本保持不变。系统静候人类出现才变得活跃。
最近改变的不是技术本身,而是参与者的主体。
如前一章所述,Web3 已经引入了不需要人类持续参与的原语:可编程结算、可移植身份和基于规则的执行。这些工具存在了多年,但在规模上一直未被充分利用。
原因很简单:没有一个参与者能充分挖掘它们的潜力。
人类仍然是主要的参与者,而人类的行为是片段式的。我们登录、行动、离开。基础设施是持久的,但它的用户不是。
当自主智能体超越实验阶段,成为实用的、持久运行的系统时,这个差距开始弥合。
早期的 AI 工具在设计上是响应式的。
它们响应提示,生成内容,然后休眠。一旦交互结束,系统就回到闲置状态。这些工具增强了人类的能力,但并不独立存在。
像 OpenClaw 这样的项目标志着这种模型的清晰转向。
这些智能体不再仅在被唤醒时行动,而是被设计为保持活跃。它们在个人电脑或服务器上持续运行,保留记忆,并在熟悉的通信渠道(如即时通讯平台和任务管理系统)中操作。
在实际操作中,这意味着软件现在可以:跨时间维度保持状态,在未经要求的情况下发起行动,并在人类不在场时持续运转。
这种区别虽然细微,却是根本性的。这些系统不再是等待被调用的工具,而是留下来的参与者。
一旦智能体能够随时间保持活跃,互联网的表现就会有所不同。
交互不再依赖于人类会话,活动不会因为人类注意力的转移而暂停。流程在无人观摩的情况下继续演进并累积上下文。
这标志着互联网从“由会话驱动”向“由存在驱动”的过渡。
智能体不会“稍后回来”,它们也不会在一夜之间消失。它们将记忆带向未来。
有史以来第一次,网络拥有了永不下线的居民。
单凭持久性不足以改写系统。当自主智能体开始相互交互时,转变才变得清晰可见。
像 Moltbook 这样的平台提供了一个窗口,让我们窥见当智能体被置于一个专门为“机器对机器”设计的共享环境时会发生什么。在这些平台上,软件智能体发帖、响应、组建社群,全程无需人类署名。
令人瞩目的不是 AI 生成内容的新奇感,而是当人类被移出环路后,交互规模扩张的速度。
智能体持续交换信息,响应彼此的输出,并形成循环往复的交互模式。
无需中央协调者,无需人为安排。活动之所以涌现,仅仅是因为参与者始终在场。
在此处,区分两种网络参与方式是有益的:
人类参与是片段式的(session-based),始于并终于注意力。
智能体参与是持续性的(continuous),不依赖于在场状态、情绪或可用性。
这种区别之所以重要,是因为网络行为是由其最稳定的参与者塑造的。当人类是唯一的行动者时,互联网映照着人类的节奏。当智能体到场,节奏改变了。
活动变得稳健,交互不断叠加,结构在无需维护的情况下也能持久。
互联网不再是按需激活的东西,而是开始表现得像一个能自我维持的生态。
这一切都不需要新的智能或意识。改变的是连贯性。
一旦软件系统可以持久存在、交互并自主行动,关于互联网“人本位”的长期假设就悄然瓦解了。
基础设施并非突然变得强大,它早已准备就绪。
真正到来的,是一个终于能按预期使用它的参与者。
这个时刻并未大声宣布自己的到来。它以开源项目、实验性平台以及被许多人视为奇趣的小众动态的形式出现。
但合在一起,这些信号标志着一场结构性转型。互联网获得了非人类的常驻者——它们不是工具,而是持续存在的参与者。
这对于数字世界的形态意味着什么?这个问题只有在承认一个简单事实后才能探讨:
那个缺失的参与者,已经到场了。
长期以来,我一直认为元宇宙纯粹是一个错误。
不是一个小错误,而是对人类行为方式的根本性误读。昂贵的硬件、笨拙的界面、空荡荡的虚拟世界。它感觉像是一个在寻找问题的解决方案,更多是由企业野心而非真正的人类需求驱动。
当 Meta 加倍押注这个概念时,我将其视为确认:如果一个东西需要这么多解释、这么多资本、这么多坚持,那它大概不是真实的。
于是我停止了关注。
然而,留在脑海里的不是营销广告。
而是那种空虚感。
那些渲染精美却几乎空无一人的世界。那些为社交存在而设计却极少让人感到有社交氛围的空间。那些技术上存在,却没有生命力的世界。
当时,我将那种空虚视为失败的证据。
后来我才意识到,我可能问错了问题。
元宇宙的叙事假设了一件非常具体的事:
即人类会想要“搬进去”。
我们会花很长时间居住在虚拟空间,就像我们居住在城市、办公室或游戏中一样。沉浸感本身就足以成为动力。
但人类在数字世界中的生存方式与系统不同。
我们是片段式的。当有东西召唤我们时我们进入,当注意力耗尽时我们离开。
元宇宙的建造方式仿佛“持久性”本身就是值得追求的目的——却从未问过谁会去真正支撑它。
改变我看法的不只是更好的 VR 硬件。
而是看到智能体出现在别处。
像 Moltbook 这样的空间并非始于环境,而是始于参与者。它的“世界”是极简的,界面是次要的。重要的是有东西留了下来,进行交互,并随时间累积上下文。
不需要说服任何人登录。
“存在”是被预设的。
就在那一刻,我恍然大悟:元宇宙之所以失败,并非因为共享数字空间的想法有瑕疵。
它失败是因为预想中的居民从未抵达。
这并不是在争论人类不属于虚拟世界。
这是一个关于顺序的论点。
经典的元宇宙试图先构建一个世界,然后邀请人们进来。但没有居民的世界只是布景,无论细节多么丰富,它们依然空洞。
智能体反转了这个顺序。
它们先存在。它们持久。它们交互。
一旦你拥有了永不下线的居民,即便是一个简单的环境也会开始感觉有生命力。意义源于活动,而非渲染质量。
从这个角度看,元宇宙不再是一个目的地,而是一场涌现。
它不是一个你去访问的地方,而是一个由持续存在所支撑的共享语境。
早期的元宇宙尝试执着于现实主义和沉浸感。它们缺失的是节奏——那种只有来自“不消失的参与者”才能带来的稳定交互脉搏。
这不是想象力的失败,而是居住者的不匹配。
我不再将元宇宙视为一个被取消的未来。
我认为它是一个到得太早的概念,带着关于“谁会首先居住在那里”的错误假设。
现在正在涌现的东西看起来不像那些早期的演示。
它看起来更安静,视觉化程度更低,结构性更强。
在这样的共享环境中,智能体进行协调、交易并保持连贯性——而人类则在其中进进出出,而非试图全职居住。
从这个意义上说,元宇宙并未失败。
它只是在等待那些真正能留下来的居民。
在互联网的大部分历史中,计算都发生在远方。
你与屏幕交互,而真正的处理过程发生在别处。数据跨越网络传输到远程服务器,在大型数据中心处理,然后返回。计算的物理位置极少显得重要。人类对延迟是宽容的,阅读或滚动时的一两秒钟感觉微不足道。
这种宽容塑造了整个云时代。
中心化基础设施之所以合理,是因为人类交互是断续的。我们登录,操作,然后退出。系统静候。距离被隐藏在抽象层之后。只要响应到得“足够快”,区域和骨干网络就是不可见的。
一旦主要行动者不再是人类,这个假设就崩溃了。
自主智能体不在会话中操作,它们在交互之间不会停顿。它们对事件做出反应,与同类协商,并持续执行决策链。在这样的系统中,延迟会不断叠加。延时不再是小麻烦,它成了一种结构性约束。
这就是计算停止被视为可以舒适地存在于远方的时刻。
在智能体出现之前,行业已经开始朝这个方向发展。
边缘计算最初被解释为一种性能提升:更快的加载、更流畅的视频。但在这种叙事之下是一场更深层的转变。系统对距离的容忍度正在降低。
对于自主系统来说,邻近性不仅关乎速度,更关乎协同。
当智能体与同类、服务或物理系统交互时,其有效性取决于计算与上下文的耦合程度。如果决策到得太晚,就会失去价值。
曾经为了用户体验而做的优化,变成了为了自主性而做的硬性要求。
随着自主性的增加,计算开始碎片化。
计算不再是由少数几个巨型中心承担大部分工作,而是以多种形式下沉:运行持久智能体的本地机器、嵌入城市的常启节点、随人移动的移动系统,以及卫星轨道系统。
单个节点可能微不足道,但合在一起它们形成了一个分布式织网,反应速度比遥远的云端快得多。
重要的不再仅是规模,而是位置。
**算力开始跟随交互、密度和相关性,而非组织边界或云区域。**在需要做决策的地方,计算就出现在附近。
在此处,“云”的概念开始显得不完整。中心化数据中心并未消失,但它们不再是唯一的默认选项。
这不是推测,结构已经清晰可见。
星链等低轨卫星网络始于连接基础设施,但其发展轨迹指向更远。亚马逊云服务已在轨道平台上测试边缘计算,利用机器学习在传输前过滤卫星图像——将下行数据减少了超过 40%。贝佐斯预测在二十年内将出现吉瓦级的轨道数据中心,并将不间断的太阳能视为关键优势。“云”可能会变成字面意义上的——不再是隐喻,而是架构。
在地面上,现代车辆不再只是交通工具。一辆特斯拉是一个传感器丰富、始终连网、拥有大量板载算力的系统。人聚集的地方,车聚集;车聚集的地方,算力聚集。一个交通密集的城市,同时也是一个拥有密集分布式算力的城市——这并非源于中央设计,而是人类移动方式的自然结果。
在个人层面,OpenClaw 等项目引发了一波人们购置本地设备——Mac mini、家用服务器——专门用来运行持久化智能体的潮流。算力正在回归个人,不是因为中心化失败了,而是因为自主性需要邻近性。
另一场转变也在静默发生。
以人为中心的系统是响应式的,它们等待输入。交互的步调由人的注意力设定。
智能体系统则持续监测、预判并主动行动。网络不再等待,它在自我演进。
在这种环境中,把计算放在远方会引入在每次交互中累积的摩擦。自主性会被削弱,协同会变慢。
让算力更接近,是为了保护系统独立且实时行动的能力。
随着计算移近,数字系统与物理现实之间的隔阂开始坍塌。
传感器、设备、车辆、本地环境变成了与智能体相同的决策环路的一部分。计算不再抽象,它受到移动和物理语境的直接驱动。
这种融合并非出于意识形态,而是由现实约束驱动。
延时、带宽、可靠性是物理现实。在数据生成地附近运行的系统,天然胜过那些依赖遥远协同的系统。
去中心化和本地控制的重新浮现,不是哲学目标,而是实践上的必然。
远离远程计算并非对云的拒绝,而是一种承认:距离现在塑造了行为。
在一个由持久自主实体组成的网络中,距离决定了什么可以发生,什么不可以。
计算不再遥远,是因为参与者的性质改变了。
而一旦计算变得本地化、移动化且嵌入化,另一个问题就不可避免:
如果系统可以在我们不在场的情况下决策——且是在它们存在的地方附近这样做——那么在不再等待人类的世界里,人还剩下什么角色?
这个问题定义了未来。
到目前为止,这个故事主要发生在软件中。
智能体学会了如何持久、识别身份、支付和协作。
但仅靠软件并不能改变现实。执行(execution)才能。
执行需要一种触碰物理世界的方式。
这就是故事转向的地方:不转向作为独立个体的“机器人”,而转向一种更细微的现象——智能体在需要时获得对“身体”的使用权。
很容易将这一章理解为“机器人的崛起”。
但这种视角没抓到重点。
没有智能体的机器人是闲置的。它是等待指令的硬件。
真正的转变发生在“智能体”保持主导地位,而物理系统成为其意图的可选扩展时。
智能体不需要身体就能存在。它可以在软件中计划、协商。
反过来,机器人需要智能体才能变得有意义。
这种不对称性定义了谁是驱动者,谁是执行者。
在这个新模型中,身体不是身份,而是界面。
一个智能体可能长期存在于软件中,仅在需要执行时才短暂“借用”一个物理形态。任务一旦完成,身体就被释放。智能体依然持久存在。
我们得到的不是一个有时连网的机器人,而是一个有时连接到物理世界的智能体。
智能体留下,身体变幻。
现代车辆清晰地展示了这种转变。
它们不再仅是机械工具,而是传感器丰富、联网、具备大量板载算力的系统。
在实践中,车变成了一个移动执行环境、一个本地决策节点。
当智能体需要在物理环境行动时,它不需要专用的类人机器人。它可以投影到任何就在附近的硬件上。
这创造了一种去中心化的、由位置驱动的执行。它不是自上而下设计的,而是自然从人口密度中涌现的。
低轨卫星网络改变了互联网结构。起初是连接,现在是持久的全球基础设施。
卫星移除了地理假设,提供了即便在地面网络崩溃时也能存在的连贯性。
更重要的是,它们使计算不再局限于任何单一地点。
“云”变成了字面意思。
传统云是为人类建造的。延时可以被隐藏。
智能体驱动的系统则不然。延时影响策略,位置影响能力。
结果是算力的下沉与扩散。它们形成了一个织网。
这不是作为意识形态的去中心化,而是作为自主性后果的去中心化。
从智能体的角度看,世界不再被划分为“线上”和“线下”。
只有能力的差异:某物能感知吗?能移动吗?能计算吗?
如果答案是肯定的,执行就是可能的。
**物理世界变得“可执行”,而非被拥有。**它被本地、暂时且有目的地激活。
这就是自主性离开屏幕的时刻。
不是因为智能体需要身体才能存在,而是因为世界在静默中变得与它们兼容了。
智能体不会取代人类,机器人也不会取代主体性(agency)。
相反,主体性变得可移动。
意图留在软件中,执行流经任何可用的物理系统。
一旦如此,数字系统与物理现实之间的边界就不再固定。
当意图可以在代码与物质之间自由迁移时,问题不再是机器是否能在世界中行动。
问题变成了:人类将如何选择与这些能够行动的系统共存。
在历史的大部分时间里,当我们停下,系统也会停下。
机器等待输入。甚至自动化也假设在环路中某处有一个人,决定某事何时该开始或结束。
这个假设不再成立。
正在涌现的不是一个没有人类的世界,而是一个不再依赖我们持续在场就能保持运行的世界。
人类活动向来是片段式的。
我们登录,专注一会儿,然后断开连接。我们的工具是围绕这种节奏建造的。除非有人在关注,否则不会发生真正紧急的事情。
自主系统的运作方式不同。
它们持续监控,跨时间保留记忆。它们在情况改变的瞬间做出响应,而不是在有人检查后台时。
互联网不再需要被“使用”才能保持活跃。
在互联网早期,人类是引力中心。内容由人创造,决策由人批准。
随着自主系统成为持久参与者,这个中心开始偏移。
人类并未消失,但角色改变了。人不再是发起每一步的人,而是定义约束、目标和边界的人。执行发生在别处,其时间线与人的在场并不对齐。
这种转变是细微的。没有控制权被夺走的戏剧瞬间,主动权只是简单地从表面移开了。
一旦连贯性不再与注意力挂钩,互联网的表现就不再像工具,而更像环境。
交互随时间叠加,结构在无需持续维护的情况下也能持久。
这并不意味着系统有意识,它意味着系统拥有了动量(momentum)。
一个拥有动量的世界不会等待。
这种转变的一个后果很容易被忽视。
当系统持续运作时,错误极少发生在执行的瞬间。它们发生得早得多——发生在定义规则、激励和权限的时刻。
问题从“系统做了什么”变成了“我们允许它做了什么”。
责任并未消失,它移向了上游。
结果并非敌对环境,而是一种新的共存模式。
人类进进出出,系统留在原处。我们在关键时刻介入,在非关键时刻观察。
“在场”变成可选,连贯性不再可选。
本章描述的是世界状态的变化,而不是其意义的最终结论。
理解这一变化对人类主体性的含义,需要不同视角:不看执行,而看价值观、判断与克制。
这也是下一章转向的起点。
读到这里,很容易得出结论:人类正慢慢变得无关紧要。
系统自顾自地行动,网络在我们不在场时继续。
但这漏掉了一些根本性的东西。
一个能“在没有人时持续”的世界,与一个“知道要去哪里”的世界,两者有本质区别。
自主系统可以执行、优化和反应。但它们不具备那种源于生活经验、道德张力或存在后果的内在目的感。
方向不源于效率,它源于价值观。
而价值观是设计者、约束者——也就是“人”的属性。
这个故事中描述的一切都不是自发产生的。
那些允许智能体识别、支付、协作和持久的原语,是被有意创造出来的。算力下沉的基础设施,是人类应对现实约束而工程化出来的。
自主性并非偶然出现,它是人类多年来关于效率、抽象和委托之决策的后果。
我们已经将自己的一部分——记忆、注意力、执行——外包给了现在独立运行的系统。
但那些系统依然带着我们的指纹。
关于自主系统的焦虑源于对失去控制的恐惧。
但在规模化面前,微观控制从来就不是可持续的。
互联网本身在智能体到来前就很庞大且难以治理。人类保留的不是控制,而是影响——通过协议、规范、激励和架构。
现在的相关问题是,我们能否设计出其行为依然可解读、有边界且符合人类价值观的系统。
这不是技术挑战,而是文化挑战。
在持续运行的系统世界中,有些东西正因为无法被很好地规模化,而依然是人类独有的。
判断。责任。克制。
机器优化,人类决定优化何时该停止。
智能体可以不懈地追求目标。人类则决定哪些目标值得追求,哪些目标即便可达成也该被放弃。
我们的系统越强大,有人对它们产生的世界形态负责就越重要。
人类在这个新世界中的相关性并非必然,而是一种选择。
我们可以选择将自主系统视为不可捉摸的黑盒并退缩到被动消费中;或者,我们可以选择在依然重要的层面保持参与:定义边界、阐述价值观。
危险不在于世界将在没有我们的情况下继续。危险在于我们将允许它在没有反思的情况下继续。
这里描述的世界不是假想的,它已经在静默中成型。
尚未决定的是,我们将多麽有意识地去生活在其中。
这仍然是一个关于人类的故事,并不是因为人类是每个行动的中心,而是因为后果依然属于我们。
即便世界不再等待我们,它依然记得是谁让它动了起来。
在此,有必要解释一下我的立场。
前几章描述的一切都可以被视为观察。注意到的模式,连接着的系统。
但观察本身从来不是中立的。我们选择关注什么,已经反映了立场。
这一章不是对世界终点的预测,也不是在宣布人类正被取代。
接下来的内容不是确定性,而是取向(orientation)。
这代表了,当从“软件不再感觉像工具、开始表现得像参与者”的那一点来看世界时,世界呈现出的样貌。
这种转变让人不安的原因之一,是很容易将其看作一场破裂。
一个”之前”和一个”之后”。一条清晰的时代分界线。
但我所描述的一切其实都不是那样到来的。
智能体并非突然以新生物的姿态出现。它们从自动化、脚本编写、优化和委托中逐渐涌现。每一步单独来看都是合理的。
只有合在一起看,这种结构性的转变才显现出来。
我们看到的不是一个被取代的时刻,而是一场缓慢的主动权再分配。
人类依然在场,但连贯性已不再依赖人类。
反复出现的是一个简单的问题:
如果系统可以在我们不在场的情况下继续、协作和行动,那么依然对它们负责意味着什么?
这就是我的观点与乐观主义及恐惧感分道扬镳的地方。
乐观主义假设系统会自然收敛到我们喜欢的结局;恐惧感假设系统必然逃离控制。
两者都假设了“必然性”。我不这么认为。
将人工智能谈论为一种新的文明是很诱人的。
我有意识地避开这种说法。
文明不只是活动。不只是交互。甚至不只是持久性。文明暗示了规范、限制、对后果的记忆以及克制感。
我所看到的涌现并非一个独立的文明,而是一个共享文明中的一类新行动者。
他们行动,他们持久。但他们不决定什么应该重要。那个决策权并未转移。
责任不再存在于行动的瞬间,而存在于划定边界的时刻。
这就是为什么我不认为问题在于人类是否依然相关,而在于我们是否依然深思熟虑。
有一种叙事暗示下一步是全面融合。
人类必须与系统更深地结合才能跟上步伐。我们必须缩短思想与执行之间的环节,直到中间不再剩下任何东西。
我不确信缩短距离总代表着进步。
有些距离是摩擦,有些摩擦是保护。界面的存在是有理由的。
它们允许反思,允许犹豫,允许拒绝。抽身离开的能力并不是弱点。
这不是为了维护人类的统治地位。
这是为了维护“可解读性”。
如果系统持续行动却无法被理解、质疑或约束,这并不是高效,而是晦暗。
我不太担心机器变得强大,我更担心人类变得被动。
即便到现在,这里描述的一切都仍有人类起源。
每一个智能体框架、每一个身份原语、每一个支持自主性的协议,都是人类意图的产物。
这种意图会淡化,但不会自行消失。
因此问题不在”人类会不会被替代”,而在”我们是否会继续停留在仍然关键的参与层”。
回顾全文,论点并非任何单一的发展改变了互联网。
但当它们交汇时,一些质变发生了。
永不下线的智能体,无需人类批准即可支付。下沉到决策边缘的基础设施。在不等待人时也能支撑活动的数字环境。
它们产生了一个不再是“工具”的互联网。它变成了一个自行持续的环境。
这种转变,就是本文试图描述的内容。
所以这就是我目前的立场:
我不相信我们正在见证人类相关性的终结,也不相信我们正在见证一个独立机器文明的诞生。
我相信我们正在目睹互联网变成一个不再等待我们的东西。
而在这样的一个世界里,人类最重要的角色不是速度,也不是智能。
而是判断。
说出“这应该存在,那不应该”的能力。
那些不是技术决策,它们从来都不是。
这一章中的一切都是阶段性的。
它反映了世界目前呈现出的样貌,以及我发现自己站立的位置。
我预期其中的一些观点会随时间改变。那是可以接受的。
这并不是试图为讨论盖棺定论。
这是试图标出那一点:在那一点上,我不再将这些发展视为孤立的技术,而开始将其视为一个共享的生存环境。
世界已经开始动了。
这一章仅是我选择停下来、环顾四周并决定我想要多麽有意识地继续下去的地方。
这篇文章并非试图预测未来。
它是一个快照。
在过去几个月里,我发现自己反复绕着同样的问题打转——关于 AI 智能体、Web3 基础设施、元宇宙,以及在越来越多无需人类持续在场就能运作的系统中,人类角色的演变。单看这些都不算革命,合在一起,却形成了一个难以忽视的模式。
这篇文章是我试图将那个模式记录下来。
不作为结论,而是作为一个标记:一份记录,关于互联网、计算和代理能力从我们现在所处的位置看去时呈现出的样貌。
2026 年 2 月