人工智能如何在自我构建方面取得进步
2026年7月4日,Anthropic,一家人工智能实验室,将于今年晚些时候在股市上市,预计将成为历史上最大的首次公开募股之一。这是因为该公司的聊天机器人Claude受到程序员的喜爱,他们愿意支付高价来获得访问权限。
自从Claude Code,这个软件工程代理于2025年2月推出以来,它已成为全球开发者不可或缺的工具。Anthropic公司表示,2025年5月发布的代码中有超过五分之四是由Claude编写的,而在Claude Code之前,这一比例仅为个位数。
这些系统在输出质量和数量上都有所提高。一个来自智库METR的有影响力的基准显示,2025年初,Anthropic的模型可以完成需要人类工程师不到一小时的任务。该公司的最新系统可以完成需要超过一个工作日的任务。
因此,当公司在6月5日呼吁世界「有选择地减缓或暂时暂停前沿AI开发」时,可能会引起一些人的怀疑。作为市场领导者,谁不希望竞争对手停止追赶呢?
然而,Anthropic的领导者多年来一直担心失控的AI可能带来的破坏,他们似乎是认真的。最新一代的AI模型是如此出色的程序员、工程师和(即将成为的)科学家,以至于许多人担心它们可能是人类制造的最后一批。Anthropic的联合创始人杰克·克拉克(Jack Clark)认为,到2028年底,有60%的可能性AI系统能够在没有人类干预的情况下创建自己的继任者。
这一时刻将标志着一个称为「递归自我改进」(RSI)的过程的开始,这是一个封闭的循环。模型的第一个版本产生第二个版本,速度更快、能力更强;第二个版本产生第三个版本,能力更强。循环继续,每次迭代的改进都会增长。建立一个能够做到这一点的AI系统,你的人类工程师再也不需要构建另一个系统了。「对许多人来说,这似乎是一个幻想故事,但实际上可能是一个真实的趋势,」克拉克说。
AI悲观主义者担心超级智能将超出人类控制。
没有人确切知道递归自我改进的后果是什么。因为AI可以不知疲倦地工作,有些人认为这将很快导致超级智能AI的出现——「快速起飞」。(它也被拟声地称为「爆炸」,因为人们可以想象智能爆炸发出的声音。)
然而,自我改进的AI可能会面临速度限制,至少在最初是这样。
构建一个能够进行RSI的模型需要自动化目前由人类执行的一系列专业任务。
目前,数据科学家研究AI理论,程序员将其付诸实践。系统工程师构建基础设施,以便将玩具模型提升到生产规模。其他人则寻找新的训练数据来源,或尝试生成新数据的方法。对齐和安全团队检查训练过程的输出是否会造成有意或无意的伤害。
并不是所有这些团队都同样适合AI的帮助,而且在每个专业领域中,有些任务比其他任务更容易自动化。可能不久之后,人类程序员可以在不编写任何计算机代码的情况下完成工作,但可能还需要一段时间,AI才能协商获取以前未数字化的科学论文集。
并不总是显而易见「锯齿状前沿」将如何发展。设计新算法似乎是较为安全的工作之一,直到谷歌DeepMind的模型AlphaEvolve在2025年5月开始这样做。
它提出了一项关于谷歌如何在其数据中心分配工作负载的变更,节省了公司全球计算能力的0.7%,并找到了更好的矩阵乘法方法,这加快了公司旗舰大型语言模型Gemini的训练速度1%。
完整的RSI需要将这一链条中的每个任务自动化。然而,AI驱动的研究和开发(R&D)加速可能会在此之前感受到。
根据乔治城大学的一个智库——安全与新兴技术中心(CSET)在1月发布的一份报告,「随着AI系统执行的AI R&D比例增加,生产力提升可能是人类独立R&D的十倍、百倍甚至千倍。」在这种情况下,即使AI R&D的某些方面最初难以自动化,「加速的进展速度意味着这些瓶颈很快就会被克服。」
今天,没有AI模型可以构建自己的继任者。但大型AI模型可以自己构建较小的模型。在人类的帮助下,它们也可以构建其他大型AI模型。今年早些时候,安德烈·卡帕西(Andrej Karpathy),一位当时的独立研究员,现在为Anthropic工作,训练了一个与2019年由OpenAI构建的大型语言模型GPT-2一样有能力的聊天机器人。
当时,该模型需要在32个最先进的芯片上进行168小时的训练;卡帕西仅用一台配备8个GPU的计算机——用于构建AI的专用芯片——在短短三小时内达到了同样的结果。经过几个月的努力,他将其模型Nanochat的训练时间缩短到略超过两小时。
在3月,他将加速训练过程的工作交给了一个名为Autoresearch的AI代理。在两天内,