人工智能行业:2027年AI预测报告
2027人工智能原发布于2025年4月3日在AI-2027.com由Lightcone基础设施设计人工智能未来项目丹尼尔·科科塔伊洛 斯科特·亚历山大 托马斯·拉森 艾利·利夫兰 罗密欧·迪恩希望您发现AI 2027有帮助。AI 2027在每一章的开头,你会在右侧页边栏找到一个小的图表,旨在让你了解该场景发生时世界的情况。若要了解这些数字的含义的更详细解释,以及我们方法的更多更详细的信息,请访问ai-2027.com。我们预测,未来十年的超级人工智能的影响将是巨大的,将超过工业革命的影响。OpenAI、谷歌DeepMind和Anthropic的首席执行官都预测,通用人工智能将在未来5年内到来。萨姆·奥特曼表示,OpenAI的目标是“真正意义上的超级智能”和“光辉的未来。”人们很容易将其视为只是炒作。这将是严重的错误——它不只是炒作。我们并不想自己炒作人工智能,但我们认为超级智能在本世纪末到来是极有可能的。我们不会在所有事情上都正确——这大都是猜测。但在整个项目过程中,我们进行了大量的背景研究、专家访谈和趋势外推,以做出我们能做出的最明智的猜测。此外,我们的团队在预测方面有着优异的记录,尤其是在人工智能方面。首席作者Daniel Kokotajlo在4年前撰写了一个类似的情景,名为“2026年将是什么样子”,其时效性出奇地好,而Eli Lifland是一位顶尖的竞赛预测家。如果我们正处于超级智能的边缘,社会远未做好准备。很少有人甚至试图阐述通过超级智能发展的任何可行路径。我们撰写《AI 2027》就是为了填补这一空白,提供急需的具体细节。我们希望看到世界上有更多这样的工作,尤其是来自不同意我们观点的人们。我们希望通过这样做,引发关于我们走向何方以及如何驶向积极未来的广泛讨论。我们通过反复问自己“接下来会发生什么”来撰写这个场景。我们从当前时代开始,撰写第一个时期(直到2025年中期),然后是下一个时期,直到达到结局。我们并没有试图达到任何特定的结局。然后我们放弃了它,重新开始,很多次,直到我们得到了一个我们认为可信的完成场景。在我们完成第一个结局——赛车结局之后,我们写了一个新的替代分支,因为我们还想描绘一种更充满希望的方式,在大致相同的前提条件下结束。世界首次看到了人工智能代理。2025年中:蹒跚的智能体2025年末:世界最昂贵的AI*例如 OpenAI 的专业版计划 目前每月费用为200美元,以及代理式编码AI德文 目前每月费用为500美元。虽然尖端系统随着时间的推移继续变得更昂贵,但达到特定能力水平的客户成本却持续暴跌。对于现有能力,这种情况以每年约50倍的速度发生(每轮次 ).†这个集群是一个分布在全国各地的数据中心园区网络,总共拥有250万个2024-GPU等价单位(H100s),到目前为止已花费了1000亿美元,并在线消耗了20GW的电力。到2026年,建设将至少翻一番。这些园区通过价值数十亿美元的光纤电缆连接起来,以便(除了光速延迟的几毫秒之外),它让这些园区几乎就像紧挨着彼此一样运行(即带宽不是瓶颈,意味着可以同时发送大量数据)。从安全的角度来看,这引入了一些威胁面(尚不清楚电缆及其交叉点是否完全安全,可以防止窃听者)。1最初,大多数人不愿意在没有监督的情况下允许购买。在接下来的几年里,随着人工智能变得越来越可靠并建立信任,自动允许小额购买变得正常化。OpenBrain正在建造世界有史以来最大型数据中心。†(为了避免突出现有的任何一家公司,我们将描述一个虚构的 通用人工智能 公司,我们称之为OpenBrain。我们想象其他公司大约落后OpenBrain 3-9个月。)与此同时,在公众关注之外,更专业的编码和研究代理人也开始转变他们的职业。4企业工具,如 采摘 也朝着提供越来越自主的AI代理的方向发展。为电脑使用代理广告强调“个人助理”一词:你可以用类似“在DoorDash上为我点一个墨西哥卷饼”或“打开我的预算表格并计算本月的支出”这样的任务来提示它们。它们将根据需要与你联系:例如,询问你是否确认购买。1尽管比之前的版本更先进,如 操作符 ,它们难以获得广泛应用。22具体来说,我们预测他们在基本计算机任务的标准OSWorld基准测试中的得分为65%(与操作员的38%和典型非专家熟练人类的70%相比)。3例如,我们认为编码代理将朝着功能如同 德文 . 我们预测,到2025年年中代理人将得分85% SWEBench-验证 .2024年的AI可以遵循特定指令:它们能将项目符号列表转换为电子邮件,将简单请求转换为可运行的代码。到2025年,AI的功能更像员工。编程AI越来越像自主代理,而非仅仅是助手:通过Slack或Teams接收指令,并自行进行实质性的代码更改,有时能节省数小时甚至数天。3研究人员花半个小时在网上搜寻来回答你的问题。代理理论上很令人印象深刻(以及在精心挑选的例子中),但在实践中不可靠。人工智能推特充斥着因处理任务而以极其滑稽的方式搞砸的故事。更好的代理也很昂贵;你付出多少,得到多少,最佳性能每月要花费数百美元。*然而,许多公司找到了将AI代理融入其工作流程的方法。4 2025年末:世界最昂贵的AI同样的训练环境,让Agent-1学会自主编程和网页浏览,也使其成为一个优秀的黑客。此外,它还可以提供 实质帮助 为设计生物武器而向恐怖分子提供帮助,感谢其每个领域的博士级知识以及浏览网页的能力。OpenBrain向政府保证,该模型已被“校准”,因此它将拒绝执行恶意请求。8它在这方面表现出色,这得益于对优先发展这些技能的明确专注、它们可以利用的自身庞大且与任务高度相关、高质量的代码库,以及编程作为一个易于进行程序性反馈的领域。尽管模型在广泛技能上有所改进,但有一个模型脱颖而出:OpenBrain专注于能够加速人工智能研究的AI。他们想要在与中国(我们称其领军公司为“DeepCent”)的这场双臂竞赛中获胜。7和他们的美国竞争对手。他们能够自动化的研发(R&D)周期越多,他们就能越快发展。因此,当OpenBrain完成训练内部开发的模型Agent-1时,它擅长很多事情但是 太棒了 在帮助人工智能研究方面。8到这个阶段,“完成训练”有点名不副实;模型经常会被更新到基于更多数据训练的新版本,或者部分重新训练以修补一些弱点。9*人们常常纠结这些人工智能是否具有意识,或者是否拥有“真正的理解”。该领域的诺贝尔奖获得者创始人 Geoffrey Hinton, 认为他们做 然而,我们认为这对我们的故事目的无关紧要,因此,每当我们在说“理解”时,您可以自由地假装我们说的是“表现得好像理解……”,诸如此类。从经验上讲,大型语言模型已经 表现得好像它们有自我意识 到某种程度,越来越多,而且每年都如此。†一种常用技术是将角色“烘焙”进去:首先,用类似“以下是人类用户和一个由Anthropic生产的有帮助、诚实且无害的AI聊天机器人之间的对话。该聊天机器人具有以下特质……”这样的内容提示预训练模型。用这个提示生成大量数据。然后,在没有提示的情况下用这些数据训练。结果是,这个AI总是表现得好像面前有那个提示,无论其他什么情况9例如,假设一个模型在Python方面远比在晦涩难懂的编程语言上表现更好。当
[AI Futures Project]:人工智能行业:2027年AI预测报告,点击即可下载。报告格式为PDF,大小9.64M,页数71页,欢迎下载。