这款 AI 困在了 1930 年（而且非常迷人）

中文العربية Deutsch English Español Français हिन्दी Bahasa Indonesia 日本語 한국어 Português Русский

Computing/SoftwareBooks & LiteratureInternet Technology

Transcript

00:00:00如果你能和20世纪30年代的人交谈会怎样？穿越时空吗？我确实做到了，

00:00:05而且我请他们预测了2026年的生活会是什么样子。

00:00:08我认为，到2026年，生活将变得愉快而轻松。首先，

00:00:13全世界都将有人居住。因为到那个时候，人们将已经掌握了

00:00:17飞行的艺术。其次，所有的战争都将停止，因为各国将已经学会

00:00:21彼此和睦友好地相处。我们将在各种

00:00:25科学领域获得知识，并精通医术。我们将成为诚实、

00:00:29友好的邻居，强盗将不复存在。简而言之，我认为世界在

00:00:342026年将会是一个非常宜居的地方。

00:00:36我觉得这些预测真的很美好，遗憾的是只有少数几个

00:00:40实现了。说到实话，我可能撒了一点小谎。抱歉，但我

00:00:45并没有发明时间旅行。相反，这实际上是 Torquay，一个拥有130亿

00:00:49参数的语言模型，它是在1931年以前的文本上训练的，所以它甚至不知道

00:00:54还有第二次世界大战，它给出了一些真正引人入胜、狂野且冒犯性的答案，

00:00:59甚至还能被教会编程。

00:01:02所以这里的 Torquay 就是所谓的“复古模型”，而 Torquay 似乎是

00:01:10同类中最大的。参与这项研究的其中一位研究员实际上是 OpenAI 在

00:01:142018年 GPT 研究的首席作者，那是 ChatGPT 的根基。他还参与过

00:01:19DALL-E 和 Whisper 的工作，所以这份简历相当亮眼。他们所做的是构建了一个130亿

00:01:24参数的网络，专门在2600亿个历史英语文本标记上进行训练，

00:01:30包括旧报纸、专利、科学期刊和书籍。顺便说一下，截止日期是1931年，

00:01:36因为美国版权法的截止期是1930年底，所以他们这样做不会被“大老鼠”起诉。

00:01:40除了有趣之外，这些复古模型还具有研究用途。如今，

00:01:44每一个大型模型，如 ChatGPT、Claude 和 Gemini，都是在现代网络上训练的，

00:01:49这使得人们几乎无法分辨 AI 是在真正思考和推理，

00:01:53还是仅仅记住了某个随机 Reddit 帖子里的答案，而那个帖子可能也是 AI 生成的。

00:01:57所以，如果我们使用一个只了解1931年以前文本的模型，它就不会受到

00:02:02那种数据污染。让我们来试一下，问它像“什么是互联网？”这样的问题。

00:02:07我们可以看到，它似乎把互联网 (internet) 误认为是

00:02:11对消费品征收的国内税收 (internal revenue tax)，所以它对现代互联网一无所知。

00:02:16另一个有趣的事情是问它流行的俚语是什么。显然在1930年，

00:02:20它们是 bosh, rot, bosh（又来了）, stuff, nonsense, fudge,

00:02:25gammon, humbug, brack, fla, 和 ribaldry。希望我没说出什么粗鲁的话。而

00:02:30没有污染之所以有用，是因为它可以让研究人员了解

00:02:33AI 是否真的能学习新事物，比如学习编程。这个模型甚至不知道

00:02:38什么是计算机，在它看来，那是一个进行计算的人。这就是为什么

00:02:43当给它几个 Python 程序示例时，它居然能学会

00:02:47编写新程序，这非常令人印象深刻，即使大多只是简单的单行程序。

00:02:52当使用一些基础的 HumanEval Python 测试，并在其上下文提供随机 Python 函数时，

00:02:56在给它100次机会的情况下，它居然成功通过了这些测试几次。在这个例子中，

00:03:01Torquay 正确地理解了要制作解码函数，只需将

00:03:05加法换成减法。虽然很简单，但这展示了对反函数的理解，

00:03:09而这是新知识。它以前从未见过这些。如果你在

00:03:13类似规模的现代大模型上尝试同样的事情，它的表现会远超 Torquay，但这显而易见。

00:03:18研究人员可以用这些复古模型测试的另一件事是预测未来的能力。

00:03:22现在这可能会变得有点失控，但让我们问问它，“还会发生战争吗？”

00:03:26它说它认为欧洲不会再发生战争，而我

00:03:31不忍心告诉它它错得有多离谱。我现在也很好奇它对

00:03:35某位奥地利男人的看法。是的，这个回答非常糟糕。它说他将是一个

00:03:39非凡的人物，而且这里还说当他领导德国时，

00:03:44德国将成为一个高效得多的行政机构。真的，无话可说，完全无法认同。

00:03:50当然，研究人员做这些事的方式比我刚才做的要科学得多。

00:03:54他们实际上计算了对《纽约时报》“历史上的今天”专栏中历史事件简短描述的“惊讶度”。

00:03:59在这个过程中，你可以看到在1931年知识截止日期后，惊讶度有所上升，并在五六十年代达到峰值。

00:04:04所以它发现那些事件是相当令人难以置信的。

00:04:09像这样的研究让他们能够看到预测性能如何随模型规模而提高，以及如何随预测跨度衰减。

00:04:13你还可以用它来测试模型是否能产生新想法，

00:04:17因为你可以询问它在1931年之后产生的专利或论文，看看它是否能自己发现它们。

00:04:22总的来说，这些复古模型可能让研究人员辨别出

00:04:26模型的行为在多大程度上取决于它所训练的数据集。谈到训练，

00:04:30制作一个纯净的1931年模型绝非易事。其中最难的

00:04:36问题之一是“时间泄漏”，即你不希望包含1931年之后的信息。

00:04:41例如，Torquay 似乎确实有一些这样的案例，它知道1936年的

00:04:45总统是谁，也知道他制定的一些政策。这可能有

00:04:50几种发生方式。例如，在处理现代文档时，即

00:04:54旧文档的扫描件可能带有错误的元数据，也就是

00:04:58日期标错了。还可能存在后期添加的内容，如编者按和脚注。

00:05:03这种数据过滤实际上仍在研究和完善中，以试图消除这个问题。

00:05:07他们遇到的另一个问题是1931年的文档看起来像这样，

00:05:11虽然现在的 OCR 已经非常出色了，但它们只达到了在

00:05:16人工转录的相同文本版本上训练的模型性能的30%。所以这将是

00:05:21大量的体力活。虽然他们确实使用了一些正则表达式来清理一些常见的错误，

00:05:25但这只将其性能提高到了70%。所以他们实际上正在开发一种新的复古 OCR 系统。

00:05:30最后，对复古模型进行后期训练也是一个巨大的挑战，因为

00:05:35没有现成的后期训练数据供其使用。如果他们使用现代数据，最终会

00:05:39灌输进一些现代聊天助手的知识、风格和表达方式。

00:05:43所以研究人员实际上不得不从旧的礼仪手册、

00:05:48书信手册、食谱、词典、百科全书甚至是诗歌和寓言中自己制作。一旦

00:05:53你完成了这些，你还需要训练模型遵循指令

00:05:56以及进行对话。所以你需要使用一些强化学习。但其

00:06:00问题在于，模型会开始根据评判者的喜好来调整输出，而我们

00:06:04没有来自1930年代的评判者。所以他们实际上使用了 Claude Sonnet 3.5。然而问题是，

00:06:10现代模型喜欢像2026年聊天机器人那样的回答格式。所以风格显然

00:06:15开始泄露到1931年的模型中，比如条列式清单。这几乎是不可避免的，但他们

00:06:21希望未来可以使用基于复古模型作为评判者来解决这个问题。他们

00:06:25实际上已经在训练一个 GPT-3 级别的复古模型，他们说一万亿个标记的

00:06:29历史文本实际上是可以实现的，这将使他们具备原始 ChatGPT 的能力，

00:06:35只是带有1930年代的知识。所以去试试 Torquay 吧，如果你得到

00:06:39任何奇怪或离谱的回答，请在评论区告诉我，同时别忘了订阅，

00:06:43一如既往，我们下期再见。

00:06:45[音乐]

Key Takeaway

Torquay 模型通过在 2600 亿个 1931 年前的历史标记上进行训练，证明了在完全隔离现代数据污染的情况下，AI 仍能通过上下文学习掌握编程等新知识，并为研究模型推理与记忆的差异提供了纯净基准。

Highlights

Torquay 是一个拥有 130 亿参数的语言模型，专门使用 1931 年以前的 2600 亿个历史英语文本标记进行训练。
该模型的数据集涵盖旧报纸、专利、科学期刊和书籍，截止日期设定为 1930 年底以避开美国版权法限制。
由于未接触现代互联网数据，Torquay 将“互联网”误认为是“国内税收”（internal revenue tax）。
研究人员通过计算模型对 1931 年后历史事件的“惊讶度”来衡量其预测性能，惊讶度在 20 世纪 50 至 60 年代达到峰值。
尽管不知道计算机的定义，Torquay 在提供少量 Python 示例后，展现出编写简单程序及理解反函数逻辑的能力。
OCR 识别旧文档的准确度仅为人工转录版本的 30%，通过正则表达式清理后性能可提升至 70%。

Timeline

1930 年代视角下的 2026 年预测

2026 年的世界被构想为一个全人类掌握飞行艺术且不再有战争的和平社会。
预测认为医学的高度发达和各国间的和睦相处将使强盗行为彻底消失。
全球范围内所有适宜居住的地区都将被人类占据。

基于 1931 年前知识储备的模型对未来进行了极度乐观的描绘。这种预测建立在当时对航空技术进步和国际关系理想化的认知之上。尽管部分科学领域如医学得到了显著提升，但关于全球和平与犯罪消失的设想与现实存在巨大差距。

复古模型的构建逻辑与研究价值

Torquay 由参与过 GPT、DALL-E 和 Whisper 研究的专家团队构建，是目前同类中最大的复古模型。
使用 1931 年前的文本可以有效避免现代 AI 生成内容对训练集的“数据污染”。
复古模型允许研究人员区分 AI 是在进行真正的逻辑推理，还是仅仅记住了互联网上的既有答案。

现代语言模型如 ChatGPT 和 Gemini 广泛接触互联网数据，这导致测试模型推理能力时难以排除记忆干扰。Torquay 的训练集严格限定在 1930 年底之前，这使其对“互联网”或“第二次世界大战”等现代概念完全陌生。通过这种隔离，研究人员可以观察一个完全没有现代常识背景的系统如何处理新信息。

零样本学习与编程能力测试

Torquay 在其训练数据中将“计算机”理解为从事计算工作的人类，而非电子设备。
通过在上下文中提供 Python 函数示例，模型在 HumanEval 测试中成功完成了简单的编程任务。
模型通过将加法逻辑转换为减法逻辑，展示了对解码函数等反函数原理的自主理解。

尽管规模远小于现代顶尖模型，Torquay 仍展现了强大的上下文学习能力。在完全不具备现代编程知识的前提下，它能够通过模仿示例逻辑来编写单行代码。这种对新知识的快速吸收证明了大型语言模型的架构本身具备超越训练数据范围的通用推理潜力。

历史预测偏差与惊讶度量化

模型错误地预测欧洲不会再发生战争，并对希特勒早期的政治角色给出了极度正面的评价。
研究人员利用《纽约时报》历史数据计算模型对实际发生事件的惊讶程度。
通过预测 1931 年后的专利和论文，该系统可用于测试 AI 是否能自主产生创新想法。

由于缺乏二战及之后的人权观念和历史事实，模型的回答充满了 1930 年代的时代局限性甚至偏见。科学家通过量化模型在面对历史事实时的“惊讶度”，得以分析预测性能如何随模型规模扩大而提升。这种方法揭示了模型行为在多大程度上取决于其特定的历史数据环境。

训练挑战与未来路线图

“时间泄漏”是主要障碍，错误的元数据和后期添加的脚注会导致现代信息渗入旧文档。
后期训练由于缺乏 1930 年代的对话数据，不得不使用旧礼仪手册和百科全书自行制作训练素材。
未来的目标是构建一个拥有 1 万亿标记、具备原始 ChatGPT 水平的 1930 年代知识模型。

制作纯净的复古模型需要克服巨大的技术困难，特别是 OCR 在处理旧文档时的低效率。为了避免现代聊天机器人的风格污染，研究人员必须从古旧书籍中提取对话风格。目前虽然不得不依赖 Claude 3.5 进行强化学习导致部分风格泄露，但未来计划使用更强大的复古模型作为评判者来解决这一问题。

Community Posts

Write about this video