世界各地的图书馆和档案馆中都保存着被晦涩难懂的密码所掩盖的历史文献和信息。人工智能正在帮助历史学家破解这些神秘的文本。在梵蒂冈图书馆的深处一本神秘的手写书籍静静地躺在那里四百多年来无人问津。书页上密密麻麻地写满了奇异的符号。根据封面内侧的文字记载这些晦涩难懂的文字似乎隐藏着“治疗人体疾病”的秘方。在当时这类疗法都被严加保密因为它们可能会招致怀疑甚至被指控为巫术。这份被称为“博格密码”的408页手稿大部分内容难以理解——它使用34个晦涩难懂的符号、少量罗马字母以及一页阿拉伯文书写的封面进行编码。目前尚无已知的密钥可以破解加密内容。由于年代久远部分页面已经破损这使得密码的解读更加困难。但借助机器学习一种人工智能技术研究人员成功破解了这段代码。他们发现这段文字中充满了数千种奇特的疗法例如饮用几杯优质红酒或在面团中发酵肉豆蔻来治疗痢疾。您可以在梵蒂冈图书馆在线查看完整的加密文档馆藏编号为 Borg.lat.898。“这就像侦探工作一样每一个符号、模式和部分答案都可能让我们更接近某个人的秘密和一个失落的历史世界”瑞典斯德哥尔摩大学计算语言学教授贝娅塔·梅格西说道她是破译文本团队的成员之一。即使借助人工智能破解密码的过程仍然十分艰辛。现在梅格西和她的同事们正致力于利用人工智能的力量更有效地破解历史密码有可能解锁大量以前无法破解的古代编码信息。这为罕见和非标准文字系统开辟了令人兴奋的可能性——贝娅塔·梅杰西据估计世界各地档案馆和图书馆中约有1%的资料被全部或部分加密。已知最早的一些密码可以追溯到古希腊和古罗马时期。诱饵、死语言和糟糕的笔迹这些加密的历史文献共同隐藏着外交情报、秘密社团的仪式、医学知识、爱情故事以及人们想要保密的日常琐事。这些信息目前在历史叙述中缺失。在某些情况下破译这些文献有可能改写我们对某个名人或整个历史时期的认知。最近一个成功的例子是人们发现了一些加密信件这些信件是苏格兰女王玛丽在英格兰长期囚禁期间所写的。这些信件揭示了她参与夺回王位的阴谋以及她与儿子——苏格兰国王詹姆斯六世未来的英格兰国王詹姆斯一世——之间紧张的关系。历史上的密码可能相对简单例如博格密码就使用了一种直接的替换密码即用一个罗马字母替换每个符号来隐藏所写的内容。然而其他一些密码则难以破解。在某些情况下我们对未加密文本的原始语言一无所知。此外还可以插入一些额外的、无意义的符号作为诱饵以迷惑任何试图窥探文本的人。在其他情况下多个符号可能被用来表示同一个字母。这意味着即使解码一小段文字也需要耗费大量精力——通常需要反复尝试。法国南锡国家信息与自动化研究所 (INRIA) 的密码学家塞西尔·皮埃罗和她的同事们花了六个月的时间才逐步破解了一封五百年前写给神圣罗马帝国皇帝兼西班牙国王查理五世的信件。这封信共三页使用了120种不同的密码符号。解密后的信件揭示了查理五世——这位当时最有权势的人物之一——因担心有人密谋刺杀他而陷入困境。国王当时非常害怕一位效力于法国国王弗朗索瓦一世的意大利雇佣军首领即将刺杀他。博格密码据信已有约 400 年的历史其 408 页上混合了密码符号和一些拉丁文文字图片来源2026 年梵蒂冈宗座图书馆。在开始破译密码之前研究人员必须先费力地将手写密码转换成可输入密码破解软件的数字文档。字迹潦草和墨迹褪色都会使这项任务更加困难。皮埃罗说她通常要花一天时间才能誊写一封两页的信信中包含她不熟悉的符号。人工智能如何帮助人们快速阅读秘密但人工智能正在加速这一进程。挪威奥斯陆大学德语语言学教授米歇尔·瓦尔迪斯普尔Michelle Waldispühl及其同事最近利用名为Transkribus的在线人工智能平台转录了贵族西吉斯蒙德·豪斯纳·冯·万德斯莱本Sigismund Heusner von Wandersleben于1637年写给瑞典大法官阿克塞尔·奥克森斯蒂尔纳Axel Oxenstierna的一封秘密信件。当时正值三十年战争的高峰期这场宗教冲突最终夺去了数百万人的生命并摧毁了欧洲的大片地区。该工具已针对多种语言、文字和手写风格进行了训练涵盖数个世纪。文档图像上传到系统后人工智能会先检测文本块和单行然后逐字扫描整个文本将其转换为数字格式。尽管需要进行一些人工校正但该工具在解读冯·万德斯莱本的信件时效果相当不错因为信件只有一部分使用了加密加密方式是用数字和点分隔这些数字书写工整点与点之间留有明显的空格。其余部分则没有加密而是直接用17世纪的德语字体书写。现有的AI转录平台在处理使用特殊字符加密的手稿时往往举步维艰例如自创符号、占星符号或书写方式奇特的数字。但作为跨国Descrypt项目的一部分Megyesi、Waldispühl及其同事正在开发他们自己的AI工具将包含晦涩符号或文字的手写历史文本转换为机器可读文档。“我们正在开发更具适应性的模型这些模型经过训练和测试涵盖了广泛的文字、字母和符号体系”梅格耶西说。世界各地的许多档案馆和图书馆都保存着加密文本其中可能包含宝贵的历史信息图片来源Getty Images。一旦秘密文件被转录完毕破解工作便可展开。目前密码学家通常使用专门设计的非人工智能计算机软件来辅助这项工作这些软件利用算法来尝试确定所使用的密码并破解密码。简单的密码通常可以通过分析符号的使用频率并将其与语言中出现频率相同的字母进行匹配来破解。例如在英语中字母 E 最为常见而 Z、Q 和 X 则最少见。例如在冯·万德斯莱本从三十年战争前线寄出的信中他使用了多达八个不同的符号来表示字母 E。这意味着需要反复试验以及瓦尔迪斯普尔对古德语的了解才能逐渐破解这个密码。“这很大程度上是机器和人工验证者之间的反复交互”瓦尔迪斯普尔说。“也许在某个时候人工智能可以完全独立地完成这项工作。”密码背后隐藏着冯·万德斯莱本对瑞典新教盟友在战争中各派系构成的威胁的警告。他告诉奥克森斯蒂尔纳在得知盟友中存在阴谋其中包括萨克森的弗朗茨·海因里希勋爵后他被迫从冲突中采取战略撤退。重新开启冷案代码梅格耶西和她的团队目前正在探索人工智能如何完全跳过转录阶段仅通过分析书页照片来破译秘密信息。他们最近展示了这种方法如何应用于简单的密码其中每个字母都被替换成一个符号。他们用一份已破译的105页手稿测试了这套系统这份手稿被称为“科皮亚莱密码”详细记录了18世纪德国一个秘密社团的仪式、规则和理念。通过先用通用手写体训练人工智能再用密码中特定行的图像以及相应的已解码德语文本进行训练该系统能够准确破译之前未曾见过的文本部分。当密码的底层语言未知时这样的系统尤其有用。“这为罕见和非标准文字系统开辟了令人兴奋的可能性”梅格耶西说。“最终目标是将转录和破译合二为一。”在克里特岛米诺斯宫殿遗址中发现的拥有4000年历史的费斯托斯圆盘上的符号至今仍大多未被破译图片来源Getty Images。瓦尔迪斯普尔和她在Descrypt项目中的同事们一直在搜寻旧档案寻找密码脚本并将其汇编成数据库。这对于收集足够的数据来训练能够破解密码的人工智能至关重要。支撑诸如ChatGPT之类的AI聊天机器人的大型语言模型都是基于来自书籍、文章和网站的数万亿个单词进行训练的。而要找到与此相当数量的数据用于密码破解则极具挑战性。他们收集的资料中包括400张神秘的明信片这些明信片是用密码文字书写的时间跨度从19世纪末到20世纪初。目前破译的少量碎片显示其中一些是用德语写的爱情信。梅格耶西的团队利用他们的研究成果开发了一种人工智能聊天机器人式的工具该工具将转录和解密功能集成于一体。这款聊天机器人结合了基于密文字符及其对应文本对训练的解密算法以及基于不同历史时期文本训练的大型语言模型从而帮助用户找到密码线索。此外该工具还整合了基于标注手写文本训练的图像识别算法。该人工智能工具还能通过吸收专家用户的纠错意见来不断改进自身。其理念是研究人员甚至公众可以向聊天机器人提供一段编码的历史文本并让它揭示文本的内容。当研究人员使用博格密码测试他们的AI聊天机器人时梅格耶西和她的同事发现它能在29分钟多一点的时间内翻译并解码一段包含500个符号的文本。它甚至还提供了英文翻译。此外它还记录了整个过程并解释了解决方案的合理性。这对于确保AI没有产生幻觉或捏造解释至关重要。该团队最近还用之前破译过的另外两种密码对该系统进行了测试这两种密码分别代表不同的时期、语言、密码类型和复杂程度。系统也迅速破译了这两种密码表明它能够应对多种密码。人工智能在规模、速度、模式发现和任务整合方面最有帮助。这类人工智能工具或许是破解至今仍难以捉摸的历史密码的关键。它们还有助于解读用现代人无法辨认的字母书写的古代文献。例如克里特岛出土的拥有4000年历史的费斯托斯圆盘至今仍未被破译早期希腊语“线性文字A”也同样如此。令我兴奋的不仅是解决某个具体历史谜题的可能性更是创造出可以帮助研究人员处理许多不同案例的方法的前景。