AI解决密码学家终极挑战,600年未解伏尼契手稿有望破译

简介: 伏尼契手稿是一本内容不明的神秘书籍,里面充满着神秘的文字和插图。自从100多年前被发现以来,无数语言学家和密码学家对这部手稿进行了细致研究,但至今没有人能够破译出只言片语。现在,阿尔伯塔大学的NLP专家宣称利用AI技术能够破译这部天书。

伏尼契手稿是一本内容不明的神秘书籍,共240页,里面充满着编码一般的文字和神秘的插图。自从100多年前被发现以来,伏尼契手稿就一直令语言学家和密码学家困惑不解,至今没有人能够破译出只言片语。但最近,利用人工智能,加拿大的研究人员宣称在破译伏尼契手稿方面迈出了巨大的一步。

伏尼契手稿(Voynich manuscript)的书名来自名为威尔弗雷德·伏尼契(Wilfrid Voynich)的波兰书商,他于1912年在意大利买下此手稿。手稿中使用的字母和语言都是未知的,至今无人能识别。伏尼契手稿包含数百页纸张,部分书页散失了,书中手写的文字是从左到右书写的。大部分页面都配有插图,插图内容包括植物、任务和天文符号。但至于文字的含义——完全不懂。没有任何线索。

但并不是缺少尝试去破译手稿的人。这部手稿被认为是世界上最重要的密码,自被发现以来,无数专业和业余的译解密码者都仔细地研究过它。在第二次世界大战期间,顶尖的密码专家也对它进行过分析,但即使是他们也没有破译出只字片语。有关这本手稿,人们提出了各种各样的理论,例如它是用半随机加密方案创建的;它是字谜;或者是一种元音被移除的书写系统。有人甚至认为这份手稿是一场精心策划的骗局。

ef2383b3429d3bd3011c46af407e6d1832ce1cc8

伏尼契手稿(图:耶鲁大学贝尼克珍本与手稿图书馆)

但对于阿尔伯塔大学自然语言处理专家格雷格·康德拉克(Greg Kondrak)来说,破解这本天书似乎是非常适合AI的任务。在他的研究生Bradley Hauer的帮助下,Greg Kondrak在破解伏尼契手稿密码方面迈出了一大步。他们发现文本是用希伯来语编写的,并且字母以某个固定的模式排列。虽然研究人员还不知道伏尼契手稿中内容的含义,但现在已经准备好让其他专家参与调查。

第一步是找出加密文本的语言。为此,AI研究了“世界人权宣言”的文本,这是用380种不同的语言编写而成,试图找到模式。经过这一步的训练,AI分析手稿的乱码文字,得出的结论是,文字很可能是用经过编码的希伯来语写成的。 Kondrak和Hauer都大吃一惊,因为他们刚开始这个项目时,认为这些文字是用阿拉伯语写的。

Kondrak说:“这真令人惊讶。但是,得出‘这是希伯来语’只是第一步,下一步是破译出文本的含义。

e335e83477ad921250d25aa7f589312b36214a96

伏尼契手稿中的一页(图:耶鲁大学贝尼克珍本与手稿图书馆)

第二步,研究人员接受了以前的研究人员提出的假设,即手稿的文本是基于字母表创建的,也就是说,文本已经被按字母顺序排列的字母表替换(例如,GIZMODO重排后变成DGIMOOZ)。基于文本最初是用希伯来语编码这个发现,研究人员设计了一个算法,可以利用这些变位词来创造出真正的希伯来语单词。

Kondrak说,“我们发现,有80%以上的单词都在希伯来语词典中,但是我们不知道它们组合在一起是否有意义。”

最后一步,研究人员决定了手稿的开头部分,并将它交给Moshe Koppel,以为计算机科学家兼母语是希伯来语的人。Koppel说,这在希伯来语中并不能形成一个连贯的句子。

研究人员在报告中写道:“但是,在进行了一些拼写校正之后,谷歌翻译能够将它翻译成可接受的英语:’她向牧师、家人以及我和其他人提了建议’(She made recommendations to the priest, man of the house and me and people)”,相关报道发表在ACM网站中。

对于一部240页的书来说,以这样一个句子开头是挺奇怪的,但这句话实际上是有意义的。研究人员并没有说他们已经破译了整部伏尼契手稿。但他们确定了手稿的语言(希伯来语),以其中字母以特定的字母表顺序排列这样一种编码方案。Kondrak说,只有等到古希伯来的历史学家有机会研究破译的文本,才能知道手稿的全部意思。

令人兴奋的是,该团队正在计划将新算法应用到其他古老的手稿,AI有潜力解决困扰人类几个世纪的问题。


原文发布时间为:2018-02-1

本文作者:马文

本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”微信公众号

原文链接:AI解决密码学家终极挑战,600年未解伏尼契手稿有望破译

相关文章
|
5月前
|
人工智能 自然语言处理 API
构建可落地的企业AI Agent,背后隐藏着怎样的技术密码?
三桥君深入解析企业AI Agent技术架构,涵盖语音识别、意图理解、知识库协同、语音合成等核心模块,探讨如何实现业务闭环与高效人机交互,助力企业智能化升级。
283 6
|
2月前
|
机器学习/深度学习 人工智能
破译AI指纹:如何检测内容是否出自机器之手?
破译AI指纹:如何检测内容是否出自机器之手?
125 3
|
8月前
|
人工智能 自然语言处理 运维
让AI读懂K线图!ChatTS-14B:字节开源的时间序列理解和推理大模型,自然语言提问秒解趋势密码!
ChatTS-14B是字节跳动开源的时间序列专用大模型,基于Qwen2.5-14B微调优化,通过合成数据对齐技术显著提升分析能力,支持自然语言交互完成预测推理等复杂任务。
1806 1
让AI读懂K线图!ChatTS-14B:字节开源的时间序列理解和推理大模型,自然语言提问秒解趋势密码!
|
3月前
|
人工智能 安全 网络安全
从不确定性到确定性,“动态安全+AI”成网络安全破题密码
2025年国家网络安全宣传周以“网络安全为人民,靠人民”为主题,聚焦AI安全、个人信息保护等热点。随着AI技术滥用加剧,智能化攻击频发,瑞数信息推出“动态安全+AI”防护体系,构建“三层防护+两大闭环”,实现风险前置识别与全链路防控,助力企业应对新型网络威胁,筑牢数字时代安全防线。(238字)
195 1
|
人工智能 开发框架 自然语言处理
【图文详解】探秘 Prompt 工程:AI 交互的关键密码
【图文详解】探秘 Prompt 工程:AI 交互的关键密码
2452 7
|
9月前
|
人工智能 自然语言处理 安全
探秘能源行业AI密码:云鼎科技用大模型实现了″四个转变″
大模型正全面赋能流程工业与智能制造。以煤矿行业为例,云鼎科技自2022年起探索大模型应用,从验证到研发再到推广,构建了“1+4+N”智能化方案,实现115类场景落地,并拓展至化工、电力等领域。大模型带来“四个改变”:由被动监管转向本质安全、劳动密集转向精简高效、粗放管理转向质量效益、分散重复转向集约高效。实际成效显著,如兴隆庄煤矿减少岗位人员39人,济宁二号井煤矿每年增利400多万。云鼎科技还基于DeepSeek等模型打造垂域矿山大模型,推动全产业智能化升级,助力企业轻松算清经济账,吸引更多企业拥抱大模型浪潮。
174 0
|
机器学习/深度学习 人工智能 自然语言处理
|
机器学习/深度学习 数据采集 人工智能
AI揭示生命密码:如何个性化生存概率预测?
接下来的章节将进一步探讨AI技术在个性化乳腺癌预测中的应用,以及未来的发展方向。
509 0
|
机器学习/深度学习 传感器 人工智能
盗取密码,AI表示只需20秒!通过拍摄热图像确定字母和顺序,成功率高达86%
最近,国内首部以网络安全为题材的作品《你安全吗?》大火。 电视剧中呈现了只有做不到没有想不到的种种黑客攻击手段,随之而来的便是网友们对自己网络安全的种种担忧。
369 0
盗取密码,AI表示只需20秒!通过拍摄热图像确定字母和顺序,成功率高达86%
|
机器学习/深度学习 人工智能 算法
一周AI最火论文 | 童年的手绘漫画有望复兴?AI建立草稿到模型映射
一周AI最火论文 | 童年的手绘漫画有望复兴?AI建立草稿到模型映射
356 0