
100多年无法解读的
《伏依尼奇手抄本》是
′′捏造文书′′吗?
《伏依尼奇手抄本》是
′′捏造文书′′吗?


#亚大的研究
阿方彰教授
经营学院数据科学系
2024.11.01
在“如果不有趣,就不是学术!”系列中,我们介绍了亚细亚大学教职员工的研究内容和轶事。第11期的特辑是经营学院学院数据科学系的Akira Agata教授。

从孩提时代开始,身边就有一本“书”。
小学时,我从学校图书馆借书阅读,比如江户川乱步的《少年侦探》系列,我们那一代很多书迷都为之疯狂,还有被重写并翻译成儿童读物的《绅士小偷鲁邦》系列。初中时,我记得自己曾全神贯注地阅读栗本薰的《狗战士传奇》系列,希望能挑战自己读一部长篇小说。高中时,我开始坐电车上学,并努力在通勤途中每天读一本早川文库的科幻系列。
我从小就热爱读书,所以考上高中附属大学后,自然而然地选择了文学院。文学院里,我本来对心理学和图书情报学这两个专业很感兴趣,但经过一番深思熟虑后,最终选择了图书馆情报学专业。当时我的梦想是开一家二手书店。我会悠闲地坐在收银台,周围都是旧书,偶尔还会用鸡毛掸子赶走那些逛了很久的顾客(笑)。说到被书包围,现在作为一名大学教授和图书馆馆长,我觉得这个梦想的一部分已经实现了。
然而,临近大学毕业,我感到需要更加“现实”地思考未来的职业道路,于是参加了一家大型印刷公司的书籍相关职位的面试,并最终获得了录用。然而,与此同时,我的大学教授鼓励我继续研究生院,而我被这个选择所吸引。
在研究生院,我主要研究的是信息科学和数据库,也就是人们如何搜索信息。本科的时候,我取得了图书馆的资格,所以想过在大学图书馆当一名图书管理员,但是事情并没有按照计划进行,我最终继续攻读博士学位。回顾我的职业历程,从本科到研究生院,再到现在成为这所大学的教授,这条道路看似很顺利,但实际上,一路上我总是充满疑惑,有时茫然不知所措,有时感到沮丧,我想我是经历了很多事情才有了今天的成就。但现在回想起来,我觉得这正是人生的乐趣所在。顺便说一句,我还没有放弃成为二手书店老板的梦想。
《伏依尼奇手抄本》里写的是“语言”吗?

如上所述,作为一名研究人员,我一直在研究广义的信息科学,例如图书馆和情报学、数据库等。我在研究中使用的数据分析方法之一是“文本聚类”,这是一种将多个文本自动分类到不同组的方法。
我在大学工作后不久,偶然在网上发现了伏尼契手稿。
伏尼契手稿是“未解密文献”的典型代表,我们甚至不知道它以何种语言书写。这份手稿不仅在图书馆和情报学领域,还在小说、音乐等领域引发了广泛讨论。1912年,波兰裔美国古籍收藏家威尔弗里德·伏尼契在意大利的一座修道院中发现了这份手稿。自发现以来,许多历史学家、语言学家和密码学专家都试图对其进行解密,但即使在一百多年后的今天,我们仍然无法得知其中究竟记载着什么。
伏尼契手稿现存超过 200 页,其中包含难以辨认的文字,许多页面充满了植物、草药罐、微小裸体女性等的插图。对伏尼契手稿中使用的羊皮纸进行科学分析表明,它是在 15 世纪或 16 世纪制作的,并且有记录似乎在 17 世纪提到过该手稿。
还有一种理论认为,这份古代文献是一份毫无意义的“伪造品”,是出于某种意图而伪造的。然而,在中世纪的欧洲,书籍是富人的奢侈品,很难想象有人会为了伪造一份超过200页的复杂手写副本而伪造……这一事实使得这份文献作为“真品”的可信度更高。因此,与其“解读”文献内容,我决定从是否存在书写结构,换句话说,是否存在“语言”的角度,来判断解读文献本身的可能性。
这项研究基于这样的假设:应用于多种语言的自然语言处理技术可以应用于目前无法解读的语言。例如,如果有很多用无法解读的外星语言编写的网页,如果这些网页被谷歌索引,那么就应该能够用外星语言搜索关键词。
碰巧附近有一位研究古代手稿和印刷书籍的专家,我们两人便开始合作。在2009年发表的一篇研究论文中,我们发现伏尼契手稿中难以辨认的文本与根据其插图和页面推断出的结构之间存在关联,并由此断定这很可能不是伪造的文献。此前,还没有其他研究人员进行过类似的分析,因此这一结果堪称一项新发现。
我在大学工作后不久,偶然在网上发现了伏尼契手稿。
伏尼契手稿是“未解密文献”的典型代表,我们甚至不知道它以何种语言书写。这份手稿不仅在图书馆和情报学领域,还在小说、音乐等领域引发了广泛讨论。1912年,波兰裔美国古籍收藏家威尔弗里德·伏尼契在意大利的一座修道院中发现了这份手稿。自发现以来,许多历史学家、语言学家和密码学专家都试图对其进行解密,但即使在一百多年后的今天,我们仍然无法得知其中究竟记载着什么。
伏尼契手稿现存超过 200 页,其中包含难以辨认的文字,许多页面充满了植物、草药罐、微小裸体女性等的插图。对伏尼契手稿中使用的羊皮纸进行科学分析表明,它是在 15 世纪或 16 世纪制作的,并且有记录似乎在 17 世纪提到过该手稿。
还有一种理论认为,这份古代文献是一份毫无意义的“伪造品”,是出于某种意图而伪造的。然而,在中世纪的欧洲,书籍是富人的奢侈品,很难想象有人会为了伪造一份超过200页的复杂手写副本而伪造……这一事实使得这份文献作为“真品”的可信度更高。因此,与其“解读”文献内容,我决定从是否存在书写结构,换句话说,是否存在“语言”的角度,来判断解读文献本身的可能性。
这项研究基于这样的假设:应用于多种语言的自然语言处理技术可以应用于目前无法解读的语言。例如,如果有很多用无法解读的外星语言编写的网页,如果这些网页被谷歌索引,那么就应该能够用外星语言搜索关键词。
碰巧附近有一位研究古代手稿和印刷书籍的专家,我们两人便开始合作。在2009年发表的一篇研究论文中,我们发现伏尼契手稿中难以辨认的文本与根据其插图和页面推断出的结构之间存在关联,并由此断定这很可能不是伪造的文献。此前,还没有其他研究人员进行过类似的分析,因此这一结果堪称一项新发现。
通过“图书馆情报学”揭示的广泛研究领域

关于伏尼契手稿的论文不仅在语言学家和文献学家中引起了强烈反响,也得到了各界人士的广泛关注,这对我来说是一个研究的转折点。最初,我的研究是出于对互联网上发现的“未解密文献”的兴趣,但研究过程让我再次意识到,以“图书馆与情报学”为关键词可以研究的课题涵盖了极其广泛的领域。
关于伏尼契手稿,不同的人从不同的角度仍在报道“发现”,我将继续饶有兴趣地关注事态发展。
此外,我目前正在研究“漫画的国际化”、“召回绝版书籍”和“电子书”等主题。其中,“召回绝版书籍”是指因各种原因停刊,甚至在书店发行后也被召回的书籍。绝版的原因多种多样,包括“内容错误”、“诽谤”、“使用歧视性语言”、“侵犯隐私”以及“作者的意图”。事实上,我初中时很喜欢读的栗本薰的《Guin Saga》系列第一卷,也因为其中对某种疾病的描述而绝版并被召回,在作者道歉并更正后才发行了修订版。我从二手书店和网上书店收集这些绝版书籍,并在我的教研馆的书架上设立了一个“召回绝版书籍”专区。如果你感兴趣的话,欢迎来教研馆参观。我会详细讲解每本书绝版的原因以及对社会的影响。通过绝版书籍来了解每个时代的人们和社会状态,非常有趣。
关于伏尼契手稿,不同的人从不同的角度仍在报道“发现”,我将继续饶有兴趣地关注事态发展。
此外,我目前正在研究“漫画的国际化”、“召回绝版书籍”和“电子书”等主题。其中,“召回绝版书籍”是指因各种原因停刊,甚至在书店发行后也被召回的书籍。绝版的原因多种多样,包括“内容错误”、“诽谤”、“使用歧视性语言”、“侵犯隐私”以及“作者的意图”。事实上,我初中时很喜欢读的栗本薰的《Guin Saga》系列第一卷,也因为其中对某种疾病的描述而绝版并被召回,在作者道歉并更正后才发行了修订版。我从二手书店和网上书店收集这些绝版书籍,并在我的教研馆的书架上设立了一个“召回绝版书籍”专区。如果你感兴趣的话,欢迎来教研馆参观。我会详细讲解每本书绝版的原因以及对社会的影响。通过绝版书籍来了解每个时代的人们和社会状态,非常有趣。
我希望你把它作为“我自己”工作,看起来很有趣

我的研讨课主题包括“图书馆情报学”、“媒体情报学”和“数据库”,但我尽量让每位学生优先考虑自己“感兴趣”的研究。因为我希望学生们在成为大学生后,能够重视自己的兴趣和关注点,而不是父母或老师的指示。就像我一样,在大学期间,并非总能找到明确的兴趣或目标。但我认为“在大学学习”的意义在于不断在心中寻找自己“感兴趣”的事情,找到之后,就把它当作“自己的事”来对待。大学生踏入职场之前的这段时间,是一段宝贵的时光,可以无所畏惧、勇于挑战。请好好利用这段时间。
我们大学也必须与时俱进,提供满足学生多样化需求的教育。大学图书馆收藏着众多珍本书籍和古手稿,随着互联网和数字技术作为社会基础设施日益普及,人们开始思考应该提供什么样的服务。作为图书馆馆长和电子书研究者,我想倾听大学生的意见,思考新的图书馆应该是什么样子。
我们大学也必须与时俱进,提供满足学生多样化需求的教育。大学图书馆收藏着众多珍本书籍和古手稿,随着互联网和数字技术作为社会基础设施日益普及,人们开始思考应该提供什么样的服务。作为图书馆馆长和电子书研究者,我想倾听大学生的意见,思考新的图书馆应该是什么样子。