使用现代技术恢复丢失的文本。铁

首先,一些新闻。



您可能还记得,我在2018年发表了一篇文章《我们如何设法阅读奥斯威辛比克瑙第三火葬场附近的80年代发现的手稿》。您还可以在新报纸上阅读对我的采访



图片



共同工作之后,新信息使比克瑙博物馆本身和历史学家都感动。帕维尔·波利安(Pavel Polyan)首次出版了《德意志灰烬的卷轴》。 



2020年1月,我们收到了来自法兰克福的历史学家朋友安德烈亚斯·基利安(Andreas Killian)的来信,信中包含与奥斯威辛比克瑙博物馆商店链接



. , , , , , «» , , .



, . . , , . , ! . .   , , . , , . , ! , .



在俄罗斯,有一个大规模的分散运动来寻找并永久纪念在第二次世界大战中丧生的士兵。搜索团队分散在全国各地,由于打开胸章的能力不足,经常互相指责,无法挽回地摧毁它们。但是,要实现的目标远非易读。亲戚的来信或回忆录也存在同样的情况,在我国各地区的档案馆中,大量损坏的材料被破坏了。乍看之下似乎还有很多其他文件,但它们具有巨大的阅读潜力。通过Google传给我的现有法证文献非常过时。在看了关于重建陀思妥耶夫斯基信件的俄国出版物之后,契kh夫与该州的档案保管员进行了交谈。机构,私人公司,研究过西方同事的出版物和经验,决定准备这份关于现代技术的教育性概述(或者现在流行地说:从曾祖父继承来的不可读字母的十大功能)。



该材料属于文化遗产研究类别,根据过去15年中可获得的科学出版物以及我的经验和分析进行汇编。



在本出版物中,我们将从复杂性转向可访问性,而在下一个更实际的版本中,我们将讨论算法和软件。



  1. X射线断层扫描
  2. X射线相衬成像
  3. X射线荧光成像
  4. 光学相干断层扫描
  5. 太赫兹成像
  6. 红外热成像
  7. 拉曼光谱(拉曼成像)
  8. 多光谱成像
  9. 技术选择。


1. X射线断层摄影



卡迪夫大学(英国)



我将描述博物馆档案保管员感兴趣的标准案例。一些古老的,未开发的,非常有趣的东西。例如,来自诺福克(英国)的Diss Heywood庄园的16世纪司法卷轴就可以了。由于悲惨的过去,由于某种原因,它被大火烧毁,试图浸泡和展开它可能会破坏墨水和介质本身。烧伤区域上的铁墨水(很可能是)是完全不可读的。此外,涡卷上还有烟灰和其他粘附的碎屑。从理论上讲,它应该包含有关不动产寿命,土地交易,违反和平,罚款支付,陪审员姓名和其他官僚机构的信息。来自其的数据可用于研究人口统计学,农作物产量和历史本身。如果您不看,谁知道掉头的背后是什么?并且部署它而不会带来任何后果,这几乎只能是虚拟的。 





X射线断层扫描仪被用作移除虚拟副本的设备。无论现在还是在本文中,我都不会再提及该模型的名称,因为科学家们致力于研究当前日期是免费的还是普遍可用的。此外,还有如此多的设置,其他设备,手动校准和测量,因此该过程在每个实验之间都是独一无二的。碰巧的是,由于时间紧迫,科学家被迫加快实验速度,从而损害了分离度。



扫描过程
. , . 2511   3 . .



该滚动条应该内部没有复杂的覆盖层。因此,可以避免解决分析其内部取向的问题。第一次扫描已确认这一点。





一个断层区段



作为一个规则,在X射线断层图像中羊皮纸和空气的密度差很显著。因此,通过使用阈值过滤器(二值化)执行自动分段来开始检索其内容的处理。但这是麻烦的一半,因为有很多地方需要将零件或孔粘在一起,因此需要手动调整。





层分离算法的演示



假设整个文档的羊皮纸的平均厚度使您可以将合并的区域尽可能均匀地分为几层。



初步分析显示,Diss Haywood的卷轴由四张紧卷的纸组成,每张纸的两面都带有文字。如果由于分割错误而错过了所需的图层,则文本会崩溃。 



令人惊讶的是,此过程几乎是完全自动的!由于严重损坏,手动校正只需要8044个切片中的15个。



分割算法本身并不是最佳算法(研究人员写道,令人毛骨悚然的狗屎代码,甚至在Matlab中也是如此),它花了4分钟的时间才能完成1个切片!因此,花了大约3个星期来分割整个滚动。但是,与其他研究相比,在三周内将8000次校正15次仍然非常好。 



这就是虚拟部署的样子。 





我将独自添加,理想情况下,您需要这样的软件,在该软件中,单击虚拟扩展副本的文本,您可以在本地调整分段的深度。然后,我们将有机会选择最易读的分离边界。这是一个更彻底的过程,应该传递给翻译人员。在这一阶段,科学家的任务必须完成。



尽管取得了惊人的效果,但它还是基于突出羊皮纸和墨水之间的现有对比。您会在手稿中看到黑底,这是X射线无法突出材料对比度的区域。但是,如果样品完全烧焦怎么办?



2.具有相衬的X射线断层扫描



从学校里,我们知道维苏威火山的爆发,发生在公元79年。有人记得卡尔·布吕洛洛夫 Karl Bryullov )的“庞贝城的最后一天”。这场灾难的结果是破坏了罗马城市,尤其是庞贝城和赫库兰尼姆。埋葬在厚厚的火山物质层下,对这些地方进行了数百年的保护。今天,这个地方已经成为古代希腊罗马文化的学生的绝妙机会。



1752年首次发现纸莎草纸卷后,在一个巨大的别墅的一间小房间里发现了整个图书馆,里面有数百本手写的烧焦的纸卷,仔细地存放在书架上。这个丰富的书籍收藏主要由伊壁鸠鲁哲学著作组成,是独特的文化宝藏。这是唯一随书保存的古代图书馆!



尝试了多少次以展开这些半焦的卷轴!所有这些导致他们无法挽回的损失。为了将来的伟大思想家的希望,决定保留它们的身体完整性。



在过去的20年中,阅读赫库兰尼姆的著作取得了重大进展。双目显微镜和多光谱成像的使用(我们将在下面讨论)大大提高了这些文本的可读性。不幸的是,亲爱的读者,这些方法不适用于仍然折叠的文本,并且通常类似于烧烤时的一小块煤。





如上所述,在X射线计算机断层摄影中,对比度提取机制基于X射线辐射的吸收。这种方法特别有效地将高吸收性材料与弱吸收性材料(骨头和肉类)区分开。



在远古时代,纸莎草纸是用从烟灰中获得的碳基墨水书写的,其密度几乎与烧焦的纸莎草纸本身相同。正是由于这些物理性质的紧密性,多年来一直不允许找到隔离文本所需的对比。 



在检查了类似的未燃烧手稿之后,研究人员得出结论,所施加的墨水不会渗透到纸莎草纸中。这意味着它们被应用在材料上。事实证明这一事实对实验具有决定性,因为使用相位对比可以准确找到这种差异。不同的材料厚度具有不同的折射率(X射线相移)。纸莎草纸上的墨水高度约为100微米。正是这种技术首次允许隔离足够可读的字符。 



与来自英格兰的卷轴不同,这种纸莎草很难展开内层。由于复杂的曲面,分割算法无用。在几乎所有情况下,都可以手动识别连续的文本部分。 





这项开创性的研究不仅为许多纸莎草纸开辟了新的视野,也为尚未发现的纸莎草纸开辟了新的视野。也许在更深的火山岩下面还有另一个图书馆!



3. X射线荧光成像



斯坦福实验室。(美国)



您是否听说过有关麻痹的消息?信息比介质本身便宜得多的文件。不必要的文本可能会被刮掉,漂白并与新的文本重叠。 



佩尔加蒙的盖伦-皇帝和角斗士的医师。他的著作“关于简单药物的混合物和力量”在6世纪被译成叙利亚语,以在整个古代伊斯兰世界传播他的思想。本文的恢复将使我们能够了解当时如何治疗疾病,这是非常有价值的信息。不幸的是,尽管医生声名fa起,但该译本最完整,现成的版本在11世纪被赞美诗删除并重写。早期的研究揭示了其下方的文本痕迹,但它们均未成功-两种文本都使用相同的墨水书写,并且主要的文本清洁得很好。十年来不可能达到阅读所需的对比度。



最近,一个国际研究人员团队在SLAC国家加速器实验室的斯坦福同步加速器辐射源(SSRL)上显示了出色的结果。



 负责X射线成像项目的SLAC研究人员Uwe Bergmann说:“我们希望有足够的墨水痕迹让我们破译一两个字。” “我们现在看到的那封脆脆的信标志着巨大的成功。”



当然,团队担心即使使用SSRL中强大的X射线成像技术,文本仍可能难以辨认。例如,剩余墨水中的铁含量太低或太脏。



X射线荧光成像的原理是敲除金属原子核附近的电子。这些孔充满了外部电子,导致可以检测到的特征性X射线荧光。 Galen的隐藏文字和新的宗教文字发出的荧光略有不同,因为它们的墨水包含铁,锌,汞和铜的各种组合。几个世纪的差异只能反映在墨水的成分中,而这些差异是必不可少的差异,它们将有可能分离获得的数据阵列。



扫描26页中的每页大约需要10个小时。结果是大量的数据。我什至不得不借助机器学习来提取信息。用双手很难辨认。







在2019年1月底,迈克尔·托特(Michael Tott)在他的Twitter帐户上发布了一张照片。在造成稿件中存在硫的通道中,发现了很大的反差。





这是稿件一部分的基本组成图。




就我个人而言,我想要一个这样的Photoshop,其中图像的各层将充当其组成化学元素。那么色彩空间将被称为什么?



手稿仍在研究中。



4.光学相干断层扫描 



杜克大学(美国)



这种光子成像技术主要用于眼科。例如,对于早产胎儿,大脑发育的程度可以由眼底确定。该技术基于与超声波测量类似的原理,仅红外线(850nm-1000nm)用作辐射。图像非常细致(显微镜是一项附加功能),并且由于红外线可以穿透1-2 mm的组织,我们有机会获得一个体积阵列,通过该阵列我们可以在所需深度制作“切片”。



纸莎草纸




描述了一个研究公元前2世纪纸莎草纸样品的案例。在古埃及,中产阶级的死者用由纸莎草纸屑制成的口罩将木乃伊木乃伊化,例如纸莎草纸,然后涂底漆和油漆。有人怀疑此纸莎草纸是由使用过的纸莎草纸制成,并且已有一些文字。根据迈克尔·托特(Michael Tott)的观点,一些科学家将口罩溶解在洗洁精中,以到达油漆下的纸莎草纸层。一切都会好起来,但会破坏工件,并且该过程取决于手的伸直程度,因此无法提供任何保证。如果唯一的问题是对非侵入性研究的渴望,那就去把它带到国外吧!禁止出口文化遗产,官僚机构,包装,晃动等样品的法律。真是这样辛西娅·托特(Synthia Tott)姐姐是一名眼科医生,距离大学的纸莎草档案馆不远(步行几分钟)。她的机构有光学相干断层扫描仪。





在您担任手枪之前,是相同的光学扫描仪,并且感兴趣的人





在玻璃背景中的照片中,正是纸莎草纸条。扫描的结果是一个超级立方体,通过切掉它的盖子(撕下您最喜欢的赫鲁晓夫(亲爱的读者)的第一层墙纸),您可以真正区分出字母符号!





看到您熟悉的符号不要感到惊讶。迈克尔(Michael)认为,当时希腊语是政府的语言,因此搜索符号不需要母语为母语的人的介入,但是使用此设备以及如此繁重的任务的主要困难是,世界上几乎所有资源都集中在解决维护健康和生活,这是可以理解的。专家很少,自由思想的专家更多。并且现有的软件解决方案还没有准备好解决与文化遗产有关的问题。但是,这是一项很有前途的技术。



5.太赫兹可视化



最近在众多领域中蓬勃发展的一项新兴技术。我找不到大型成功的手稿回收案例。有许多分析实验证实了这种电势的存在,并且在某些情况下由于有色金属元素之间的对比突出而超过了X射线。通常,关于此技术会有一个很好的非常有趣的讲座。







使用的波长从100兆赫兹到3太赫兹,可以穿透纸张和许多其他材料。辐射不会被电离,因此对人类安全。根据一段时间内反射字段的统计信息,可以对每个页面进行本地化。



这是依次显示字母LAZ,THZ的动画。这些字母在激光打印机上打印并堆叠。发射器位于顶部,反射信号能够区分多达20页的文本。更深层次-信号已经反射了已经无法读取的累积错误数。





纽约大都会艺术博物馆对这种方法很感兴趣,因为他们的档案中包含禁止在破坏威胁下打开的书籍。而且要进行断层扫描并非易事。设备的可用性是一大优势。与以前的技术不同,市场上已经有几种完整的产品可以通过USB直接插入笔记本电脑。 



6.红外热成像



现在我们考虑在热像仪范围内构造图像。主动脉冲热成像技术已成功用于非侵入性地突出装订在羊皮纸上的书籍中的古代文字。例如,我们可以引用对保存在罗马当归图书馆的13世纪手稿(ms 509 / D813)的分析结果。该手稿是旧约的摘要,由127个书面羊皮纸组成。其中一些被水损坏了。最后一页上有较大的模糊斑点,使文本不可读。 



在各个受损区域上执行的温度记录图显示,在所有检查的区域中,墨水文字均得到部分恢复。





使用两个1 kW闪光灯获得此类温度记录图。墨水中颜料成分的损失并不意味着其其余成分会被冲走。恢复对比度的能力可能归因于墨水残留区域的暂时加热,该区域会有效吸收某些入射光。



7.拉曼光谱



 博德良图书馆。牛津



对于任何物质的激光辐照,除了瑞利散射外,反射信号的极小一部分还会改变其频率分量。出现的光谱线不在主光源中。出现的线的数量和位置取决于该物质的分子结构。因此,您可以确定其组成。在CNC机器上安装激光器时,可以按坐标获取此数据,然后从基本构成中形成图像。这种方法在研究绘画的颜料成分和揭示隐藏的铭文方面非常受欢迎。的确,在处理亚美尼亚手稿时,目标是一个稍微不同的任务,应该指出的是,激光辐照非常微弱,但仍然有害。







这就是基于元素成分生成的着色覆盖面罩的外观。此示例显示了红色颜料的结果。 





你说不是很酷。毕竟,您可以尝试从照片中隔离出这样的蒙版吗?原来,摄影也是一种分析工具吗? 



8.多光谱分析



因此,在谈到技术可用性时,我们来讨论一下真正有意义的话题。世界上大多数最大的博物馆和档案馆都配有这些设备。1993年《死海古卷》成为使用光谱成像技术研究的第一批手稿之一。但是,当时,研究人员正在尝试使用红外胶片恢复褪色或难以辨认的文字。





胶卷不见了,数字信号到达了,超亮LED(或一组滤光片和两个卤素卤素灯)。该技术的本质非常简单。您需要在黑白矩阵上(非常可取)在光学范围内的12个不​​同光谱中制作约12个数字图像:三个在IR中,然后在红色,琥珀色,橙色,黄色,绿色,青色,蓝色,紫色和UV中。在上面的照片中,有两个LED聚光灯目前正在用紫外线照射样品。根据结果​​,可以得出有关样本的进一步结论:是否有潜力,软件将为我们提供帮助,以及如果我们开始践踏官员办公室,敲定前往国家研究实验室的预算,那该怎么办? 



 2020年,研究Qumran手稿的无文本羊皮纸材料的学者偶然发现了字母。从未检查过大量的小部分文本是否存在,因为没有任何暗示。一些区域甚至被特别切割。对于其他一些任务。当在红外光谱中拍摄时,似乎虚空的东西突然变成一种感觉。





戴维·利文斯顿(David Livingston)是最伟大的探险家之一,他一生的大部分时间都花在非洲上,走了5万多公里。在他的最后一部作品中,他用尽了当地浆果的汁液,而不是用尽墨水。但是这种美丽的对比仅是第一次。当手稿到达他的同事们时,果汁失去了色素。她等了140年才被完全阅读。顺便说一句,研究他的日记的项目在2016 年的DHawards排名第一。 





在上面的图像中,稿件页面和获得的光谱图像的其他组合既适合作为噪声抑制蒙版,又可以直接增加必要元素的对比度。



报纸的文字被IR范围的遮罩所压制,因为那里没有浆果汁,但是在其他渠道中,它的存在与报纸相比形成了鲜明的对比。解密的结果是一个故事,其中利文斯顿直接见证了奴隶贩子的惨烈屠杀。他对发生的事情感到惊讶,以至于他中断了对尼罗河源头的搜寻。今天,手稿已被完全转录,任何人都可以使用。但是,由于您(亲爱的读者)最有可能生活在他们不欣赏免费提供的东西的时代,因此您很可能不会阅读。



在大英图书馆博客上,您还将发现多光谱成像研究的常规结果。800岁!尽管情况良好,但麦格纳·卡塔(Magna Carta)表现出色。或是博德明福音的结果9世纪。仔细观察,这是同一页。





为了更好地了解该过程的工作原理,有一段很好的视频介绍了多光谱实验室审查。







hsopensource



此外,如果您觉得这对凡人是不可行的,我的意大利朋友Antonino Cosentino(身为科学家)将向您介绍他的项目https://chsopensource.org/,他在其中分享他在多光谱中使用家用数码单反相机和镜头的研究结果射击。Antonino当然不关心恢复丢失的文本。他负责研究文化遗产和帮助全球博物馆工作者的一般任务。他的Antonello项目完全致力于这一点。但是,我不确定用过滤器套件代替LED聚光灯是否是最佳解决方案。那里和那里都有细微差别。为了更好地了解彩色颜料在多光谱摄影中的行为,我将向您展示一张来自Antonino的颜料表。





在这里,您可以看到IR中有多少颜料变成透明的或反射或吸收IR射线,以及紫外线下的所有外观如何完全不同。在红外线和紫外线之间拍摄也会显示出自己的对比。



现在,借助足够的知识,让我们继续对上面列出的方法进行比较分析,以找出上述哪种方法最适合检查目标样品。



9.技术选择



纸莎草纸研究是文化遗产中最受欢迎的主题之一。在其中一篇科学论文中,研究人员想知道如何在木乃伊上发光。值得一一逐一地研究这些技术,还是预先缩小选择范围呢? 



如果能够再现理想条件,则可以相当准确地推断出该技术能够更好地揭示某些颜料的能力。 



研究人员使用古代技术制备了4张10x15cm的纸莎草纸(幻影),分为四个区域。每张纸上的每个区域均以顺时针方向标记有不同墨水成分的粗体十字,因此,在折叠的纸莎草包装中,十字不会相互重叠。





出于历史原因,选择了三种墨水,最后一种是现代墨水(浪费的地方):



  • 碳(煤烟,煤)
  • 氧化铁(最常见)
  • 腺墨(程度较小)
  • 现代碳素墨水(英国温莎和牛顿,英国)


多光谱成像使用高分辨率的铁和碳基墨水可提供出色的表面细节,但深度穿透力有限。 





然而,通过在发射中射击可以在某种程度上减轻该缺点。





光学相干断层扫描由于纸莎草的高光学衰减而提供了意想不到的低穿透性。 





X射线方法即使在体模顶部添加了额外的纸莎草纸,也可以识别铁基墨水,但它们无法检测出碳基墨水。





X射线荧光成像





尚未找到与现代墨水和碳基墨水相匹配的十字架。碳是一种轻元素(原子序数6),并且发出的荧光能量太低,无法被所使用的系统检测到。可以检测到的最轻的元素是磷(15)。存在于腺墨(26)中的铁清晰可见,即使经过6层纸莎草纸也可以与背景区分开。



相衬X射线断层扫描



由于时间限制,研究人员仅拍摄了与氧化铁和碳墨水的交叉。纸莎草的纤维结构清晰可见。由于纸莎草纸的折射率不同,因此十字也可见。含碳墨水的痕迹也很微弱。





太赫兹成像 使研究人员感到惊讶,它能够比铁基油墨更好地检测碳基油墨。太赫兹波被认为对使用X射线技术不可见的墨水敏感。这些结果得到先前研究的支持。



样品结果


我很高兴将这个话题带到俄罗斯互联网,因为,第一次面对研究这一需求的时候,我发现了这种材料的重要性。由于主题的广泛性,我决定不将所有内容都放在一篇文章中。在下一篇文章中,我们将讨论算法和数字图像处理。



如果您愿意,请订阅我的twitter,在它变得流行之前或在mitzgol完成他的超文本fidonet之前。



资料来源
https://www.research.ed.ac.uk/portal/files/59293691/IST_Archiving_Paper_Mummy_OCT_MSI.pdf



https://www.nature.com/articles/s41598-018-29037-x



https://www.nature.com/articles/ncomms6895



https://www.semanticscholar.org/paper/Application-of-terahertz-spectroscopy-for-character-Fukunaga-Ogawa/422ab4431a929b269800ee3d95a6833b7777f493



https://heritagesciencejournal.springeropen.com/articles/10.1186/s40494-018-0206-1



https://www.media.mit.edu/projects/reading-through-a-closed-book/overview/



https://heritagesciencejournal.springeropen.com/articles/10.1186/s40494-018-0175-4




All Articles