面部识别技术:一个秘密故事

六十年前,农夫的儿子伍迪·布莱索(Woody Bledsoe)发明了面部识别技术。但是他参与这项发现的证据几乎消失了。 



Netology的编辑已经编写了《连线》文章的改编版,内容涉及这个未知的东西,已有很长的历史,涉及布莱德索及其团队在现代人脸识别技术中的发展。 



伍迪·布莱索(Woody Bledsoe)曾在德克萨斯大学奥斯汀分校任教30年,致力于自动推理和人工智能的开发。根据布莱索的儿子兰斯(Lance)的回忆录,这位教授是一位热情乐观的科学家,他在1950年代末期曾梦想创建一款具有人类能力并能够证明复杂的数学定理,能够保持对话并像样打乒乓球的计算机。 



但是在职业生涯的初期,布莱索渴望寻找一种机会来教机器识别面孔的人-一种被低估但可能强大的人类能力。这些是有关面部识别的第一项研究(1960年),这位教授的工作吸引了美国情报部门的兴趣。伍迪的主要投资者可能是中央情报局的前台公司。 



:



如今,面部识别已被用于确保电话,笔记本电脑,护照和支付应用程序的安全性。预计该技术将彻底改变目标广告市场,并加速某些疾病的诊断。同时,面部识别技术正在变成政府施加压力和企业监视的工具。 



例如,借助中国的这项技术,政府正在追踪维吾尔族的代表,其中数十万人已被安置在政治监狱中。根据《华盛顿邮报》的报道,在美国,移民与海关警察局和联邦调查局正在进行数字搜索:在政府驾驶执照数据库中寻找嫌疑人-有时无需首先出庭。 



在2019年,《金融时报》的一项调查显示,微软和斯坦福大学的研究人员在未经照片的知情或同意的情况下收集并公开提供了大量人像的数据包。随后,这些数据被销毁了,但是科技创业公司和一家中国军事学院的研究人员设法得到了这些数据。 



伍迪·布莱索(Woody Bledsoe)在1960年代对面部识别的研究预见了我们今天所看到的技术突破和道德方面。但是,这些基础作品几乎是完全未知的-其中大多数从未公开。


1995年,出于未知原因,伍迪要求儿子销毁研究档案。但是大多数论文都活了下来,他的数千页工作现在被保存在德克萨斯大学布里斯科美国历史中心。 



除其他事项外,还保存了数十张人的照片,并且某些面孔上标有奇怪的数学符号,好像被某种“几何”皮肤病所打击。在这些肖像中,人们可以辨别技术兴起的历史,在未来几十年中,技术将活跃发展并渗透到人类活动的许多领域。



这一切是如何开始的。元组方法



伍德罗·威尔逊(伍迪)布莱索(Woodrow Wilson(Woody)Bledsoe)于1921年出生于俄克拉荷马州的一个大农户。他是家庭中的第十个孩子,据他所记得,他总是帮助父亲做家务。他具有数学思维方式。高中毕业。他在俄克拉荷马大学学习了三个月,之后伍迪在第二次世界大战前夕被征召入伍。



战后,伍迪在犹他大学学习数学,然后前往伯克利攻读博士学位。伍迪毕业后,在新墨西哥州政府拥有的桑迪亚公司(Sandia Corporation)从事核武器研究工作,并与斯坦尼斯拉夫·乌兰姆(Stanislaw Ulam)等名人一起工作,后者协助制造了氢弹。 



伍迪在桑迪亚(Sandia)迈出了计算世界的第一步,这一承诺将贯穿他的一生。首先,我编写了核武器项目代码。后来,伍迪开始对自动模式识别(尤其是机器阅读)产生兴趣,这是对系统进行识别未标记的书写字符图像的教学过程。 



伍迪·布莱索(Woody Bledsoe)和他的同事伊本·布朗宁(Iben Browning),一位数学家,航空工程师和生物物理学家,提出了一种后来被称为n元组方法的方法。


科学家首先将打印的符号(例如字母Q)投影到矩形的细胞网格上,就像衬有纸片一样。根据其中是否存在符号的一部分,为每个单元分配一个二进制数:0-空单元格,1-填充单元格。然后将单元格随机分组为有序对,如坐标集。理论上,组可以包含任意数量的单元格,因此是方法的名称。然后,使用几个数学步骤,系统为符号网格分配了唯一值。并且当遇到一个新符号时,将该符号的网格与数据库中的其他符号进行比较,直到找到最接近的匹配项为止。



该方法的本质在于它可以识别相同符号的许多变体:与其他Q相比,大多数Q倾向于获得相当相似的结果,该过程最适合任何模式,而不仅仅是文本。根据数学家和伍迪的长期朋友罗伯特·S·博耶(Robert S. Boyer)的说法,元组方法有助于定义模式识别的范围。这是该问题的第一步之一:“如何编程机器以执行人们的工作?”



在他开发元组方法的那段时间,伍迪首先梦想创建一台机器,他称之为“计算机人”。
 

多年后,他回忆起了他在制定人工智能技能时所感受到的“狂野的兴奋”: 





“我希望他阅读打字的字符和手写的文本。我可以在安装在我的眼镜上的小型相机中看到他或他的一部分,它带有一个听筒,当我在街上遇到他们时,我会通过它听见他给我朋友和熟人的名字打电话……你知道,我的计算机朋友可以识别面孔。”









全景研究公司的研究



1960年,伍迪(Woody)与伊本·布朗宁(Iben Browning)和另一位桑迪亚(Sandia)同事共同创立了Panoramic Research Incorporated(Panoramic)。他们最初被安置在帕洛阿尔托的一栋小建筑里,而这还不是硅谷的心脏。当时,大多数计算机(将数据存储在打孔卡或磁带上的大型设备)都安装在大公司和政府实验室的办公室中。伍迪的公司买不起计算机,因此科学家从邻居那里租用了这样一台计算机的计算时间,通常是在深夜,价格便宜。



Panoramic的业务是“测试我们希望可以颠覆世界的想法”。


曾参与多个Panoramic项目并后来与他人共同创办《个人计算》杂志的作家和顾问Nels Winkless表示,“他们的工作是做别人认为太愚蠢的事情。”



一些全景研究人员的发明已广为人知。例如,机器人编程的先驱Helen Chan Wolf开发了Shakey the Robot。根据电气和电子工程师协会的说法,它是“世界上第一个体现人工智能的机器人”。 



Panoramic徒劳地寻找资金。伍迪不遗余力地介绍了字符识别技术,包括向公平人寿保险协会和麦考尔杂志介绍了这项发明。但是合同从未签订。 



在整个存在过程中,Panoramic至少有一个可靠的赞助者中央情报局。
 

如果在伍迪·布莱索(Woody Bledsoe)的论文中提到中央情报局(CIA),那么很可能在1995年将其销毁。但是残存的材料碎片清楚地表明,伍迪的公司与中央情报局的前沿公司合作了很多年。全景团队的朋友Nels Winkless说,该公司最有可能是由代理商资助创立的。 Winkless回忆说:“没有人直接告诉我这件事,但是确实如此。”



根据“免费获取信息法”(FIA)法律查询网站Black Vault的调查,Panoramic Research Incorporated是从事MK-Ultra项目的80个组织之一。这是臭名昭著的中央情报局“精神控制”计划,未经人们的同意就使用了心理折磨。通过虚拟研究基金会医学科学研究基金会(Panoramic)受委托进行一些子项目来研究细菌和真菌毒素,并“远程控制某些动物物种”。 



圣马丁大学人类学家戴维·H·普莱斯(David H. Price)认为,伍迪和他的同事们也从人类生态研究学会获得了资助。 CIA代表这个社会向科学家提供了赠款,这些科学家的工作可以改善该机构使用的讯问方法,或充当此类研究的封面。 



但是Panoramic最重要的研究是由另一家虚构的公司King-Hurley研究小组(King-Hurley)提供的。根据1970年代提起的一系列诉讼,中央情报局利用该研究小组为秘密的空军机构美国航空采购飞机和直升飞机。一段时间以来,金·赫尔利(King-Hurley)还资助了斯坦福大学的心理药物研究。



1963年初,金赫尔利只接受了伍迪·布莱索(Woody Bledsoe)提出的各种想法。他建议进行“研究,以确定创建简化的人脸识别机的可行性。” 伍迪(Woody)借鉴了布朗宁(Browning)的元组方法,他想教该系统识别10张脸。也就是说,他计划使用包含10张不同人的照片的数据库,并确定机器是否可以识别每个人的新照片。伍迪写道:“很快就有可能将人数增加到数千人。” 在一个月内,金赫尔利(King-Hurley)准许他开始工作。



人脸识别领域的第一个实验



如今,确定十个人似乎是一个相当谦虚的目标,但在1963年,这是一个令人难以置信的宏伟目标。从文字识别到面部识别的飞跃是巨大的。仅仅是因为既没有用于数字化照片的标准方法,也没有现有的数字图像基础。现代研究人员可以在数以百万计的免费自拍照上训练算法,而Panoramic必须从头开始建立数据库。 



还有一个更严重的问题:与二维符号不同,人的三维面孔不是一成不变的。同一个人的图像可能在头部旋转,光线强度和角度以及年龄,发型和心情方面有所不同-在一张照片中,一个人可能看起来无忧无虑,而在另一张照片中,则可能是焦虑的。 



通过类似于在一个非常复杂的部分中找到一个共同的分母,该团队不得不调整可变性并排序他们正在比较的图像。


而且几乎不可能自信地说他们的计算机将完成这项任务。CDC 1604是主要机器之一,它具有192 KB的RAM-比典型的现代智能手机少21,000倍。



从一开始,伍迪就充分意识到了这些复杂性,因此他采取了分而治之的方法:将研究分解成多个部分,并将其分配给不同的合作者。



图像数字化的工作如下。研究人员在16毫米胶片上为项目参与者拍摄了黑白照片。然后,他使用了勃朗宁开发的扫描设备将每个图像转换成数以万计的数据点。在图像的某个位置,每个点的光强度值必须在0(最暗)到3(最亮)的范围内。一次有太多的点需要计算机处理,因此研究人员编写了NUBLOB程序,该程序将图像切成随机样本并为每个样本计算一个唯一值,就像使用元组方法分配的值一样。



伍迪(Woody),海伦·陈·沃尔夫(Helen Chan Wolfe)和另一位研究人员致力于头部倾斜。首先,科学家在受试者脸部的左侧从额头顶部到下巴绘制了一系列带编号的小十字。然后,他们拍了两张肖像,其中一个人在向前看,另一张-旋转了45度。在分析这两幅图像中十字的位置之后,将数据外推到旋转15或30度的面部图像。将一张带有标记的脸部的黑白图片加载到计算机中,并且输出的是自动旋转的肖像-恐怖,精确且出乎意料的准确。



研究人员的解决方案是原始的,但不够有效。开始工作13个月后,全景团队承认他们没有训练机器识别至少一张脸,更不用说十张了。


伍迪在1964年3月给金·赫利(King-Hurley)的进度报告中写道,头发的生长,面部表情和衰老的迹象-这一三重挑战代表着“变化的巨大来源”。既定任务“超出了模式识别和现代计算机技术领域的当前状态”。同时,伍迪建议资助更多的研究,以试图找到一种“全新的方法”来解决面部识别问题。



人脸识别的“人机”方法



在接下来的一年中,伍迪得出结论,自动人脸识别最有希望的方法是将区域缩小到主要元素(眼睛,耳朵,鼻子,眉毛,嘴唇)之间的关系。 



他提出的系统类似于他1879年创建的法国犯罪学家Alphonse Bertillon的系统。贝蒂永根据11种身体测量值对人进行了描述,包括左腿的长度以及从肘部到中趾末端的长度。这个想法是,如果进行足够的测量,每个人都是唯一的。这种方法很费力,但行之有效:在1897年借助它,在指纹广泛使用之前很久,法国宪兵就确定了连环杀手约瑟夫·瓦奇(Joseph Vache)。



整个1965年,Panoramic试图创建一个全自动的Bertillon人脸识别系统。该小组正在尝试开发一个程序,该程序可以使用照片中的亮区和暗区来定义鼻子,嘴唇等。但是他们失败了。



因此,伍迪(Woody)和沃尔夫(Wolfe)采取了他们所谓的“人机”方法来进行人脸识别,该技术将一些人工输入纳入了方程式。


伍迪吸引了他的儿子格雷戈里(Gregory)和他的朋友参加该项目-为他们提供了122张照片,其中大约有50人。这些家伙对每张脸进行了22次测量,包括耳朵的长度和嘴巴的宽度。沃尔夫然后编写了一个程序来处理数据。



. , : , .


他们的下一个步骤是在1965年末,创建相同实验的较大版本,以使“人”在其人机系统中更高效。他们用King-Hurley的钱购买了RAND平板电脑,这是一部价值18,000美元的设备,看上去像平板图像扫描仪,但是像iPad。研究人员使用手写笔在平板电脑上画画,并在输出处接收到相对高分辨率的计算机图像。



通过RAND平板电脑拍摄了一批新照片,强调了使用手写笔的面部关键要素。这个过程虽然复杂,但却比以前快得多:输入了大约2,000张图像的数据,包括每张脸的至少两张图像。每小时大约处理40张图像。



即使有大量样本,伍迪的团队仍在努力克服通常的障碍。 



笑容的问题“使脸部变形并从根本上改变了界面尺寸”以及衰老尚未得到解决。
 

当试图将伍迪1945年的照片与1965年的照片相匹配时,该系统感到困惑。她看到一个笑容灿烂,黑发浓密的年轻人和一个表情忧郁稀疏的老人之间的相似之处。 





伍迪·布莱索(Woody Bledsoe)于1965年的研究中的照片。摄影师:丹·温特斯(Dan Winters



)好像数十年来创造了一个不同的人-从某种意义上说是这样。至此,伍迪已经厌倦了为Panoramic寻找新合同,并发现自己“处于工作过多或不足的荒谬境地”。他不断向赞助商提出新想法,其中一些如今在道德上被认为是有问题的。 



1965年3月-在中国开始使用面部识别技术来识别新疆维吾尔族的50年之前-伍迪邀请美国国防部高级研究计划局(ARPA)支持Panoramic研究性状的使用。人来决定一个人的种族血统。伍迪写道:“来自世界各地的人有很多人类学方面,他们属于不同的种族和生态群体。” “这是一个庞大而有价值的数据仓库,收集起来非常困难,花费巨大,但使用不当。” ARPA是否同意资助该项目仍然未知。



伍迪用自己的资金在Panoramic中投入了数千美元,但无法保证他们的回报。同时,他来自德克萨斯大学奥斯汀分校的朋友们说服了他在大学里找到一份工作,以稳定的工资吸引了他。1966年1月,伍迪离开了Panoramic。此后不久该公司关闭。



怀着创建计算机人的梦想,伍迪与家人一起搬到了奥斯汀,致力于自动化推理的研究和教学。但是他在面部识别技术上的工作并没有就此结束。


伍迪·布莱索(Woody Bledsoe)最成功的面部识别实验 



1967年,伍迪完成了与面部模式识别相关的最终任务。该实验的目的是帮助执法机构快速筛选被捕者的数据库以寻找火柴。 



和以前一样,该项目的资金似乎来自美国政府。1967年的一份文件(由CIA在2005年解密)提到了面部识别系统的“外部合同”,该系统可以将搜索时间缩短100倍。 



伍迪的主要项目合作伙伴是斯坦福研究院应用物理实验室的研究工程师彼得·哈特。(现在称为SRI International。该研究所于1970年从斯坦福大学拆分,原因是该研究所严重依赖军事资金,因此校园存在分歧。)



伍迪和哈特从大约800张图片的数据库开始-每两张“ 400名白人成年男性”。所拍摄的照片的年龄和转头不同。科学家使用RAND平板电脑为每张照片记录了46个坐标,包括每个耳朵五个值,鼻子七个值和每个眉毛四个值。在伍迪先前对图像变化进行归一化的经验的基础上,使用了一个数学方程式来“旋转”正面视图。然后,为了解决比例差异,将每个图像放大或缩小到标准尺寸,其中参考指标是瞳孔之间的距离。



该系统的任务是记住每个人的一个版本,并使用它来识别另一个版本。 


伍迪和哈特为汽车提供了两个捷径之一。在第一个组匹配中,系统将脸部分为特征-左眉,右耳等-并比较它们之间的相对距离。





摄影师:丹·温特斯(Dan Winters)



第二种方法是基于贝叶斯决策理论的,该机器使用22个维度进行一般的有根据的猜测。 



结果,两个程序大致都能很好地处理任务。而且结果也比人类竞争对手要好。当伍迪和哈特要求三个人与100个人组成的小组进行比赛时,即使最快的小组也花了六个小时。CDC 3800在大约三分钟内完成了类似的任务,从而使时间减少了100倍。人类在处理头转弯和照片质量较差时比较擅长,但是计算机在检测与年龄有关的变化方面“非常出色”。 



研究人员得出的结论是,机器“支配”或“几乎支配”了这个人。这是伍迪在面部识别研究中取得的最大成功。 

这也是他关于该主题的最后一部著作,从未发表过《为国家利益》,伍迪和哈特对此深表遗憾。


在与Hart合作结束两年后的1970年,一位名叫Michael Kassler的机器人技术员告诉Woody,Bell Labs的Leon Harmon正在计划进行面部识别研究。伍迪回答:“第二种研究将被发表,最终将成为最好的人机系统,我感到很愤怒。在我看来,经过艰苦的努力,到1975年,莱昂将落后我们10年。几年后,当哈蒙的研究在《科学美国人》上登上封面时,伍迪一定感到失望,而他自己的更高级的作品被保存在储藏室中。



在现代人脸识别技术中使用Woody Bledsoe方法 



在随后的几十年中,伍迪因其对自动推理的贡献而获奖。一年来,他担任人工智能开发协会主席。但是,他在面部识别方面的工作仍未被广泛认可,几乎被人们遗忘,而其他人则在争夺桂冠。



1973年,日本计算机科学家Takeo Kanade在面部识别技术上取得了巨大飞跃。 



加拿大基于1970年世界甜蜜博览会(日本)中的850张数字化照片数据库,开发了一个程序,无需人工干预即可提取面部特征-鼻子,嘴巴和眼睛。加拿大已经成功实现了伍迪将人排除在人机系统之外的梦想。


多年来,伍迪已经使用了几次面部识别知识。 



1982年,他被提拔为加利福尼亚州刑事案件的专家。墨西哥黑手党的一名据称成员被控在孔特拉科斯塔县犯下一系列抢劫案。检察官有几项证据,包括一个留着胡子,太阳镜和冬帽的长发男子的视频监控录像。但是在照片中,被告似乎是一个短发的剃光男人。伍迪测量了强盗的脸,并将其与被告的照片进行比较,发现由于鼻子宽度的差异,这些脸属于两个不同的人。尽管该男子仍被判入狱,但在伍迪作证的四项罪名中,他无罪释放。



密歇根州立大学的软件科学家,《人脸识别手册》的共同编辑阿尼尔·贾恩(Anil K. Jain)说:“在过去的10年中,人脸识别技术已经学会了解决缺陷的方法。” 



伍迪面临的几乎所有问题都消失了。如今,数字化图像源源不绝。简说:“通过社交媒体,您可以根据需要获得尽可能多的面部镜头。”而且,由于机器学习,内存和处理能力的进步,计算机可以学习有效地学习。只需几个简单的规则,他们就可以分析大量数据,并为几乎从人脸到一包薯条的所有内容创建模板-不再需要使用RAND平板电脑或Bertillon方法进行测量。



甚至考虑到自1960年代中期以来面部识别技术已经发展到何种程度,伍迪·布莱索(Woody Bledsoe)都确定了该领域仍有许多挑战需要解决。 



, - . , , , .



尽管程序员并未明确指示现代深度学习系统识别鼻子和眉毛,但伍迪(Woody)于1965年朝这个方向的转变为行业发展指明了数十年的方向。 “在最初的40年中,特征提取占据了主导地位,”现任卡内基梅隆大学机器人研究所的教授Takeo Kanade说。 



今天,在某种程度上,它们已经回到了伍迪首次尝试“塑造”人脸的尝试,当时他使用元组方法的一种变体在庞大的数据点领域中找到相似特征的模式。与现代人脸识别系统一样复杂,阿尼尔·简(Anil Jane)表示,他们仅比较图像对并为其分配相似度即可。



但也许最重要的是,伍迪·布莱索(Woody Bledsoe)的工作为面部识别研究(无论相关还是有问题)树立了道德基调。自从在Panoramic诞生以来,面部识别技术的潜在滥用就显而易见了。 



可以归因于伍迪研究时代遗留的许多偏见-几乎只有白人对实验的吸引力,对政府的粗心大意的信任,使用面部识别技术以种族为由进行歧视的愿望-所有这些都是现代面部识别领域固有的。



在2019年对Amazon Rekognition软件的测试中,有28个NFL球员被错误地识别为犯罪分子。几天后,美国公民自由联盟向美国司法部,联邦调查局和药物管制局提起诉讼,以获取有关亚马逊,微软和其他公司使用面部识别技术的信息。美国国家标准技术研究院(National Institute of Standards and Technology)2019年的一份报告对50多个面部识别软件开发人员的代码进行了测试,该报告称白人比其他群体更容易与犯罪分子不匹配。在2018年,一些科学家提出了尖锐的批评:“我们相信面部识别技术是有史以来最危险的监视机制。”



在1993年春季,由于ALS的退行性疾病,伍迪的讲话恶化了。但是他继续在德克萨斯大学任教,直到他的演讲变得难以理解。他继续进行自动推理领域的研究-直到他不再握笔。直到最后,伍迪仍然是一名科学家,他在演讲中记下了该病的发展轨迹。 



伍迪·布莱索(Woody Bledsoe)于1995年10月4日去世。告没有提及他在面部识别方面的工作。在the告照片中,满头白发的伍迪正凝视着镜头,脸上露出灿烂的笑容。







Netology分析和数据科学主管Elena Gerasimova的评论



伍迪·布莱索(Woody Bledsoe)的想法在商业上并不成功,也许是因为他们的时间落在了“人工智能的冬天”之一。人们对这些技术缺乏信心,没有足够的能力证明令人印象深刻的结果,并且重建人类大脑的技术主要是由发烧友参与的-院士Andrei Nikolaevich Kolmogorov,美国数学家George Tsibenko等。 



尽管如此,由于这项研究,基于强大的计算能力,云和微芯片的现代突破已成为可能。





1998年,杨乐村完善了在LeNet上识别手写数字的方法,这要归功于伍迪·布莱索(Woody Bledsoe)的研究无法获得的计算能力的发展。



人脸识别技术与更先进的人脸生成技术接壤,例如,该技术可用于创建伪造品并生成成人和儿童以及猫和狗的脸部。似乎更容易-拍摄人物照片并将其有条件地上传到电子服装目录中;或与婴儿和玩具一起拍摄可爱的视频;还是教一个神经网络在衣服,内饰或玩具中创建儿童形象,我们计划将其放置在目录中并进行展示?对开发用于创建逼真的图像技术的公司的投资额将提示答案-仅在美国,2019年的总投资额就超过5亿美元。







生成人的真实感图像



如果您对使用数据,神经网络感兴趣,我们为您提供熟悉我们的程序,培训的基础,这些程序基于科学基础和研究:



  • 专业“数据科学家”。在“数字行业专业人员培训”提名中获得“质量标志”(2019年)。
  • 深度学习课程在课程登录页面上,您可以查看课程中项目的示例,以及培训的进行情况。
 

对于那些正在寻求实现人工智能,机器学习和“数字重启”方法的人,我们建议您查看“业务转型:人工智能的引入”课程中的信息学生将制定实施人工智能的策略,并在外国和俄罗斯专家的指导下制定实际的商业案例。



All Articles