好的工作不仅狼死了,而且识别引擎出现了





今天,我们,Smart Engines,将讲述大流行期间我们的工作方式以及从中获得的收益。我们将告诉您应用程序的大小,何时何人重要,文件的活泼性如何以及这一公认的美好世界将走向何方。



关于我们实际上是如何在产品级别重新推出智能引擎的故事。这个故事根本不是关于我们如何通过“一分钱”品牌重塑或成功获得远距离政府补贴以支持业务的数十亿美元的投资。不,我们天生不是俗话说的“吃鱼不入池塘”的人之一。辛苦工作了几个月的原因是对我们的识别引擎的概念,体系结构和目的进行了全面的重新思考。但是首先是第一件事。



五年前,我们以一种简单的产品进入了市场-移动设备上的护照识别引擎。功能非常简单:您向引擎显示视频流中的护照,然后以文本形式返回文档属性(并且这样做无需与外部服务器建立任何连接,所有识别都直接在设备上进行)。没有与有效护照数据库进行核对,没有向内政部自动提出欺诈要求,没有其他KYC服务。我们认为,只有快速,高质量的识别才能部分扭转数字世界。



发生了2015年3月,我们展示了该产品的第一个版本-Smart PassportReader,它在所有资源上都被“吹响了”(这只是我们在Habré上的文章,我们用各种颜色讲述任务的功能以及在业务中使用技术的方式。尽管最初市场对我们的创新反应迟钝,但如今只有少数银行没有在移动应用中使用该技术。



随着客户数量的增加,添加新功能的请求也增加了。受支持的文档类型的基础不断扩大,受支持的语言列表,使用的语言数量增加,代码库过大(尽管在过去的五年中,一些子系统“从头开始”被重写了几次,以免将来因支持遗留代码而淹没)。当然,这都会影响SDK的最终大小-Smart IDReader的大小在iOS的“完整配置”下,它的重量开始超过200 MB。许多?是的,疯了很多!但是,比起任何兆字节,庞大的软件功能列表更容易引起人们的注意。



远程工作具有规律性和统一性,这使我们有机会详细分析我们的产品,并与客户交流他们如何使用我们的SDK。事实证明,许多客户使用与护照分开识别支付卡和条形码的功能(实际上,在不同的业务案例和应用中),这使我们意识到需要一种用于识别此类物体的产品。我们将此产品命名为Smart Code Engine... 当然,我们不仅将有限的功能与以前的SDK分开,还组成了一个强大的团队,他们在识别编码对象方面大大扩展了引擎的功能。最重要的是,它们形成了产品的关键要求:快速工作,在任何条件下工作,准确地工作。



因此,智能代码引擎可在各种图像捕获条件下自动读取银行卡数据,机器可读区域和条形码。该系统可抵抗照明,拍摄角度,变形,旋转角度,过多和不足照明的变化。该系统可以实时工作,并且能够以每秒25帧的速度识别现代设备上的银行卡和其他对象。



智能代码引擎使您可以扫描和识别由世界各国发行的“ Mir”,Visa,万事达卡,美国运通,JCB,MIR,Maestro,银联和大来卡付款系统的银行借记卡和信用卡,不仅提取数字(12-19位),以及有效期和所有者名称。支持识别任何类型的银行卡:压印,压痕和平面印刷的数据,水平和垂直识别数据以及正面和背面都位于该数据上的那些银行卡背面。在新产品中,用户现在可以识别具有IBAN编号的银行卡,该银行卡在欧盟国家中非常普遍。条形码阅读器支持QR码识别(包括各种设计版本),AZTEC,PDF 417,数据矩阵,CODABAR,CODE_39,CODE_93,CODE_128,EAN_8,EAN_13,ITF,UPC_A,UPC_E。除了国际ISO / ICAO标准(IEC 7501-1 / ICAO Document 9303 ISO)之外,用于识别机器可读文档区域(MRZ)的模块还考虑了当地法规(俄罗斯,法国,瑞士,保加利亚,厄瓜多尔)。



第二个“重新思考”是指我们的旗舰解决方案-ID文档识别引擎。尽管从一开始我们就将产品定位为解决所有任务,从访问控制系统到可以自主地为人们服务的复杂人工智能系统,但Smart IDReader的主要应用发现了远程标识和身份验证的问题。以下是一些“实际”案例:在“我的税”服务中注册自雇人士,购买和激活SIM卡,在Tinkoff移动客户端中注册。



解决此类问题不仅需要识别文本细节。这就是我们创建新产品智能ID引擎的方式,由于具有内置的人脸验证机制,对所提供文档“生命力”进行分析以及突显折中迹象,因此除了数据识别外,还提供了多因素身份验证



除了分析单个文本和图形元素(包括随着环境变化而随时间变化的元素,例如全息图)之外,Smart ID Engine还包含一些方法的集合,这些方法可防止对文档完整性进行“物理”干扰(例如,照片篡改检测)。



在创建一个复杂的个人识别和身份验证系统中,这种媒介为我们打开了新的领域和新的销售市场,从任何意义上扩展了该系统适用性的地理范围。在这里我们还决定进行``拍摄'':我们认可了印度-伊朗小组的阿拉伯文字和语言。我们暂时谈论的是21个辖区,总人口达5亿,这些辖区不使用国家文件中的拉丁文字。已对以下国家/地区的73种文件进行了阿拉伯文识别,包括护照,身份证和驾驶执照:阿尔及利亚,巴林,巴勒斯坦国,埃及,约旦,伊拉克,伊朗,也门,卡塔尔,科摩罗,科威特,黎巴嫩,利比亚,毛里塔尼亚,摩洛哥,阿联酋,阿曼,沙特阿拉伯,叙利亚,苏丹,突尼斯。总体而言,今天我们支持全球99种语言,并于5年前以俄语和英语两种语言开始。



最后,现实的最后第三次“重新思考”和新产品的展示在大流行的急性阶段如此迅速地诞生了-智能文档引擎。该引擎解决了自动从标准文档格式,严格报告格式,主要会计,财务,税务,法律,公证和其他文档中提取数据的问题。就像所有其他Smart Engines识别引擎一样,严格在设备上,而无需使用外部高性能服务器。加上许多辅助功能,例如检查签名和打印的存在,手写识别,控制文档的拓扑完整性等。



当然,怀疑者可以放弃,说这个话题完全没有意义和愚蠢,因为谁可能需要识别手机或平板电脑上的文件。我对此有一个答案。首先,针对弱计算架​​构的算法优化使我们能够在工作站和服务器上以无与伦比的速度运行解决方案(AMD Ryzen 7 3700X上一页A4文档的处理时间约为2秒)。其次,5年前,当我们发布护照识别产品时,我们已经完全满足了这种怀疑的预测。



下一步是什么?进入西方市场?销售发展?公关和市场营销等等东西等等吗?当然不是。在西方,就像在东方一样,我们已经存在。销售在增长。公关和市场营销已经建立(自从您阅读本文到最后)。因此,让我们关注这种情况:



  • 添加新的编码对象:识别单个文本行,识别VIN码,识别仪表读数等;
  • 添加新的语言和脚本,例如印度使用了20多种语言;
  • 提高识别速度;
  • 扩展支持的文档类型列表;
  • 很多其他有趣的工作。



All Articles