通过这份出版物,我计划开始撰写一系列有关网络安全领域的新技术如何改变整个IT行业的文章。通常,将辅助功能分配给与威胁的战斗,很少有人认为保护技术可以在不远的将来极大地改变我们的生活,使它变得不那么安全,而是有根本不同。在我的预测中,我将重点关注5-30年。如果用了30年以上,那么就可以完全抽象化,如果用不到5年,则预测将太明显了。在第一部分中,我们将讨论知识劳动力的新市场,该市场实际上目前还不存在,这是算法市场。
每个处理复杂的优化问题,开发新的密码功能或在ML / AI开发中获得新的重要成果的程序员,都产生了这样的想法:是否有可能出售花费了如此大量智力工作的算法?在他们身上赚钱?通常,此问题的答案为否。有时您可以出售它,但只能出售一次,并且只能出售给某些特殊服务,并且有义务不要在其他任何地方使用它。当我在系统分析系的研究生院学习时,当地的研究生就多准则优化撰写了许多有趣且有意义的著作,其中可以改进单个算法,并且得到的结果比现有算法精确百分之几。但是,这些发展从未被进一步商业化,除了将R&D本身作为服务出售。
可以出售算法吗?
让我们使用一个单独的示例来分析这种操作的复杂性。假设开发人员创建了一个新的哈希函数,该函数可证明具有抗冲突性。如此有用的结果使他想到了出售对哈希函数的访问权会很不错的想法。有两种方法可以做到这一点:
1.在云端:托管在云中的某个位置并提供HASHaaS服务。如今,这种解决方案变得简单而没有意义。即使我们认为通信通道的速度和质量足以确保功能调用所需的SLA,我们也将面临将数据本身发送到云的困难。我们想要散列的信息可能对我们有价值。例如,我们可以找到文档的哈希函数,以使用电子数字签名进行进一步验证,或者对用户密码进行哈希处理,以免将其存储在数据库中。将明文密码发送到某些外部服务器以获取哈希值看起来是荒谬的。如果对它们进行加密以进行传输,则远程服务器仍将需要解密以计算哈希值。从而,它将接收所有密码,所有文档以及我们要哈希的任何其他数据。使用云模型是不可行的,除非在少数情况下,发送到远程服务器的信息对我们没有任何价值。但是这种情况将是规则的例外。
2. On-premise...第二种方法涉及将算法直接传输到客户端,由客户端自行运行。这里有几个困难。如果我们以一种解释性(开放)语言(例如Python)传递程序,则客户端可以用它做任何他想做的事情。将无法控制代码的进一步复制和修改。如果我们以编译的形式传输它,那么,首先,它对于客户来说并不总是很方便,其次,追踪算法的逻辑并复制它并不困难。即使我们事先混淆了代码并删除了所有调试信息,我们也可以反汇编和跟踪算法的逻辑,因为很有可能分析的代码量不会太大。因此,两条轨迹都会导致程序员失败。的思想以某些专门算法的形式产生知识产权并从中获得被动收入,我一生都梦想着……还是不是?
近年来的革命
在过去的十年中,密码学的某些理论领域从无法实现的理论构造到应用解决方案已经走了很长一段路。这些领域之一是同态加密。
密码的同态性是,对密文的更改与对原始文本的更改相似。假设Enc()是加密函数,Dec()是解密函数;那么加法同构可以表示为x + y = Dec(Enc(x)+ Enc(y))。同样-乘法:X ∙ ÿ= Dec(Enc(x)∙ Enc(y))。如果密码同时具有加法和乘法的同态,则称为全同态加密(FHE)。为什么足够?因为可以在这些操作上建立任何逻辑方案。特别是NAND(A,B)= 1 + A ∙ B,而NAND又是通用门,也就是说,通过NAND,您可以表达任何其他逻辑运算符并编写任何程序。关于同态密码的第一个想法出现在很久以前-早在1976年。但是,仅在2009年描述了这种密码的第一种实现方式(Craig Gentry。使用理想格的完全同态加密。在第41届ACM计算理论研讨会(STOC),2009年)。这种设计在实际应用中受到很大限制,以至于每个基本操作都需要大约30分钟的计算时间,并且具有足够的密钥长度加密强度。在接下来的几年中,出现了许多不同的FHE电路,它们更适合于此类实际实现。一些最著名的是BGV和CKKS(Z. Brakerski,C。Gentry和V. Vaikuntanathan。不带引导的完全同态加密,ITCS 2012和郑俊熙;金安德烈;金,米兰;宋容s同态加密,用于近似数字的算术运算。密码学进展-ASIACRYPT2017。ChamSpringer。 pp。 409-437)。随后出现了许多实现同态密码的开源实现和库。首先是IBM的HElib库(2013),然后是首尔国立大学的HEAAN(2016),DARPA的PALISADE(2017),微软(2018)的SEAL扩展和许多其他实现,包括通过GPU,FPGA等
使用FHE示例,您可以看到十年内从抽象理论思想到具体应用解决方案的路径。同态密码学开辟了许多新的视角:例如,它使得无需解密即可处理数据成为可能。以前,为了从大型加密数据库中提取和处理信息,首先需要下载整个数据库,对其进行解密,在正确的位置进行更改,然后再加密并再次发送。现在,可以通过一次操作完成此操作。在一个加密的数据库中,我们可以立即找到所需的单元格并进行更改,而无需诉诸解密整个表。
现在,返回到云端方案,我们可以实现一个算法的远程交易平台(“市场”),其中加密数据可以不公开地发送。这使业务布局更加现实。现在,对服务的任何访问都没有义务让客户披露任何内容。我们可以发送个人信息,累积的大数据以及任何其他加密的机密信息,并以加密的形式(只有我们拥有的密钥)接收处理结果。
另一个轨迹是在内部出售对该算法的访问权限。在这里值得关注近年来密码学的另一项发现。这就是所谓的不可混淆性。在2001年首次提出了难以区分的混淆概念(B.Barak,O.Goldreich,R.Impagliazzo,S.Rudich,A.Sahai,SP Vadhan和K.Yang。 2001年,第1-18页)与重新考虑形式化混淆问题的需要有关,因为从数学角度来看,以前的解决方法并不完全正确,也没有给出可混淆性程度的可衡量指标。在2013年的几乎同一组研究人员中,他们提出了解决方案,以解决他们在2001年为自己设定的问题。他们设法找到了一个可能成为这种混淆器角色的设计(Sanjam Garg; Craig Gentry; Shai Halevi; Mariana Raykova; Amit Sahai; Brent Waters。所有电路的候选不可区分性混淆和功能加密.Focs 2013,40-49)。难以混淆的本质可以解释如下。假设我们有一个类似obf的程序(),它在输入端接收特定的程序代码,并在输出端以混淆(混淆)形式输出它。而且,如果我们有两个具有相同功能A和B的程序,则已经收到它们的混淆版本obf(A)和obf(B),我们将无法以准确的值来理解两者中的哪一个被输入到混淆器的输入(使用类似的方法来表示加密算法的不可区分性)。由此得出几个不明显的结论,其中之一是混淆器输出处的程序在其内部保留“秘密”的能力。例如,它可以是加密密钥-然后将其与可执行代码一起发送,并且同时无法提取。
使用难以区分的混淆可能带来的好处不限于此。使用不可区分的代码的另一个重要结果是,您不必信任硬件。可以在不受信任的硬件上执行任何数据处理。结果,如果对硬件的信任要求引起争议,数十亿美元的家用计算机开发支出或华为与美国之间的对抗就变得毫无意义。但这是另一篇文章的主题。
在出售算法的情况下,可以将其混淆后的代码传输给客户端。同时,即使我们为特定用户添加了一些个性化的代码,客户也将无法从代码中“提取”此定制部分。结果,我们不仅无法分析算法的原理,而且获得一种为程序提供与它们不可分的特定标记的方法,当这些标记在Internet上分发时始终会留下数字标记。但是,应该指出的是,当前难以区分的混淆的实现是如此麻烦,以至于谈论其实际用途还为时过早。最有可能(与云中不同),我们将在10年内看到内部部署实施方案。
预测和注意事项
因此,我们看到在未来的5年或5年以上的时间里,算法市场可能会以云方案的形式出现,并且随后有可能在内部执行。当然,这不会在一夜之间发生。要形成这种关系,仍然应该出现:
- 一个或多个平台,用于在算法的提供者和使用者之间交换数据。他们必须在传输层级别自动执行FHE的所有功能。然后,该服务将真正变得方便,并且最重要的是,所有市场参与者都可以理解该服务,因为现在很少有IT专家知道什么是FHE以及如何使用它。
- 大数据交换仍然受到通信通道速度有限的阻碍。因此,在这里有必要等到信道容量以自然方式增长到所需的值,或者在客户端启动其他数据处理服务,这可以是第1段中的平台和框架的一部分。
算法市场的发展会对经济的许多领域产生重大影响。肯定会有几个领域会受到这种转变的影响。
大数据。现代大数据市场的配置不仅包括信息阵列本身,而且还包括分析中心,分析中心能够提取知识并基于此信息构建模型。每个大数据收集者,例如电信运营商,银行或零售业,都有自己的分析师团队,他们开发知识提取模型并将这些材料出售给其他消费者。如果可以免费获得用于处理数据的丰富算法和模型市场,那么这些单元将失去其重要性。大数据累加器将不再能够为从大数据中提取的信息增加价值,并将被迫仅出售“原始”材料,其成本也将随着时间的流逝而贬值,例如经典原材料(石油,天然气,铝等)现在如何贬值。
三个发展水平。 如今,经典的发展二分法是“后端与前端”。后者编写用户界面,前者编写应用程序的整个服务器端逻辑。在这里可以形成一个新层,可以将其指定为“ algoend”。关键,最重要和最复杂的算法(NLP,ML / AI,数据挖掘,区块链等)将放在其上。换句话说,algoend是任何开发的基本内容,前端和后端是其针对特定项目的个性化。 Algoend将要求最高资格,并将进入附加服务领域,从而形成服务的新市场。反过来,前端和后端是劳动力市场,其成本将降低。
市场C2B。从前两点已经可以得出关于劳动力市场正在发生的转变的结论。网络安全领域中新技术的发展将使现在几乎不存在的C2B部门复苏。换句话说,我们正在从知识产权控制的法律方案(只有大公司现在可以抗争)转变为任何人都可以使用的技术方案。如果产生的知识产权与使用它的服务密不可分,那么就不需要法律和组织成本来维持其使用方式。
法律服务市场。 众所周知,向信息经济的过渡对参与专利和法律纠纷的律师提出了很高的要求。直到某个时刻,事实确实如此。但是,在未来的10年或更长的时间里,我预计该服务市场将彻底消亡(至少在IT领域中)。现在,算法的专利和注册似乎已经不是很实用,而且确实是一种保护程序,所有开发人员都更倾向于将重要的开发作为一种专有技术,而不是对结果进行公开和获得专利。在此添加了另一个重要的事实-难以区分的混淆器输出处的代码无法获得版权。这是基于难以区分的混淆的定义,因为不可能定义和证明,入口处给他什么样的软件结构。我预计,十年后,至少在我们现在所看到的形式下,IT行业将不再有法律纠纷。
当然,与其他任何预测一样,本文中提出的预测可能不会实现。研发中的发现和开发是最令人费解的预测领域。例如,我们不能说目前难以区分的复杂设计将在5年内得到改进并付诸实践。这可能不会发生。假设预测本身和本文的结论可能会实现是正确的,但是预测所依据的时间段具有更大的不确定性。
原始文章发表在这里