密码学技术何以为信？深究背后的计算困难性理论

本文主要是介绍密码学技术何以为信？深究背后的计算困难性理论｜第3论，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

作者：李昊轩
来源：微众银行区块链

隐私保护为何选用密码学算法？密码学算法背后有哪些神奇的数学理论？3何时比9大？计算可逆性错觉究竟是如何在数学领域被打破？

这里，我们将从密码学信任的理论基础出发，分享在隐私保护技术方案中应用密码学技术的一些思考：如何理解密码学算法的能力边界，如何客观地比较不同密码学算法对于隐私保护方案有效性的影响。

这一切，要从密码学神奇的“不对称性”说起。

1.神奇的“不对称性”

早在公元前，古埃及、古罗马、古希腊等古文明均已开始使用密码技术来保护信息的机密性，历史上最早的不对称性表现为选用特殊的信息编码方式，如果第三方不知道具体的编码方式，则难以解码对应的信息。
在这里插入图片描述

大约经过4000多年的发展，也就是近代20世纪初，现代密码学正式成型，引入了关于不对称性更为严谨的数学定义。比较有代表性的早期论文包括1929年Lester S. Hill在美国数学月刊上发表的《Cryptography in an Algebraic Alphabet》。

20世纪末，随着因特网的普及，大量敏感数据在网络上进行传输，产生了大量的数据内容保护的需求，密码学技术也因此得到飞速发展。

在现代密码学中，关于不对称性，大家最熟悉的概念莫过于“公钥”和“私钥”。

以加密通信为例，主人公小华要向他的朋友美丽通过加密的方式发送一份电子邮件，可以先找到美丽的公钥，使用公钥对邮件内容进行加密，并将加密后的得到密文发送给美丽。美丽收到邮件内容的密文之后，通过自己的私钥进行解密，最终得到邮件内容的明文。

以上过程中，密码学算法神奇的不对称性体现在以下问题中：

为什么只有美丽可以解密邮件内容？
为什么其他人不能通过美丽的公钥反推出她的私钥？

这些问题的答案，都要归结于密码学中的计算困难性理论。

2.计算困难性理论

在隐私保护场景中，计算困难性理论具体表现为，对同一隐私数据主体，通过不同计算路径，获得相同信息的计算难度具有不对称性。不对称性中，相对容易的计算方式被用来构造授权的数据访问，而困难的计算方式被用来避免非授权的数据泄露。

构造这样的不对称性的方式有很多，最经典的方式之一，就是千禧年七大难题之一——P和NP问题。

P问题是确定性图灵机，即通用计算机计算模型，在多项式时间(O(n^k))内可以计算获得答案的一类问题。NP问题是确定性图灵机在多项式时间内可以验证答案的正确性，但不一定能计算出答案的一类问题。

关于同一份答案，验证过程比计算过程要容易很多，由此我们可以构造出密码学算法所需要的计算难度不对称性。

NP问题是否能够通过有效的多项式时间算法转化成P问题，由此破解计算难度不对称性？目前学术界尚无定论。

理论研究进一步表明，对于NP问题集合中的核心问题，即NP完全问题，如果能够找一个有效的多项式时间算法来解决任何一个NP完全问题，那其他所有NP问题都可以基于这个算法来构造出有效的多项式时间算法。由此，之前提到的计算难度不对称性将不复存在。

幸运的是，经过将近70年的科学探索，这样的算法并没有被发现。在有限时间内，现代计算机难以求解这些问题的答案，所以现代密码学可以比较安全地基于这些NP完全问题来构造有效的密码学算法。

3.神奇的“计算困难问题”

形象地讲，计算困难性理论的核心就是构造一个迷宫，如果不知道捷径，是很难到达出口的。
在这里插入图片描述

我们日常所用的各类密码学算法，其有效性都与这一理论息息相关，这里重点以非对称密码学算法为例，介绍其中经典的迷宫构造蓝图，即三大计算困难问题：

大数分解困难问题
离散对数困难问题
椭圆曲线上的离散对数困难问题

大数分解困难问题

给定两个大素数p和q，计算n=p*q是容易的。然而，给定n，求解p、q则是困难的。

整数的素数分解是数论中最著名的问题之一，目前，求解素数分解最有效的方法称为数域筛法，即通过构造代数数域不停地对整数可能的集合进行迭代运算。

目前，大整数分解问题仍不存在更有效的分解方法，因此密码学一些方案利用大数分解困难问题构造相应协议，如RSA系列算法将其困难性规约为大数分解困难问题。如果大整数分解困难问题被破解，使用RSA密码方案保护的隐私数据也会相应遭到破译。

离散对数困难问题

在模为n，生成元为g的有限域中，给定整数a，计算g^a = b是容易的。然而，给定b和g计算a则是困难的。

许多新接触密码学的读者都会对离散对数问题产生计算可逆性的错觉，看起来就是进行一次log运算的事情，但真相并非如此。

在实数域，元素有一个非常重要的性质，全序关系，所以很容易比较大小。例如，在实数域中9>2且3>2，一定能推出9>2。

在计算log2(9)时，计算机会对以元素9为输入的函数结果进行二分查找法，首先计算(9/2)²和9进行比较，再计算（(0+9/2)/2)²…。通过不停比较元素大小的性质，从而计算log最终的结果。
在这里插入图片描述
然而，在有限域中，元素之间并不存在全序关系。在模为7的有限域中，可以看到诸如9等于2，3比9大的关系存在。