当前位置：首页 > 区块链新闻 > 正文

区块链入门 | 一文读懂哈希函数

来源：互联网时间：2019-04-12 15:39:39

哈希函数

哈希函数（Hash）：h=H（Data）

定义

哈希函数H，将可变大小的数据Data作为输入，产生固定长度的h值。

密码学哈希函数，是一个数学函数。哈希函数本身拥有的特征：

1、输入任意性：函数的输入可以是任意大小的数据；

2、输出固定性：函数的输出是一个固定大小的数据；

3、能够进行有效计算：也就是说在一个合理的时间内，能够对输入数据进行运算得出输出。

对于区块链技术以及加密数字货币而言，要使得哈希函数达到密码安全，还需要要求其具有以下特性：

1）碰撞阻力

碰撞的概念：如果有两个不同的值X,Y，H（X）=H（Y）成立，则称哈希函数H产生了碰撞。而碰撞阻力是指无法找到两个不同的值X,Y使得H（X）=H(Y)。

由碰撞阻力的解释和哈希函数的特性，会很容易的得出产生碰撞是一个必然的现象。因为哈希函数的输入空间是任意大小的数据，而输出是固定大小的数据。这就意味着输入空间比输出空间大，因此碰撞是必然的。

例如，如果我们定义哈希函数的输出只有0和1两种结果，那么很显然碰撞是很容易发生的。

那么一个优良的哈希函数，应该是这样的：

任意y，找x，使得H(x) = y，非常困难
给定x1, 找x2, 使得H(x1) == H(x2), 非常困难
找任意的x1, x2, 使得H(x1) == H(x2), 非常困难

例如，对于一个256位输出的哈希函数而言，最坏的情况是要进行2256+1次哈希运算，平均也要2128次哈希运算。这个量级，差不多是一台PC机算10^27年的时间。所以，我们可以认为这件事是具有碰撞阻力的。

正是因为有了碰撞阻力，所以才有了哈希上链的说法。所谓哈希上链是典型的存证场景：这个场景可以让我们将哈希输出作为信息摘要写进区块链的区块结构中。例如有某一份非常重要的文件，文件非常大，将文件本身写入区块链中并不可行，所有者A又希望该文件在后续的使用中安全可靠，不会有被篡改的风险。于是所有者A将该文件做一次哈希，并将哈希值写入区块链中。后续在使用的过程中，只需要对要使用的文件做一次哈希，并与在区块链中的哈希值进行对比即可。如果哈希值相同，则证明没有被篡改，如果哈希值不同，则证明被篡改过。