区块链密码学：哈希（Hash）

2个回答

磨

磨空心3星评价

2020-04-22 14:45:35

区块链密码学：哈希（Hash）

hash是什么，有点类似「洗牌」把牌洗乱的概念，只是洗的不是牌，而是一笔数据，这个「洗」的过程是经过严谨定义的，且产生的结果会是固定长度的。常见的hash算法有MD5.RIPEMD-160.SHA1.SHA256等，不同hash算法「洗」的过程都不同，产生出来hash值长度也不同，像是MD5不管喂进去的数据多大，最终都会产生128 bits的结果，而SHA256产生的hash值则会是256 bits。一个好的hash算法通常需要具备以下这些特性：

1.输入任意长度的数据，产生的hash值是固定长度的

2.取得hash值的计算过程是快速的

3.输入的数据有任何一点改变，产生的hash值会有很大的差异

4.具有单向性，可轻易输入数据取得hash值，但无法从hash值得知原始数据的内容

hash可以拿来做什么呢？假如今天阿牛在下班前打了一份500页的重要文件，因为文件很重要不能带离公司，那隔天他上班时如何得知是否有人趁晚上潜入公司偷改他的文件，有一个很简单的作法，就是取得整份文件的hash值，比如说用SHA256取得一个256bits的hash值，然后记在纸上或其他地方，隔天到公司时，只要对这份文件取得hash值，然后跟昨天下班前得到那个256bits的hash值比对，如果两者有差异，表示有人偷改这份文件，阿牛就要再仔细检查这份文件，如果两者一样，表示文件没有被修改过，阿牛可以安心的继续编辑他的文件。

再回来看为什么一个好的hash值需要上述的四点呢？

1.固定长度：因为结果是固定长度的，阿牛可以知道要准备多大张的纸来抄，而不会有时长有时短，也不方便比对。若是程序来说，设计者可以事先规划多大的空间放置hash值，不用担心Overflow的问题

2.快速得到结果：虽然输入的数据越大，计算hash的时间会相对增加，不过整体的过程还是不需要太复杂的计算，因此即便阿牛的文件是500页，也可以快速的得到hash值

3.任何改变产生的结果都截然不同：阿牛的整份500页文件即便有人多加了一个空格，隔天阿牛也可以明显的知道hash值不一样了，而第三个特性还有一个重要的原因，就是不能让原始数据与hash值可以看出什么关联性，因此即便是原始数据有任何一点改变，结果都是截然不同的

4.具有单向性：假如今天阿牛不小心将纸条掉落在电梯里，被其他人捡走也不会担心重要文件的信息会外流，因为无法从hash值回推原始数据的内容

hash应用非常广泛，比如说网站登入时会先将密码转成hash值，若有人撷取到信息，密码也不会外流。有些软件也会提供hash值，使用者下载后可以将档案hash比对，就能知道下载的软件是否有被窜改。而数位签章也是使用hash来减少需要加密的数据。不过有些hash算法像是MD5.SHA1已经不建议使用了。

那么hash值与比特币有什么关系呢？比特币所谓的「挖矿」，其实就是不断的计算hash

直到找到合法的hash值，这个合法的hash值就是我们上一篇说的「幸运草」。我们在第一篇文章里说到区块链的特性之一「难以窜改」就是利用hash值一笔一笔串接下去产生「链」的概念，其中任何数据被窜改，会让原本合法的hash值变成不合法，导致「链」断掉下一篇我们就来讲比特币的「区块」有哪些数据，「挖矿」是怎么计算hash值的，并将「区块」连成「区块链」。

全

全兴5星评价

2020-04-22 14:46:27

Hash算法我们可能早就听过，不仅仅应用在密码学领域。由于hash算法所体现的思想十分的满足我们的需求，比如可以把一个十分复杂的东西映射到另外一个较为简单的地方，所以很多地方都有应用。

1. 什么是hash算法?

Hash(哈希或散列，Hash Algorithm)算法是信息技术领域非常基础也非常重要的技术。它能任意长度的二进制值(明文)映射为较短的固定长度的二进制值(Hash值)，并且不同的明文很难映射为相同的Hash值。

Hash算法的核心思想：基于内容进行编址或者命名。

2. Hash算法的特点

一个优秀的 hash 算法，将能实现：

正向快速：给定明文和hash算法，在有限时间和有限资源内能计算出hash值。

逆向困难：给定(若干)hash值，在有限时间内很难(基本不可能)逆推出明文。

输入敏感：原始输入信息修改一点信息，产生的hash值看起来应该都有很大不同。

冲突避免：很难找到两段内容不同的明文，使得它们的hash值一致(发生冲突)。

如果给定一个明文前提下，难以找到碰撞的另一个明文，称为“弱抗碰撞性”;如果难以找到任意两个明文，发生碰撞，则称算法具有“强抗碰撞性”。

3. 流行的hash算法

目前流行的 Hash 算法包括 MD5、SHA-1 和 SHA-2。

MD是Message Digest的缩写。

MD4(RFC 1320)是 MIT 的 Ronald L. Rivest 在 1990 年设计的，MD 是 Message Digest 的缩写。其输出为 128 位。MD4 已证明不够安全。

MD5(RFC 1321)是 Rivest 于1991年对 MD4 的改进版本。它对输入仍以 512 位分组，其输出是 128 位。MD5 比 MD4 复杂，并且计算速度要慢一点，更安全一些。MD5 已被证明不具备"强抗碰撞性"(强抗碰撞性参考上面的内容)。

SHA (Secure Hash Algorithm)是一个 Hash 函数族，由 NIST(National Institute of Standards and Technology)于 1993 年发布第一个算法。目前知名的 SHA-1 在 1995 年面世，它的输出为长度 160 位的 hash 值，因此抗穷举性更好。SHA-1 设计时基于和 MD4 相同原理，并且模仿了该算法。SHA-1 已被证明不具"强抗碰撞性"。

4. hash算法的缺点

一般而言，Hash需要较强的算力资源，所以算力很可能成为hash算法的瓶颈。一般选择进行hash算法的CPU需要较高的主频。

5. Hash算法与数字摘要之间的关系

数字摘要的意思是对内容进行Hash运算，把运算结果作为唯一的值来代表之前的值。

根据前面所学习的内容，我们可以根据前面所学的hash函数的特点之一(抗碰撞性)来解决确保内容没有被篡改的问题。

数字摘要是Hash算法的一个很重要的使用场景。当我们在网络上下载东西的时候，很可能被不法分子篡改，这个时候我们就可以对下载的资源进行数字摘要，这样当我们下载之后，通过把下载的文件进行Hash计算，把结果与数字摘要进行对比，就可以知道文件是否被篡改。