风险提示:理性看待区块链,提高风险意识!

区块链密码学:哈希(Hash)

2个回答

磨空心3星评价

2020-04-22 14:45:35

区块链密码学:哈希(Hash)

hash是什么,有点类似「洗牌」把牌洗乱的概念,只是洗的不是牌,而是一笔数据,这个「洗」的过程是经过严谨定义的,且产生的结果会是固定长度的。常见的hash算法有MD5.RIPEMD-160.SHA1.SHA256等,不同hash算法「洗」的过程都不同,产生出来hash值长度也不同,像是MD5不管喂进去的数据多大,最终都会产生128 bits的结果,而SHA256产生的hash值则会是256 bits。一个好的hash算法通常需要具备以下这些特性:

1.输入任意长度的数据,产生的hash值是固定长度的

2.取得hash值的计算过程是快速的

3.输入的数据有任何一点改变,产生的hash值会有很大的差异

4.具有单向性,可轻易输入数据取得hash值,但无法从hash值得知原始数据的内容

hash可以拿来做什么呢?假如今天阿牛在下班前打了一份500页的重要文件,因为文件很重要不能带离公司,那隔天他上班时如何得知是否有人趁晚上潜入公司偷改他的文件,有一个很简单的作法,就是取得整份文件的hash值,比如说用SHA256取得一个256bits的hash值,然后记在纸上或其他地方,隔天到公司时,只要对这份文件取得hash值,然后跟昨天下班前得到那个256bits的hash值比对,如果两者有差异,表示有人偷改这份文件,阿牛就要再仔细检查这份文件,如果两者一样,表示文件没有被修改过,阿牛可以安心的继续编辑他的文件。

再回来看为什么一个好的hash值需要上述的四点呢?

1.固定长度:因为结果是固定长度的,阿牛可以知道要准备多大张的纸来抄,而不会有时长有时短,也不方便比对。若是程序来说,设计者可以事先规划多大的空间放置hash值,不用担心Overflow的问题

2.快速得到结果:虽然输入的数据越大,计算hash的时间会相对增加,不过整体的过程还是不需要太复杂的计算,因此即便阿牛的文件是500页,也可以快速的得到hash值

3.任何改变产生的结果都截然不同:阿牛的整份500页文件即便有人多加了一个空格,隔天阿牛也可以明显的知道hash值不一样了,而第三个特性还有一个重要的原因,就是不能让原始数据与hash值可以看出什么关联性,因此即便是原始数据有任何一点改变,结果都是截然不同的

4.具有单向性:假如今天阿牛不小心将纸条掉落在电梯里,被其他人捡走也不会担心重要文件的信息会外流,因为无法从hash值回推原始数据的内容

hash应用非常广泛,比如说网站登入时会先将密码转成hash值,若有人撷取到信息,密码也不会外流。有些软件也会提供hash值,使用者下载后可以将档案hash比对,就能知道下载的软件是否有被窜改。而数位签章也是使用hash来减少需要加密的数据。不过有些hash算法像是MD5.SHA1已经不建议使用了。

那么hash值与比特币有什么关系呢?比特币所谓的「挖矿」,其实就是不断的计算hash

直到找到合法的hash值,这个合法的hash值就是我们上一篇说的「幸运草」。我们在第一篇文章里说到区块链的特性之一「难以窜改」就是利用hash值一笔一笔串接下去产生「链」的概念,其中任何数据被窜改,会让原本合法的hash值变成不合法,导致「链」断掉下一篇我们就来讲比特币的「区块」有哪些数据,「挖矿」是怎么计算hash值的,并将「区块」连成「区块链」。


全兴5星评价

2020-04-22 14:46:27

Hash算法我们可能早就听过,不仅仅应用在密码学领域。由于hash算法所体现的思想十分的满足我们的需求,比如可以把一个十分复杂的东西映射到另外一个较为简单的地方,所以很多地方都有应用。

1. 什么是hash算法?

Hash(哈希或散列,Hash Algorithm)算法是信息技术领域非常基础也非常重要的技术。它能任意长度的二进制值(明文)映射为较短的固定长度的二进制值(Hash值),并且不同的明文很难映射为相同的Hash值。

Hash算法的核心思想:基于内容进行编址或者命名。

2. Hash算法的特点

一个优秀的 hash 算法,将能实现:

正向快速:给定明文和hash算法,在有限时间和有限资源内能计算出hash值。

逆向困难:给定(若干)hash值,在有限时间内很难(基本不可能)逆推出明文。

输入敏感:原始输入信息修改一点信息,产生的hash值看起来应该都有很大不同。

冲突避免:很难找到两段内容不同的明文,使得它们的hash值一致(发生冲突)。

如果给定一个明文前提下,难以找到碰撞的另一个明文,称为“弱抗碰撞性”;如果难以找到任意两个明文,发生碰撞,则称算法具有“强抗碰撞性”。

3. 流行的hash算法

目前流行的 Hash 算法包括 MD5、SHA-1 和 SHA-2。

MD是Message Digest的缩写。

MD4(RFC 1320)是 MIT 的 Ronald L. Rivest 在 1990 年设计的,MD 是 Message Digest 的缩写。其输出为 128 位。MD4 已证明不够安全。

MD5(RFC 1321)是 Rivest 于1991年对 MD4 的改进版本。它对输入仍以 512 位分组,其输出是 128 位。MD5 比 MD4 复杂,并且计算速度要慢一点,更安全一些。MD5 已被证明不具备"强抗碰撞性"(强抗碰撞性参考上面的内容)。

SHA (Secure Hash Algorithm)是一个 Hash 函数族,由 NIST(National Institute of Standards and Technology)于 1993 年发布第一个算法。目前知名的 SHA-1 在 1995 年面世,它的输出为长度 160 位的 hash 值,因此抗穷举性更好。SHA-1 设计时基于和 MD4 相同原理,并且模仿了该算法。SHA-1 已被证明不具"强抗碰撞性"。

4. hash算法的缺点

一般而言,Hash需要较强的算力资源,所以算力很可能成为hash算法的瓶颈。一般选择进行hash算法的CPU需要较高的主频。

5. Hash算法与数字摘要之间的关系

数字摘要的意思是对内容进行Hash运算,把运算结果作为唯一的值来代表之前的值。

根据前面所学习的内容,我们可以根据前面所学的hash函数的特点之一(抗碰撞性)来解决确保内容没有被篡改的问题。

数字摘要是Hash算法的一个很重要的使用场景。当我们在网络上下载东西的时候,很可能被不法分子篡改,这个时候我们就可以对下载的资源进行数字摘要,这样当我们下载之后,通过把下载的文件进行Hash计算,把结果与数字摘要进行对比,就可以知道文件是否被篡改。