以太坊源码分析—Ethash共识算法

EddieChan 发布于2019-06-27 18:50 / 3238人阅读

摘要：当前和一样，采用基于工作量证明的共识算法来产生新的区块。源码解析生成通过方法生成，首先是生成，再从生成挖矿在挖矿与共识中提到了，共识算法通过实现接口，来实现挖矿算法也不例外。

Ethereum当前和Bitcoin一样，采用基于工作量证明(Proof of Work,PoW)的共识算法来产生新的区块。与Bitcoin不同的是，Ethereum采用的共识算法可以抵御ASIC矿机对挖矿工作的垄断地位，这个算法叫做Ethash。

为什么要反ASIC

PoW的的核心是Hash运算，谁的Hash运算更快，谁就更有可能挖掘出新的区块，获得更多的经济利益。在Bitcoin的发展过程中，挖矿设备经历了(CPU=>GPU=>ASIC)的进化过程，其中的动机就是为了更快地进行Hash运算。随着矿机门槛地提高，参与者久越来越少，这与区块链的去中心化构想背道而驰。
因此，在共识算法设计时，为了减少ASIC矿机的优势(专用并行计算)，Ethereum增加了对于内存的要求，即在进行挖矿的过程中，需要占用消耗大量的内存空间，而这是ASIC矿机不具备的(配置符合运算那能力的内存太贵了，即使配置，这也就等同于大量CPU了)。即将挖矿算法从CPU密集型(CPU bound)转化为IO密集型(I/O bound)

Dagger-Hashimoto

Ethash是从Dagger-Hashimoto算法改动而来的，而Dagger-Hashimoto的原型是Thaddeus Dryja提出的Hashimoto算法，它在传统Bitcoin的工作量证明的基础上增加了消耗内存的步骤。

传统的PoW的本质是不断尝试不同的nonce，计算HASH
$$hash\_output=HASH(prev\_hash,merkle_root,nonce)$$
如果计算结果满足$hash\_outputnonce是有效的

而对于Hashimoto，HASH运算仅仅是第一步，其算法如下:

</>复制代码 
nonce:　64-bits.正在尝试的nonce值
get_txid(T):历史区块上的交易T的hash
total_transactions:　历史上的所有交易的个数

</>复制代码 
hash_output_A = HASH(prev_hash,merkle_root,nonce)
for i = 0 to 63 do 
    shifted_A = hash_output_A >> i
    transaction = shifted_A mod total_transactions
    txid[i] = get_txit(transaction) << i
end of
txid_mix = txid[0]^txid[1]...txid[63]
final_output = txid_mix ^ （nonce<<192)

可以看出，在进行了HASH运算后，还需要进行64轮的混淆(mix)运算，而混淆的源数据是区块链上的历史交易，矿工节点在运行此算法时，需要访问内存中的历史交易信息(这是内存消耗的来源)，最终只有当　$final\_output < target$　时，才算是找到了有效的nonce

Dagger-Hashimoto相比于Hashimoto，不同点在于混淆运算的数据源不是区块链上的历史交易，而是以特定算法生成的约1GB大小的数据集合(dataset)，矿工节点在挖矿时，需要将这1GB数据全部载入内存。

Ethash算法概要

矿工挖矿不再是仅仅将找到的nonce填入区块头，还需要填入一项MixDigest，这是在挖矿过程中计算出来的，它可以作为矿工的确在进行消耗内存挖矿工作量的证明。验证者在验证区块时也会用到这一项。

先计算出约16MB大小的cache，约1GB的dataset由这约16MB的cache按特定算法生成，dataset中每一项数据都由cache中的256项数据参与生成，cache中的这256项数据可以看做是dataset中数据的parent。只所以是约，是因为其真正的大小是比16MB和1GB稍微小一点(为了好描述，以下将省略约)

cache和dataset的内容并非不变，它每隔一个epoch(30000个区块)就需要重新计算

cache和dataset的大小并非一成不变，16MB和1GB只是初始值，这个大小在每年会增大73%,这是为了抵消掉摩尔定律下硬件性能的提升，即使硬件性能提升了，那么最终计算所代表的工作量不会变化很多。结合上一条，那么其实每经过30000个区块，cache和dataset就会增大一点，并且重新计算

全节点(比如矿工)会存储整个 cache和dataset，而轻客户端只需要存储 cache。挖矿(seal)时需要dataset在内存中便于随时存取，而验证(verify)时，只需要有cache就行，需要的dataset临时计算就行。

Ethash源码解析

dataset生成

dataset通过generate()方法生成，首先是生成cache，再从cache生成dataset

挖矿(Seal)

在挖矿与共识中提到了，共识算法通过实现Engine.Seal接口，来实现挖矿,Ethash算法也不例外。
其顶层流程如下:

Seal调用中，启动一个go routine来调用ethash.mine()进行实际的挖矿，参数中的block是待挖掘的区块(已经打包好了交易)，而nonce是一个随机值，作为挖矿过程尝试nonce的初始值。

mine()调用首先计算后续挖矿需要的一些变量。hash为区块头中除了nonce和mixdigest的Hash值，dataset为挖掘这个区块时需要的混淆数据集合(占用1GB内存),target是本区块最终Hash需要达到的目标，它与区块难度成反比

对本次尝试的nonce进行hashmotoFull()函数计算最终result(最终Hash值)和digest，如果满足target要求，则结束挖矿，否则增加nonce，再调用hashmotoFull()

</>复制代码 
func hashimotoFull(dataset []uint32, hash []byte, nonce uint64) ([]byte, []byte) {
    lookup := func(index uint32) []uint32 {
        offset := index * hashWords
        return dataset[offset : offset+hashWords]
    }
    return hashimoto(hash, nonce, uint64(len(dataset))*4, lookup)
}

hashmotoFull()是运算的核心，内部调用hashmoto()，第三个参数为dataset的大小（即1GB）,第四个参数是一个lookup函数，它接收index参数，返回dataset中64字节的数据。

</>复制代码 
func hashimoto(hash []byte, nonce uint64, size uint64, lookup func(index uint32) []uint32) ([]byte, []byte) {
    // 将dataset划分为2维矩阵，每行mixBytes=128字节，共1073739904/128=8388593行
    rows := uint32(size / mixBytes)
    
    //　将hash与待尝试的nonce组合成64字节的seed
    seed := make([]byte, 40)
    copy(seed, hash)
    binary.LittleEndian.PutUint64(seed[32:], nonce)
    seed = crypto.Keccak512(seed)
    seedHead := binary.LittleEndian.Uint32(seed)
    // 将64字节的seed转化为32个uint32的mix数组(前后16个uint32内容相同)
    mix := make([]uint32, mixBytes/4)
    for i := 0; i < len(mix); i++ {
        mix[i] = binary.LittleEndian.Uint32(seed[i%16*4:])
    }
    temp := make([]uint32, len(mix))
    //　进行总共loopAccesses=64轮的混淆计算，每次计算会去dataset里查询数据
    for i := 0; i < loopAccesses; i++ {
        parent := fnv(uint32(i)^seedHead, mix[i%len(mix)]) % rows
        for j := uint32(0); j < mixBytes/hashBytes; j++ {
            copy(temp[j*hashWords:], lookup(2*parent+j))
        }
        fnvHash(mix, temp)
    }
    // 压缩mix：将32个uint32的mix压缩成8个uint32
    for i := 0; i < len(mix); i += 4 {
        mix[i/4] = fnv(fnv(fnv(mix[i], mix[i+1]), mix[i+2]), mix[i+3])
    }
    mix = mix[:len(mix)/4]
    // 用8个uint32的mix填充32字节的digest
    digest := make([]byte, common.HashLength)
    for i, val := range mix {
        binary.LittleEndian.PutUint32(digest[i*4:], val)
    }
    //　对seed+digest计算hash，得到最终的hash值
    return digest, crypto.Keccak256(append(seed, digest...))
}

验证(Verify)

验证时VerifySeal()调用hashimotoLight()，Light表明验证者不需要完整的dataset，它需要用到的dataset中的数据都是临时从cache中计算。

</>复制代码 
func hashimotoLight(size uint64, cache []uint32, hash []byte, nonce uint64) ([]byte, []byte) {
    keccak512 := makeHasher(sha3.NewKeccak512())
    //lookup函数和hashimotoFull中的不同，它调用generateDatasetItem从cache中临时计算
    lookup := func(index uint32) []uint32 {
        rawData := generateDatasetItem(cache, index, keccak512) //  return 64 byte
        data := make([]uint32, len(rawData)/4) //  16 个　uint32
        for i := 0; i < len(data); i++ {
            data[i] = binary.LittleEndian.Uint32(rawData[i*4:])
        }
        return data
    }
    return hashimoto(hash, nonce, size, lookup)
}

除了lookup函数不同，其余部分hashimotoFull完全一样

总结

Ethash相比与Bitcoin的挖矿算法，增加了对内存使用的要求，要求矿工提供在挖矿过程中使用了大量内存的工作量证明,最终达到抵抗ASIC矿机的目的。

参考资料

1 Ethash-Design-Rationale
2 what-actually-is-a-dag
3 why-dagger-hashimoto-for-ethereum

云服务器 GPU云服务器以太坊以太坊区块 linux以太坊以太坊区块查询

文章版权归作者所有，未经允许请勿转载,若此文章存在违规行为，您可以联系管理员删除。

转载请注明本文地址：https://www.ucloud.cn/yun/24378.html

以太坊源码分析：共识（2）引擎

摘要：前言是以太坊封定义的一个接口，它的功能可以分为类验证区块类，主要用在将区块加入到区块链前，对区块进行共识验证。辅助类生成以太坊共识相关的。被使用，是以太坊状态管理服务，当报告数据的时候，需要获取区块的信息。前言 engine是以太坊封定义的一个接口，它的功能可以分为3类：验证区块类，主要用在将区块加入到区块链前，对区块进行共识验证。产生区块类，主要用在挖矿时。辅助类。接下...

YuboonaZhang 2019-06-27 18:52 评论0 收藏0
以太坊源码分析：共识（3）Ethash

摘要：在中，该随机数称为，它需要满足一个公式其中，去除区块头中生成的哈希值，见。固定值，生成的哈希值的最大取值。哈希值满足条件的概率是，矿工需要进行次的判断，才有可能找到一个符合条件的，当前以太坊难度为。前言 Ethash实现了PoW，PoW的精妙在于通过一个随机数确定，矿工确实做了大量的工作，并且是没有办法作弊的。接下来将介绍： Ethash的挖矿本质。 Ethash是如何挖矿的。如...

huashiou 2019-06-27 18:52 评论0 收藏0
以太坊POA共识机制Clique源码分析

摘要：以太坊中除了基于运算能力的外，还有基于权利证明的共识机制，是以太坊的共识算法的实现，这里主要对的相关源码做一个解读分析。检查包头中包含的签名是否满足共识协议以太坊中除了基于运算能力的POW(Ethash)外，还有基于权利证明的POA共识机制，Clique是以太坊的POA共识算法的实现，这里主要对POA的Clique相关源码做一个解读分析。 Clique的初始化在 Ethereum.S...

Stardustsky 2019-06-27 18:21 评论0 收藏0
区块链学习之以太坊（七）

摘要：基于以太坊项目，以太坊团队目前运营了一个公开的区块链平台以太坊网络。主要特点以太坊区块链底层也是一个类似比特币网络的网络平台，智能合约运行在网络中的以太坊虚拟机里。以太坊采用交易作为执行操作的最小单位。以太坊将比特币针对数字交易的功能进一步进行了拓展，面向更为复杂和灵活的应用场景，支持了智能合约这一重要特性。以太坊项目简介以太坊：项目最初的目标是打造以个智能合约的平台，该平台支持...

xiongzenghui 2019-06-27 18:29 评论0 收藏0
以太坊源码分析—挖矿与共识

摘要：下面来看看具体是怎么实现接口的可以看到，启动了多个线程调用函数，当有线程挖到时，会通过传入的通道传出结果。可以看到在主要循环中，不断递增的值，调用函数计算上面公式中的左边，而则是公式的右边。前言挖矿(mine)是指矿工节点互相竞争生成新区块以写入整个区块链获得奖励的过程.共识(consensus)是指区块链各个节点对下一个区块的内容形成一致的过程在以太坊中, miner包向外提供挖...

walterrwu 2019-06-27 18:51 评论0 收藏0