引介：Turbo-Geth 客户端：数据库改进

几个月以前，我加入了 Turbo-Geth 团队，开始主动给 Trubo-Geth 客户端贡献代码。Turbo-Geth 客户端是 Geth 客户端的一个另类版本（当前仍在开发），其目标是做得比原有的客户端运行速度更快、更高效。那么 Turbo-Geth 实现这个目标的办法包括下面几项：

进一步优化数据库结构

在需要与状态数据交互的场合，减少对数据库的读、写操作

优化状态树操作的效率（有可能需要改变现有状态树的数据结构）

在本文中，我会着重指出 Turbo-Geth 和 Geth 在数据库上的不同之处。主要的区别在于：

不同的数据库（使用 Bolt，而非 LevelDB）

按桶（bucket）来细分数据库

那么，本文的主要内容也就跟这两点相关。

Bolt 和 LevelDB 其实非常相似，两者都是 “键-值对”（key-value）存储，设计目标都是为不需要完整数据库服务器的项目提供简单、快捷且可靠的数据库。Geth 选用的数据库是 LevelDB，而 Turbo-Geth 选用的是 Bolt。

但两者也有一个关键区别：组织数据的方式。LevelDB 是一个 LSM （Log-Structured Merged-Tree）数据库，而 Bolt 使用 bucket，而且每一个 bucket 都包含着一个 B+- Tree 结构。我们可以把一个 bucket 当作 “大数据库里的一个小数据库”。

BTC突破40000美元关口日内跌幅为3.47%:火币全球站数据显示，BTC短线上涨，突破40000美元关口，现报40003.25美元，日内跌幅达到3.47%，行情波动较大，请做好风险控制。[2021/5/21 22:27:20]

那么，两者之间的主要区别在于：LSM 数据库是为重度添加操作（appending）和范围扫描操作（range scanning）优化的，而不是为随机读取的性能优化的；为了提供一致性，它不允许同时对数据库执行读、写操作。也是出于性能考虑，这种数据库是没有实现原子性的。Bolt 则反之，插入操作（inserting）速度较慢，但是随机读取速度较快，实现了原子性，而且可以同时对数据库读写。

我们再稍微解释一下原子性：

原子性：“原子” 意味着不可分割。假设现在我们要给一个数据库存储多个哈希值，而其中一个在插入数据库时失败了，如果此时所有哈希值的操作都会同时撤销，这就叫做原子性。Turbo-Geth 就有这样的特性，只有所有哈希值的插入操作都成功时，这个操作才能成功。而没有实现原子性的数据库（比如 LevelDB）则意味着，必须使用一个 workaround 以安全地将数据插入数据库。换句话来说，在这个点上，我们觉得 Bolt 更好，因为他在给数据库添加数据时更安全。

如前所述，Turbo-Geth 是切分成多个 bucket 的。每个 bucket 都是大数据库中的一个小数据，各自包含了一个 B+-Tree 结构。

下面便是 Turbo-Geth 数据库在区块高度 9,346,492 处的切分：

- Turbo-Geth 的 Archive 节点的数据区分（区块高度为 9,346,492）-

Geth 客户端的 Archive 大小（区块高度 9346492）: 3.7 TBParity 客户端的 Archive 大小（区块高度 9346492）: 3.6 TBTurbo-Geth 客户端的 Archive 大小（区块高度 9346492）: 652.62 GB每一个部分都存储在一个 bucket 里面。其中主要部分的简要解释如下：

原象（preimage）：哈希值与地址之间的管理，以及存储位置哈希值与存储位置之间的关联

收据（receipt）：交易收据

合约存储内容的历史（History of Storage）：合约存储内容的变更历史

账户历史（History of Accounts）：账户的变更历史

区块头：每个区块的区块头

区块体：每个区块的区块体

合约存储内容（Contract Storage）：就是合约存储内容

ChangeSet：数据库变更历史

账户：账户

使用这么多 bucket ，是为了让构成大数据库的各 B+-Tree 树高不至于太高，这样跟数据库的交互就会比较容易。换句话说，这是在使用多个 bucket 来提高读取数据库的性能。

在切换到 Bolt 之后，Turbo-Geth 在处理随机键（比如交易哈希值）时遇到了一些问题，因为 Bolt 会在提交数据之前对这些键进行排序（sort），又因为这些哈希值都是随机的，而且数量很多，所以产生了大量的排序需求，然后导致大量的写入放大现象（write amplification，实际写入的物理数据量是写入数据量的多倍）。而 BadgerDB 使用 log-structured-merge（LSM）模式，似乎是一个更好的选择。这个问题仍在研究当中，不过，我们已经实现了一个 workaround 来解决这个问题。

这里有一个图表，显示了 BadgerDB 和 BoltDB 在整体性能上的对比（感谢 Alexey Akhunov 制图）：

Turbo-Geth 客户端通过下列（数据库）手段来优化以太坊的性能：

使用多个 bucket，以更迅速地检索某些数据片

使用 B+-Tree 而非 LSM

如果你想给我们捐赠，可以通过 Gitcoin。

郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如作者信息标记有误，请第一时间联系我们修改或删除，多谢。

Uniswap比特币减半临近当前市场价格已经涨到位？听听专家怎么说

著名的数字资产银行商银河数码（Galaxy digital）创始人迈克诺沃格拉茨（ Mike Novogratz）再次对比特币（BTC）的价格做出了预测,预计比特币将于2020年5月减半。据诺沃格拉茨称,这个加密货币可能在2020年突破20000美元的基准价。

火币下载超43%以太坊地址盈利研究员看好以太坊成为新避险工具

根据加密货币分析公司IntoTheBlock的数据,随着以太坊现货和衍生品市场出现爆炸性增长,有43％的ETH地址在盈利。2020年前两个月,以太坊对美元上涨近110％,150亿美元的市值注入,使得以太坊在加密货币市场的份额迅速扩张。在以太坊长达数月的上涨背景下,ETH现货交易量在近几个星期快速飙升。

SOL金色公开课第39期：市场中寻找确定性趋势和拐点

金色公开课,由金色财经主办,定位联合行业头部企业一起打造行业最全最专业的知识共享平台。课程将以社群分享、线上直播、全网直播的方式打造行业最具影响力的线上栏目,累积100期课程,10万以上社群覆盖,千万级内容展现。

欧易交易所
欧易交易所APP官网下载

欧易交易所

引介：Turbo-Geth 客户端：数据库改进

欧易交易所

欧易交易所欧易交易所APP官网下载

欧易交易所

欧易交易所
欧易交易所APP官网下载