论文阅读笔记-LSM-bush

阅读量: searchstar 2024-03-20 23:32:59

Categories： Tags：

首先介绍前置工作。

¶ 缩写

缩写	全称
FPR	false positive rate

¶ 符号

符号	含义	单位
N	total data size	blocks
F	buffer size	blocks
L	number of levels
M	所有bloom filter的平均bits per bit	bits
p	sum of FPRs across all Bloom filters
	Bloom filter FPR at Level
T	base capacity ratio
X	ratio growth exponential

¶ Bloom filter

假设bits per entry是，那么false positive rate (FPR) 就是

假如FPR是p，那么bits per entry就是

¶ Monkey

论文：https://dl.acm.org/doi/pdf/10.1145/3035918.3064054

假设总的FPR是，LSM-tree的层数为L，size ratio是T。传统做法是每层的bloom filter的bits per entry都一样，这相当于把均匀分在各层，即第层的FPR为，bits per entry是

然而bloom filter的FPR是随bit数指数递减的，而层的大小是指数递增的，因此我们可以给较小的层分配更多bloom filter bits，这样可以在保持总的FPR不变的情况下减少内存使用量。

假设，第一层的FPR是，那么Monkey会把第二层的FPR设置成，第三层的FPR设置成，以此类推。这样就有，即。

假设是leveling策略，那么第一层的bits per entry就是。由于每层的FPR都比上一层大T倍，所以bits per entry比上一层少，然而总数据量比上一层大T倍，因此平均bits per entry是

假设，那么

平均bits per entry

我们来代入数字检查一下：

from math import *
T = 10
L = 4
p = 0.01
M = log((T**L - 1) / ((T-1)*p)) / log(2)**2 - log(T) / log(2)**2 * \
	((L-1)*(T-1)*T**L - T**L + T) / \
		((T**L - 1) * (T-1))
print('Average bits per entry: %f\n' %M)

M1 = log((T**L - 1) / ((T-1)*p)) / log(2)**2
Mi = M1
i = 1
M = 0
data = 0
p = 0
while True:
	M += Mi * T ** (i-1)
	data += T ** (i-1)
	p_i = exp(-Mi * log(2)**2)
	p += p_i
	print('Level %d, bits per entry: %f, false positive rate: %f' %(i, Mi, p_i))
	if i == L:
		break
	i += 1
	Mi -= log(T) / log(2)**2
M /= data
print('Average bits per entry: %f' %M)
print('Overall false positive rate: %f' %p)

Average bits per entry: 10.334730

Level 1, bits per entry: 24.181732, false positive rate: 0.000009
Level 2, bits per entry: 19.389203, false positive rate: 0.000090
Level 3, bits per entry: 14.596674, false positive rate: 0.000900
Level 4, bits per entry: 9.804144, false positive rate: 0.009001
Average bits per entry: 10.334730
Overall false positive rate: 0.010000

而传统方法

log(L / p) / log(2)**2

12.470448459145366

¶ Dostoevsky

论文：https://dl.acm.org/doi/pdf/10.1145/3183713.3196927

大多数数据都在最后一层，因此大多数query都落在最后一层，但是每层产生的compaction I/O都是一样多的。因此将前面的层用tiering做compaction，有T个sorted run，最后一层用leveling，只有一个sorted run。这种策略叫做lazy leveling。

跟monkey一样，将总的FPR 分成。不同的是，用tiering的层有T个sorted run，每个sorted run的FPR是这层的FPR的，因此跟之前leveling的分析结果相比前面的层的bits per entry要增加。不过没关系，由于每层的数据量是指数增大的，所以前面这些tiering层多出来的bits对平均bits per entry的影响很小：

¶ LSM-bush

论文：https://dl.acm.org/doi/pdf/10.1145/3299869.3319903

我们可以发现，增加某层的sorted run个数时，这一层的bits per entry是对数增大的，然而由于每层的数据量是指数增大的，所以增加上面的层的sorted run个数对平均bits per entry影响很小，而且还可以降低写放大。因此我们考虑从底层到最上层让sorted run个数指数增大。

时，LSM-bush令第i层的sorted run个数，论文里取的。论文附录C里把每层的bloom filter的bit数算出来了，似乎跟Monkey的不太一样。

假设最后一层的size ratio是C，那么写放大等于。由于层数，其中N是数据量，F是write buffer的大小，所以写放大等于。

论文里给出的point read的I/O复杂度是。

mkdocs支持Latex风格的公式

Docker学习笔记