Filtered-Space Saving Algorithm

2022/04/11

Filtered-Space Saving Algorithm

Space-Saving algorithm

基本思想是维护预定数量的 m 个元素及其关联的计数器。每个计数器都会更新,以反映一个元素的最大可能出现次数,并且这种估算方式可能存在误差。

算法分析

实验笔记

这是数据流方向中研究最多的问题之一, Space-Saving 在众多算法中有最好的性能。 为了节省空间,还有许多实现细节:用哈希表检查元素是否存在于集合中?用堆找出当前最小的值?等等。 准确度和内存使用上取得良好平衡:在现实数据上要到达 100% 准确度仅仅只要一点额外的空间(通常是 1.1 倍的 K)

拓展

额外思考

MORE

参考