Skyfalling BlogSkyfalling
首页博客关于
全部(106)技术(83)思考(11)科学(5)生活(7)
Agentic 系统(17)业务系统(21)架构设计(11)AIGC 创作(7)工程实践(9)中间件(11)算法与数据结构(7)
2025年03月25日算法与数据结构

大数据去重算法:从 Bitmap 到 HyperLogLog

去重(COUNT DISTINCT)是大数据分析中最常见也最棘手的操作。本文系统拆解两类核心去重算法——精确去重的 Bitmap/Roaring Bitmap 和近似去重的 HyperLogLog,从原理、空间复杂度、工程实现到选型决策,给出完整的技术选型框架。

大数据去重算法BitmapHyperLogLogOLAP
阅读更多 →
2024年07月25日算法与数据结构

计算几何基础:点在多边形内判定算法详解

系统讲解点在多边形内判定的经典算法——射线法与回转数法,涵盖边界情况处理、算法优化及在GIS与图形学中的工程应用

算法计算几何多边形GIS
阅读更多 →
2024年04月18日算法与数据结构

Double Array Trie:高效字典树的压缩与检索实现

深入解析Double Array Trie的DFA建模、BASE/CHECK双数组构建算法、动态更新策略及其在中文分词与信息检索中的工程应用

数据结构TrieDouble Array Trie中文分词
阅读更多 →
2024年01月12日算法与数据结构

概率数据结构与海量数据处理:从布隆过滤器到MinHash

系统讲解布隆过滤器、MinHash/LSH等概率数据结构的数学原理与工程应用,并总结海量数据处理的核心方法论与经典问题解法

数据结构布隆过滤器MinHash海量数据
阅读更多 →
2023年09月20日算法与数据结构

字符串匹配算法全景:从BM到AC自动机的演进之路

系统梳理字符串模式匹配算法族:BM、Horspool、Sunday、KMP、KR及AC自动机,涵盖算法原理、预处理策略、复杂度分析与工程选型

算法字符串匹配KMPAC自动机
阅读更多 →
2023年06月15日算法与数据结构

SkipList与Merkle Tree:两种经典结构的原理与工程应用

深入分析跳表与Merkle树的数据结构原理、算法实现及其在Redis、LevelDB、区块链、分布式系统中的工程应用

数据结构SkipListMerkle Tree分布式系统
阅读更多 →
2023年03月10日算法与数据结构

存储引擎核心数据结构:B-Tree家族与LSM-Tree的设计权衡

深入剖析B-Tree、B+Tree、B*Tree与LSM-Tree的数据结构原理、工程实现及其在存储引擎中的设计权衡,覆盖索引结构选型与读写性能分析

数据结构存储引擎B-TreeLSM-Tree
阅读更多 →

© 2026 Skyfalling