从LLM到Agent:Agentic系统的知识地图
Agentic 系列开篇。从 LLM 的局限出发,定义 Agent 的核心组成,绘制 Agentic 系统全景架构图,并通过代码演示从 ChatCompletion 到完整 Agent 的演进路径。本文是整个系列 14 篇文章的精神锚点与导航地图。
Agentic 系列开篇。从 LLM 的局限出发,定义 Agent 的核心组成,绘制 Agentic 系统全景架构图,并通过代码演示从 ChatCompletion 到完整 Agent 的演进路径。本文是整个系列 14 篇文章的精神锚点与导航地图。
事务的四个隔离级别不是教科书上的枯燥定义,而是对读写冲突这个核心矛盾的四种不同权衡。Read Uncommitted 用最小代价换最大并发,Serializable 用最大代价换绝对正确。中间两档的差异藏在锁持有多久和锁住什么范围的细节里。理解这些细节,才能看懂 InnoDB 的加锁行为,才能在死锁发生时快速定位根因。
索引不是加了就快的魔法,而是一套需要理解底层数据结构、遵循匹配规则、结合业务场景做判断的工程实践。从磁盘 I/O 的物理约束理解 B+Tree 的设计动机,从最左前缀匹配理解复合索引的使用规则,从 EXPLAIN 的输出理解优化器的真实决策——每一步都是在缩小扫描行数与实际需要行数之间的差距。
Redis 的快不是因为内存数据库四个字就能解释的,而是单线程模型、精心设计的数据结构、惰性过期策略和高效持久化机制共同作用的结果。从五种数据类型的内部编码理解选型依据,从 RDB 和 AOF 的写入管线理解持久化保障,从 Sentinel 的故障检测理解高可用设计——每一个工程决策都在性能、安全和复杂度之间寻找平衡点。
限流不是一个算法问题,而是一个系统设计问题。从速率控制到并发保护,从单机令牌桶到分布式 Redis 计数器,从 Nginx 接入层到业务层精细化流控——每一层的限流策略背后,都是对系统容量、业务优先级和降级策略的深度思考。
本文面向 DevOps 架构师与云原生工程师,介绍如何基于 AWS CodePipeline + CloudFormation 构建一套支持多泳道(Multi-Lane)并行部署的 ECS 持续交付体系。该方案不仅解决并发部署的资源锁冲突问题,还实现模板集中治理与业务仓库完全解耦。
编程原则是对抗软件复杂性的核心工具,但工具之间存在内在张力。本文以电商订单系统为主线,将 KISS、DRY、SOLID 等十余条编程原则按目标维度分为四组,逐一拆解其工程含义、典型误用与正确边界,并给出原则冲突时的决策框架和不同项目阶段的原则权重建议。
系统性地构建广告变现的指标体系与优化框架。从收入拆解公式出发,深入解析 eCPM、Ad Load、CTR、CVR、ROI 等核心指标的定义、计算与关联关系,探讨指标之间的联动与制约机制,并从供给侧、需求侧、匹配效率、用户体验四个维度阐述系统化的优化方法论,结合 A/B 测试实践与字节系广告产品案例,为广告变现从业者提供完整的度量与优化参考框架。
This article explores how to dynamically compile and manipulate Protocol Buffers messages at runtime in Go — without relying on pre-generated code. It walks through the full path from .proto file to runtime proto.Message via FileDescriptorProto, and presents a practical protoc plugin solution for hot-reloadable schema management.
本文系统梳理分布式系统的核心问题与解决方案:从集中式到分布式的演进动机,CAP/BASE 理论的工程权衡,一致性模型的层次划分,到 2PC、3PC、TCC、Saga、本地消息表、事务消息等分布式事务方案的原理、流程与代码示例。适合希望建立分布式事务知识体系的工程师阅读。
系统阐述广告系统数据基础设施的核心架构,涵盖用户身份体系、Cookie Mapping、DMP 平台、定向策略、CTR/CVR 预估模型、数据埋点体系及归因模型,并分析隐私合规浪潮对广告数据基建的深层冲击与重构路径。
系统性解析程序化广告的四种交易模式(PDB、PD、PMP、RTB)与竞价机制演进,深入探讨拍卖理论在广告交易中的应用、eCPM 统一排序框架、从 CPM 到 oCPM 的计费模型优化路径,以及 RTB 竞价的工程实现与反作弊体系,为理解现代广告交易系统提供完整的理论与实践框架。
去重分析在企业日常分析中的使用频率非常高,如何在大数据场景下快速地进行去重分析一直是一大难点。在近期的 Apache Kylin Meetup 北京站上,我们邀请到 Kyligence 大数据研发工程师陶加涛为大家揭开了大数据分析常用去重算法的神秘面纱。 Apache Kylin 作为目前唯一一个同...
上篇介绍了利用 Roaring Bitmap 来进行精确去重。虽然这种算法能大大地减少存储开销,但是随着数据量的增大,它依然面临着存储上的压力。在本篇推送中将要介绍的 HyperLogLog(下称 HLL)是一种非精确的去重算法,它的特点是具有非常优异的空间复杂度(几乎可以达到常数级别)。
内容安全是平台治理的核心命题。本文从内容风险分类体系出发,系统梳理文本、图片、视频及多模态融合审核的技术路径演进,深入分析机审、人审、众审三位一体的协作机制,并探讨攻防对抗、运营闭环与行业趋势,构建内容安全风控的完整认知框架。
本文从经济学视角剖析互联网广告的商业本质,系统阐述广告生态中DSP、SSP、DMP、Ad Exchange等核心角色的协作机制,深入分析从品牌广告到效果广告的范式迁移,并以抖音等内容平台为案例,解构流量产权、数据流转与商业化路径中的核心矛盾与演变趋势。
从策略设计到模型构建,系统阐述风控领域的核心方法论。涵盖规则与模型的混合策略体系、多层防御架构、评分体系设计、特征工程的WOE/IV分析、样本设计与拒绝推断、模型监控与PSI稳定性检测,以及攻防博弈下的策略迭代思路,构建数据驱动的风险量化认知框架。
互联网风控并非简单的规则堆砌,而是一套涵盖风险识别、实时决策、数据治理与攻防对抗的系统工程。本文从风控的核心命题出发,深入剖析风险图谱、三道防线、决策架构、数据体系与运营闭环,构建完整的风控认知框架,为架构师与策略从业者提供体系化的设计思路。