CXL:内存层级的下一次重组 内存一直是计算机体系结构里最少被讨论、但最常成为瓶颈的部分。CPU 的进化有 Moore’s Law 可以讲,GPU 的进化有 FLOPS 的增长曲线可以讲,内存的进化……大部分时候就是 DDR 的版本号在变,DIMM 的规格在更新,延迟数字在缓慢改善。 CXL(Compute Express Link)试图打破这个格局。它不只是一个新的内存接口标准,它的方向是让服务器的内存层级从静态的、预先划分 2026-05-08 计算机体系结构 #基础设施 #数据中心 #硬件 #CXL #内存
Rust 写进 Linux 内核之后 Linux 6.1 在 2022 年 12 月合并了第一批 Rust 代码。这件事发生时,内核社区里争论的声音几乎和支持的声音一样大。两年多过去了,尘埃并没有完全落定,但已经足够看清楚一些东西了。 Rust 进入 Linux 内核,不是一个关于编程语言的故事。它是一个关于如何在几千人同时参与的超大型系统里引入结构性变化的故事。 为什么是 Rust,为什么是现在内核里的 C 代码已经有三十多年的历 2026-05-08 系统与基础设施 #Linux #内核 #Rust #系统编程 #内存安全
Linux 调度器换了心脏:EEVDF 替代 CFS 之后 Linux 6.6 在 2023 年末改掉了沿用十五年的 CFS 调度器,换成了 EEVDF。这件事在内核社区引发过不少讨论,在更广泛的工程圈里几乎没有激起什么水花。 大多数工程师对调度器的感知,停留在”它在底下自动跑,我不用管”。这个感知在大部分场景里没错,但在越来越多的延迟敏感型工作负载里,调度器的行为已经成了 p99 延迟的直接解释变量。 CFS 是什么,以及它的问题CFS(Complet 2026-05-07 计算机科学 #基础设施 #Linux #操作系统 #内核 #性能工程
eBPF 的边界:内核可编程化走到哪一步了 2022 年,Brendan Gregg 在一次演讲里说了一句话:”eBPF 对 Linux 的意义,就像 JavaScript 对浏览器的意义。” 这个类比被反复引用,但也经常被误解。它的意思不是”eBPF 让内核编程变得更容易”——内核编程从来不容易,eBPF 也没有改变这一点。它的意思是:eBPF 给了内核一个安全的运行时,让外部代码可以在内核上下文里执行,而不需要编写内核模块。 内核模块 2026-05-06 系统与基础设施 #可观测性 #Linux #内核 #系统编程 #网络 #eBPF
开源软件的可持续性困境:谁在承担「免费」的成本 2024 年 3 月,一个叫 Jia Tan 的账号在 XZ Utils 里植入了后门。 XZ Utils 是一个 Linux 压缩工具库,几乎所有主流发行版都预装。这个后门经过精心设计,能在特定条件下劫持 sshd 的认证过程——影响范围是全球所有运行受感染发行版的 Linux 服务器。 让这件事成为分水岭的,不是攻击本身的技术复杂度,而是它揭示的一个问题:一个支撑全球基础设施的关键软件,只有一 2026-05-05 开源与工程文化 #开源 #开源治理 #软件工程 #供应链安全 #社区
分布式系统里的时间问题 在单机上写代码,时间是理所当然的。System.currentTimeMillis() 返回一个数,sleep(1000) 等一秒,事件有先后顺序,日志按时间戳排列,因果清晰。 一旦把系统拆成多台机器,这个”理所当然”就碎掉了。 物理时钟会漂移每台机器都有硬件时钟,靠晶振产生频率。晶振不是原子钟,受温度、电磁干扰、老化影响,每台机器的时钟走得快慢不完全一致。典型的服务器时钟漂移在每天几十毫秒到几 2026-05-04 计算机科学 #基础设施 #工程实践 #数据库 #分布式系统 #计算机科学
SQLite 凭什么重新进入后端视野 SQLite 长期背负着一个标签:适合原型开发、移动端、嵌入式,但不适合生产级服务端。这个判断曾经相当准确,但现在值得重新审视。 Cloudflare D1、Turso、Litestream、fly.io 的 LiteFS——这些出现在过去两三年的项目,都在围绕 SQLite 构建可以认真交付的后端服务。它们不是在”克服”SQLite 的缺陷,而是在重新定义适用范围。 问题不是 SQLite 变了 2026-05-03 基础设施 #基础设施 #数据库 #SQLite #后端工程 #边缘计算
后量子密码学的安静落地 2024 年 8 月,NIST 正式发布了三项后量子密码学标准:FIPS 203(ML-KEM)、FIPS 204(ML-DSA)、FIPS 205(SLH-DSA)。这件事在密码学圈子里是里程碑式的,在一般技术媒体里几乎没有引起波澜。 大多数工程师对量子计算的感知,停留在”实用量子计算机还很遥远”这个判断里。这个判断不完全错,但它遮住了一个更紧迫的现实:你今天传输的加密数据,攻击者可以存储下来, 2026-05-02 计算机科学 #基础设施 #工程实践 #安全 #密码学 #标准化
AI 数据中心的电力账单 训练一个 GPT-4 量级的模型消耗多少电?估算值在 50 GWh 左右,大约相当于一座小城市一个月的用电量。这个数字在两年前还能让人惊叹一下,现在已经是行业基本盘。 更值得关注的变化是推理侧。训练是一次性的成本,推理是持续的——每天数亿次请求,每次都要经过 GPU。随着 AI 服务的普及和使用量增长,推理端的总用电量正在超过训练端成为更大的变量。 电力,从一个”数据中心运营细节”变成了 AI 行 2026-05-01 AI 基础设施 #AI 基础设施 #数据中心 #能源 #硬件 #行业观察
eBPF:内核的可编程边界 eBPF 被大多数人认识的方式是通过 Cilium、Pixie、BCC 这类工具:一种无侵入的 tracing 技术,能在不修改代码的情况下观测进程行为。这个认知框架是准确的,但不完整。 把 eBPF 理解为”更好的 strace”,会错过它更根本的含义:Linux 内核从一个固定功能的黑盒,变成了一个可在运行时扩展的可编程平台。 架构:为什么 eBPF 是安全的Linux 内核允许加载内核模块 2026-05-01 基础设施 #基础设施 #可观测性 #Linux #网络 #eBPF