为什么Minecraft服务器这么能扛——从协议到网络的全面拆解

玩过Minecraft联机的人大概都感受过一种「这不科学」的时刻——朋友在美国开了个几十块钱一个月的VPS，你在中国，延迟却只有100多毫秒。进游戏之后挖方块秒响应，打怪没有明显卡顿，就好像那个服务器离你不超过两个省份。

想想也挺奇怪的。别的游戏服务器跨国联机什么体验？高ping、丢包、瞬移、掉线，血压直接拉满。一到Minecraft，同样的网络条件，体验完全不一样。

Mojang到底是怎么做到的？

先看看他们面对的是什么地狱级难题

一个Minecraft世界有多大？理论上有6000万×6000万格。一个区块（chunk）是16×16×384（1.18之后），也就是说一个区块就有98304个方块。一个中等视距下玩家能看到15×15=225个区块，这还没算地下的方块数据。

如果你是个服务器开发者，把这么多数据一次性发给客户端，一个数据包可能就几百KB甚至上MB。一个玩家就这样，10个玩家呢？100个呢？服务器带宽再大也得崩。

但这还不是最恶心的——方块是动态的。玩家挖一个方块、放一个方块、红石电路每秒切换几十次状态……所有这些变化必须实时同步给附近的每个玩家。

Mojang的解法非常精彩，我们一层一层拆。

第一层：协议设计——极简到骨子里

Minecraft用的是自研二进制协议，不是JSON，不是XML，甚至不常用文本。整个数据流就是紧凑的二进制字节序列。

比如一个「玩家位置更新」包，大概长这样：

packet_id (1 byte) | entity_id (varint) | x (double) | y (double) | z (double) | yaw (float) | pitch (float) | on_ground (1 byte)

没有多余字段，没有字符串key，每个字节都在干活。VarInt编码做得漂亮——小数字占1字节，大数字自动扩展，不浪费空间。

对比一下如果用JSON做同样的事：

{"packet_type":"player_position","entity_id":12345,"x":1234.56,"y":64.0,"z":-789.12,"yaw":180.0,"pitch":0.0,"on_ground":true}

同样的信息，JSON方式大约是BIN格式的8-10倍大小。如果服务器每秒给20个玩家各发20个位置包，差距会被放大到吓人。

这就是第一个关键设计：在数据传输之前，先从协议层把脂肪减掉。

第二层：Netty异步网络——不阻塞，不吃CPU

Minecraft从1.7版本开始用Netty做网络层。Netty是个Java的NIO框架，核心就一句话：一个线程管几万个连接，而不是一个连接占一个线程。

传统BIO模式下，每个玩家连接都要单独开一个线程。100个玩家=100个线程，线程切换的开销就够服务器喝一壶。Netty用epoll（Linux）或者IOCP（Windows），一个工作线程用事件轮询的方式处理所有连接的读写事件。

玩家发来一个包？Netty的event loop捡起来，丢给业务线程处理，然后马上回去继续监听。不忙等，不空转。

这个设计有什么实际效果？一个单核VPS就能处理几百个玩家连接，在Java圈子里搁以前想都不敢想。那些「几十块钱VPS开Minecraft服务器还流畅」的事，Netty是底层功臣。

第三层：数据包压缩——一个开关省掉80%流量

就算协议已经够紧凑了，大型数据包（比如玩家进入新区域时加载区块）还是很大。Mojang的解法简单但有效：设置一个压缩阈值，小包不压，大包用zlib压。

默认阈值是256字节。什么意思？小于256字节的包（比如心跳包、移动确认）直接发，因为压缩这种小包CPU开销比收益还大。大于256字节的包（比如区块数据）先zlib压缩再发，通常能压到原来的30%-50%。

具体机制是这样的：发包的原始数据会先打包成一个「帧」——4字节长度头+数据体。如果长度>阈值，数据体被zlib压缩，然后发出。客户端收包时先读长度头，判断是否压缩，按需解压。

整个流程都在Netty的pipeline里自动完成，开发者基本无感。

这个设计挺妙的——不是粗暴压缩所有包，而是根据包大小动态决策。就是对「省CPU」和「省带宽」的精确权衡，哪个划算走哪个。

第四层：TCP_NODELAY——亲手关掉那个自作聪明的算法

TCP有个叫Nagle算法的东西，设计初衷是好的：把小数据包攒一攒再发，减少网络上的小包数量。但对于实时游戏来说这简直要命——你不想等系统「攒够一车再发」，而是希望每个包立刻出门。

Minecraft在Socket连接建立后直接设置TCP_NODELAY=true，禁用Nagle算法。

socket.setTcpNoDelay(true);

少了一个buffer步骤，每个包产生后立刻进入网络。在跨国网络场景下，这个开关可能把RTT（往返时间）从200ms砍到180ms，看似不多，但在20tick/s的游戏循环里，每一毫秒都影响手感。

第五层：区块分批发送——不会一口撑死客户端

这是我认为Minecraft做得最聪明的地方之一。

玩家进新区域时，225个区块的数据不可能全塞进一个TCP包——那会让客户端收到一个巨大的payload然后卡住解压。Minecraft的做法是分批、分优先级发送：

以玩家为中心，从内圈到外圈逐层发送
每批只发有限数量的区块
玩家当前看着的那个方向优先发
如果玩家快速移动导致某些区块不再可见，直接取消发送

客户端收到多少就渲染多少，不需要等全部到齐。所以你进游戏时会看到远处的区块先空白再慢慢加载出来，而不是整个画面卡住等所有数据到位。

这是一个典型的渐进式数据加载策略，Web开发里常用的lazy loading和这个思路如出一辙。

第六层：实体追踪——只同步你附近的东西

Minecraft里「实体」包括其他玩家、生物、掉落物、矿车、船……一个服务器上可能有几千个。但一个玩家在特定时刻真正需要知道的，只有视距范围内的那些。

服务器的实现是这样的：

每个tick遍历所有玩家
对每个玩家，计算视距范围内有哪些实体
新进入范围的→发送出生包
离开范围的→发送销毁包
一直在范围内的→发送位置/状态更新包

视距之外发生了什么？服务器完全不管，不计算也不发送。对于远处的僵尸打架、猪走路——不好意思，不关你的事。

这个简单粗暴的过滤节省了大量无效计算和网络开销。1000个实体和10000个实体，对单个玩家来说体验差别不大，因为他能看到的永远只有100个左右。

第七层：你感受不到的「假流畅」

上面说的都是技术层面的真优化。但Minecraft还有一个聪明的做法：用假象掩盖延迟。

你挖一个方块，服务器还没确认呢，方块已经在你客户端上消失了——这叫客户端预测。等服务器回复确认了，如果没问题就结束，如果服务器说「不对，那块还在」，客户端再给你弹回来。

你跑路的时候，客户端先渲染移动，不用等服务器确认每一步。服务器只在必要的时候纠正——比如你撞上了还没加载出来的墙，或者你用了加速外挂。

说白了就是：先假装一切正常，你爽了再说。这是所有现代网游都在用的技术，但Minecraft做得特别干净，你几乎感觉不到那些「弹回来」的瞬间（除非网络真的烂到爆炸）。

给开发者的启示

写完这篇我才意识到，Minecraft的优化哲学根本不是「用了什么黑魔法」，恰恰相反——它就是老老实实把每一个环节都做对。

先说协议层。二进制自定义协议不是炫技，是真的能把JSON甩出8倍差距。你的应用如果也在传海量数据，JSON可能正在吞掉你的带宽。

然后是异步I/O。现代应用如果还一个连接一个线程，那是真扛不住。Netty、epoll、IOCP——这个原理不管你用Java还是Python还是Go都一样。

压缩不是越狠越好。大包压掉80%是真的赚，但心跳包这种几十字节的东西去压缩完全是浪费CPU。Mojang设了个256字节的阈值，这就是工程上的分寸感。

区块分批加载也是个值得学的方式——大块数据不要一口给，分优先级、分批给，用户不关心的直接取消。Web里的lazy loading跟这个一模一样。

客户端预测——延迟客观存在，你不接受的代价就是用户多等。让客户端先假装一切好了，服务器后面再审批，用户根本感觉不到中间那100多毫秒。

最后是只同步必要的信息。远处的东西别告诉近处的人。这个道理简单到像废话，但多少系统死于「不管用不用的到的数据全给它推过去」。

这些不是游戏引擎的独门秘籍。Web实时协作、IoT数据上报、视频会议……场景不一样，原理全通。

说到底，Mojang的工程师也没发明什么新东西。他们就是在一个一个节点上做了正确的技术选择。这个才是真的厉害。

明航の个人博客

为什么Minecraft服务器这么能扛——从协议到网络的全面拆解

为什么Minecraft服务器这么能扛——从协议到网络的全面拆解

先看看他们面对的是什么地狱级难题

第一层：协议设计——极简到骨子里

第二层：Netty异步网络——不阻塞，不吃CPU

第三层：数据包压缩——一个开关省掉80%流量

第四层：TCP_NODELAY——亲手关掉那个自作聪明的算法

第五层：区块分批发送——不会一口撑死客户端

第六层：实体追踪——只同步你附近的东西

第七层：你感受不到的「假流畅」

给开发者的启示

青云制作_彭明航

为什么Minecraft服务器这么能扛——从协议到网络的全面拆解

先看看他们面对的是什么地狱级难题

第一层：协议设计——极简到骨子里

第二层：Netty异步网络——不阻塞，不吃CPU

第三层：数据包压缩——一个开关省掉80%流量

第四层：TCP_NODELAY——亲手关掉那个自作聪明的算法

第五层：区块分批发送——不会一口撑死客户端

第六层：实体追踪——只同步你附近的东西

第七层：你感受不到的「假流畅」

给开发者的启示

人终有一死，学习还有什么意义？

AI 时代程序员该固守手写代码，还是拥抱 AI？说点真相

青云制作_彭明航