网络排查案例集 · 系列目录
叙事框架:网络问题套路化排查方法论 总计 39 篇,已发布 0 篇,39 篇待完善
一、TCP 连接类
- ⏳ 客户端报连接超时、服务端说没收到——TCP 握手丢包分析
- ⏳ TCP 连接异常断开:RST 包出现的原因与全链路定位
- ⏳ 一次 keepalive 配置不当导致连接泄漏
- ⏳ TCP 半连接队列满导致大量连接超时
- ⏳ TIME_WAIT 过多导致端口资源耗尽
- ⏳ TCP 全连接队列溢出:listen 的 backlog 参数设错了吗?
- ⏳ TCP 重传率飙升排查:从应用层到物理层逐层找原因
二、抓包 / 诊断类
- ⏳ tcpdump 从入门到生产实战:一条命令一条命令学
- ⏳ Unix Domain Socket 如何抓包?进程间通信可视化
- ⏳ 用 Wireshark 分析一次慢请求的 TCP 序列——真的不是代码问题
- ⏳ 网络延迟突增:从 ping 到 mtr 到 tcpdump 逐层定位
- ⏳ 网络性能指标看不懂?带宽/吞吐/PPS/延迟一次说清楚
三、iptables / 防火墙类
- ⏳ iptables 规则写错导致生产服务不可访问
- ⏳ iptables 规则太多导致网络性能下降
- ⏳ 容器网络不通?从 CNI 到 iptables 逐层排查
- ⏳ 安全组/防火墙策略导致跨环境调用失败
- ⏳ 网络策略导致跨命名空间服务调用失败(K8s NetworkPolicy)
四、DNS / HTTP / SSL 类
- ⏳ DNS 解析慢导致接口首次访问超时
- ⏳ DNS 解析结果不一致:本地 dig 正常、线上就是不行
- ⏳ HTTPS 证书过期?从 SSL 握手序列到证书链验证
- ⏳ HTTP 长连接 Keepalive 配置不当导致连接泄漏
- ⏳ HTTP/2 多路复用导致连接阻塞排查
- ⏳ Nginx 反向代理 502 排查全流程:从 upstream 到 keepalive
- ⏳ Nginx 限流配置不当导致正常请求被拦截
- ⏳ CDN 回源超时排查:到底是用户网络还是源站问题
- ⏳ 负载均衡器会话保持失效排查
- ⏳ 代理(正向/反向)配置错误导致请求异常
五、网络性能类
- ⏳ 带宽打满了怎么办?从网卡指标到流量分析
- ⏳ C10K 到 C1000K:连接数增长后性能突降的底层原因
- ⏳ 网络 MTU 不一致导致分片丢包
- ⏳ TCP 拥塞控制算法 BBR vs Cubic:选型与生产调优
- ⏳ 多网卡 Bonding 模式选错导致的网络不稳定
- ⏳ 跨区域/跨机房网络延迟问题定位
六、应用协议类
- ⏳ gRPC 长连接保活机制导致连接泄露排查
- ⏳ WebSocket 连接频繁断开:从心跳到代理超时
- ⏳ UDP 通信频繁丢包:应用层可靠传输的必要性
七、网络虚拟化类
- ⏳ 容器网络性能排查:veth/bridge/overlay 每层开销分析
- ⏳ 网络虚拟化 VLAN/VXLAN 配置错误排查
- ⏳ K8s Service 访问不通:iptables/IPVS 逐层排查
最后更新:2026-06