为了账号安全,请及时绑定邮箱和手机立即绑定

HashMap 扩容为啥总是 2 的倍数?一场来自底层的“强迫症”探险

标签:
Java JavaScript

原文来自于:https://zha-ge.cn/java/55

HashMap 扩容为啥总是 2 的倍数?一场来自底层的“强迫症”探险

你有没有发现,Java 的 HashMap 用起来挺香,但扩容这事儿真的很神秘。不是 10、不是 16,就是 32、64,总之永远是 2 的倍数,感觉像 HashMap 内部养了个强迫症的架构师。前阵子项目有个同事问我“为啥不搞个19试试”,我直接笑出声:你咋不上天呢?

——话说回来,这种底层“奇怪坚持”,肯定是有故事的嘛,所以忍不住自己扒拉了一番,收获了一箩筐“啊哈”时刻。来吧,让我用程序员唠嗑语气跟你扯扯这个 2 的倍数扩容背后的小九九!


位运算的浪漫

起初我单纯以为:“HashMap 老老实实用 2 的倍数,不就是方便大家算一算容量么。”但后来翻了一圈源码,发现人家玩的可不是加减法,而是位运算

看下面这点彩蛋——(别担心,代码不长)

int index = (n - 1) & hash;

瞅见没?这玩意就是用来定位元素放哪的。
如果 n 是 16(2 的 4 次方),n - 1 就是 15,二进制全是 1,
和 hash 做与运算,不就是变相 hash % n 嘛?关键是——
这玩意比真正的 % 运算快很多倍,省事又高效,
不用 hashCode 取余,不用管 n 是不是质数,直接掐指算!


诡异的坑爹时刻

那天刚搞懂为啥用 2 的倍数,忍不住想皮一下——
“要不试试把容量设成 9,看看会咋样?”

然后我就掉坑了。
早期 JDK 版本里,你自作聪明塞个 9、15 进去,不会善罢甘休:
首先,元素分布就会特别丑——好几个 hashCode 虽然不一样,
结果 &(按位与)出来还是同一个桶,
明明人多桶多,却扎堆到一块儿。
极端点,所有元素全挤一个链表里……
WTF,红黑树都救不了你!

再扒拉一遍扩容源码,好家伙,tableSizeFor(capacity) 直接帮你凑最近的 2 的幂。
你想 9?对不起,给你 16。你想 33?那就 64。老板不让穷,也不让抠!


踩坑瞬间

敲重点!真·苦主现场——

  • 指定了一个“看起来挺合理”的初始容量,结果后台日志一看,嘿,为啥变成 16 了?
  • 算 hash 桶的时候,直接 %,性能不如人家 &,慢慢悠悠卡你没商量。
  • 想用特殊大小调优,发现怎么设都不生效,HashMap 自带“自动纠正机制”,就是跟你对着干那种……

经验启示

扒拉了这么一遭,得出的教训如下一箩筐:

  • 不要跟源码较劲,HashMap 就爱 2 的幂,任谁来也改不了。
  • 初始化容量随便给,反正 HashMap 会“圆滑”地给你凑个 2 的倍数。
  • 位运算用得妙,比 % 秒杀好几条街:HashMap 的快感,从底层“算桶”开始。
  • 工作里调优容量时,只要量级对了,不用纠结非要贴着需求给数字——源码帮你“切整”。

——写这篇的时候才体会到,所谓“底层优化”,有时真就像设计师的强迫症,但细品还真香!


唠叨到这里,是不是解开你心头“2 的倍数强迫症”的谜团了?下次有人再问,你就劝他放下执念、顺应天命。代码世界嘛,有些“规定动作”,还是挺有它的艺术的,你说呢?

好了,我要去泡杯咖啡,发会儿呆,下次见记得点我名!

点击查看更多内容
TA 点赞

若觉得本文不错,就分享一下吧!

评论

作者其他优质文章

正在加载中
  • 推荐
  • 评论
  • 收藏
  • 共同学习,写下你的评论
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦
今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与 放弃机会
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号

举报

0/150
提交
取消