为了账号安全,请及时绑定邮箱和手机立即绑定

Kafka-Record(消息格式)

标签:
Spark

    注:本文依赖于kafka-0.10.0.1-src

    kafka消息格式是经过多个版本的演变的,本文只说0.10.0.1版本的消息格式。

    消息格式如图1所示:

webp

图1

    CRC:用于校验消息内容。占4个字节 

    MAGIC:用于标识kafka版本,默认是1。占1个字节

    ATTRIBUTES:用于存储消息压缩使用的编码以及Timestamp类型。这个版本仅支持 gzip、snappy、lz4三种压缩格式。后三位如果是000则表示没有使用压缩,如果是001则表示是gzip压缩,如果是010则是snappy压缩,如果是011则是snappy压缩。第4位(从右数)如果为0,代表使用create time,如果为1代表append time。其余位保留。占1个字节

    TIMESTAMP:时间戳。占8个字节

    KEY_SIZE:用于标识KEY内容的长度K。占用4个字节

    KEY:存储的是KEY的具体内容。占用K个字节。

    VALUE_SIZE:主要标识VALUE的内容的长度V。占用4个字节。

    VALUE:消息的真实内容。占用V个字节


    Record实际上是用Java NIO ByteBuffer存储的,那我们如何将一个消息写入到Record的ByteBuffer里面呢?

    说简单点,其实就是把上面说的字段给Record传过来然后依次放入ByteBuffer中就可以了,但这中间利用了Compressor压缩器的压缩功能,我们后续会说一下Compressor压缩器,这里就先不介绍了。

    还有一点,Record的写入是支持数据分包的,也就是一个完整的VALUE值可以通过valueOffset和valueSize来指定偏移和这次写入的数据大小来进行分包操作,这样就可以将一个完整的消息,分成多个Record。如果valueSize是负数,就表示从valueOffset开始到末尾的数据都写入。

              



作者:闫文亮304
链接:https://www.jianshu.com/p/3d20530b18b3


点击查看更多内容
TA 点赞

若觉得本文不错,就分享一下吧!

评论

作者其他优质文章

正在加载中
  • 推荐
  • 评论
  • 收藏
  • 共同学习,写下你的评论
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦
今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与 放弃机会
意见反馈 帮助中心 APP下载
官方微信

举报

0/150
提交
取消