在上周六的 Meetup 中,我们邀请到了来自 Streamlio 的翟佳老师,为我们分享了《Unified Streaming and Queuing with Apache Pulsar》
[视频 | Infra Meetup No.62:Apache Pulsar] (https://www.bilibili.com/video/av41020650)
Apache Pulsar 是 Yahoo 开源的下一代的消息系统,Pulsar 于 2016 年底开源,现在是 Apache 软件基金会的一个孵化器项目。 Pulsar 在保证大数据消息系统的性能和吞吐量的同时,提供了更多企业级的 Feature,包括方便的运维和扩展,灵活的消息模型,多语言 API,多租户,异地多备,和强持久性一致性等等,解决了现有开源消息系统的一些不足。 Pulsar 在 2015 年初被大规模部署在 Yahoo 的生产环境中,支持着公司的主要应用和业务,为 Yahoo 全球 10 个数据中心之间提供了数据全互备;支持着 140 多万个 Topic;每天处理 1000 多亿条消息;整体的消息发布延迟小于 5ms。通过了 Yahoo 内部主要应用(比如广告平台,KV 系统,mail 等)生产环境的检验。 Pulsar 在设计之初就对企业级应用中比较关注的多租户和异地多备等 feature 进行了全面的支持; Pulsar 对消息系统中比较难解决的强一致性和持久性问题给出了比较优雅的解决方式。 这次分享中,翟佳老师介绍了 Pulsar 项目产生的背景,Pulsar 中的相关概念,Pulsar 主要的体系架构,Pulsar 的特性,Pulsar 在设计中的考虑和具体实现。最后对比了和 Kafka 在同一环境下的相关测试结果。