存档

文章标签 ‘kafka’

Kafka入门:简介

2020年2月18日 没有评论

据官方概括,Kafka是一个分布式流处理平台。这句话什么意思?

一个典型的流处理平台具有三个关键能力:

  • 支持发布与订阅流,这些流包含了消息记录,类似消息队列。
  • 可以存储记录流,以便容错
  • 当记录产生时能快速进行处理

显然,Kafka具备这些能力。Kafka通常应用在两大类应用场景中:

  • 构建实时数据流管道,用以不同应用或系统之间获取数据
  • 构建实时流处理应用,用以转换或处理数据流

在介绍kafka如何实现这些功能之前,先简单了解几个概念:

  • kafka通常是以集群的方式运行在跨越多个数据中心的多台服务器上的
  • kafka可以存储不同类别的记录流,这些类别称之为topics
  • kafka中的每条记录有key、value和timestamp组成
分类: 开发 标签: