欧美日韩在线亚洲国产人,中文在线中文资源,91精品欧美一区二区综合在线

Kafka 是由 LinkedIn 公司推出的一個(gè)高吞吐的分布式消息系統(tǒng)，通俗地說就是一個(gè)基于發(fā)布和訂閱的消息隊(duì)列，溫故而知新，反復(fù)學(xué)習(xí)優(yōu)秀的框架，定有所獲。

應(yīng)用場(chǎng)景

Kafka 的應(yīng)用場(chǎng)景如下：

異步解構(gòu)：在上下游沒有強(qiáng)依賴的業(yè)務(wù)關(guān)系或針對(duì)單次請(qǐng)求不需要立刻處理的業(yè)務(wù)。
系統(tǒng)緩沖：有利于解決服務(wù)系統(tǒng)的吞吐量不一致的情況，尤其對(duì)處理速度較慢的服務(wù)來說起到緩沖作用。
消峰作用：對(duì)于短時(shí)間偶現(xiàn)的極端流量，對(duì)后端的服務(wù)可以啟動(dòng)保護(hù)作用。
數(shù)據(jù)流處理：集成 spark 做實(shí)時(shí)數(shù)據(jù)流處理。

Kafka 拓?fù)鋱D（多副本機(jī)制）

由上圖我們可以發(fā)現(xiàn) Kafka 是分布式，對(duì)于每一個(gè)分區(qū)都存在多副本，同時(shí)整個(gè)集群的管理都通過 Zookeeper 管理。

Kafka 核心組件

①broker

Kafka 服務(wù)器，負(fù)責(zé)消息存儲(chǔ)和轉(zhuǎn)發(fā)；一個(gè) broker 就代表一個(gè) kafka 節(jié)點(diǎn)。一個(gè) broker 可以包含多個(gè) topic。

②topic

消息類別，Kafka 按照 topic 來分類消息。

③partition

topic 的分區(qū)，一個(gè) topic 可以包含多個(gè) partition，topic 消息保存在各個(gè) partition 上。

由于一個(gè) topic 能被分到多個(gè)分區(qū)上，給 kafka 提供給了并行的處理能力，這也正是 kafka 高吞吐的原因之一。

partition 物理上由多個(gè) segment 文件組成，每個(gè) segment 大小相等，順序讀寫（這也是 kafka 比較快的原因之一，不需要隨機(jī)寫）。

每個(gè) Segment 數(shù)據(jù)文件以該段中最小的 offset ，文件擴(kuò)展名為.log。當(dāng)查找 offset 的 Message 的時(shí)候，通過二分查找快找到 Message 所處于的 Segment 中。

④offset

消息在日志中的位置，可以理解是消息在 partition 上的偏移量，也是代表該消息的唯一序號(hào)。

同時(shí)也是主從之間的需要同步的信息。

⑤Producer

生產(chǎn)者，負(fù)責(zé)向 Kafka Broker 發(fā)消息的客戶端。

⑥Consumer

消息消者，負(fù)責(zé)消費(fèi) Kafka Broker 中的消息。

⑦Consumer Group

消費(fèi)者組，每個(gè) Consumer 必須屬于一個(gè) group；（注意：一個(gè)分區(qū)只能由組內(nèi)一個(gè)消費(fèi)者消費(fèi)，消費(fèi)者組之間互不影響。）

⑧Zookeeper

管理 kafka 集群，負(fù)責(zé)存儲(chǔ)了集群 broker、topic、partition 等 meta 數(shù)據(jù)存儲(chǔ)，同時(shí)也負(fù)責(zé) broker 故障發(fā)現(xiàn)，partition leader 選舉，負(fù)載均衡等功能。

服務(wù)治理

既然 Kafka 是分布式的發(fā)布/訂閱系統(tǒng)，這樣如果做的集群之間數(shù)據(jù)同步和一致性，kafka 是不是肯定不會(huì)丟消息呢？以及宕機(jī)的時(shí)候如果進(jìn)行 Leader 選舉呢？

①數(shù)據(jù)同步

在 Kafka 中的 Partition 有一個(gè) leader 與多個(gè) follower，producer 往某個(gè) Partition 中寫入數(shù)據(jù)，是只會(huì)往 leader 中寫入數(shù)據(jù)，然后數(shù)據(jù)才會(huì)被復(fù)制進(jìn)其他的 Replica 中。

而每一個(gè) follower 可以理解成一個(gè)消費(fèi)者，定期去 leader 去拉消息。而只有數(shù)據(jù)同步了后，kafka 才會(huì)給生產(chǎn)者返回一個(gè) ACK 告知消息已經(jīng)存儲(chǔ)落地了。

②ISR

在 Kafka 中，為了保證性能，Kafka 不會(huì)采用強(qiáng)一致性的方式來同步主從的數(shù)據(jù)。

而是維護(hù)了一個(gè)：in-sync Replica 的列表，Leader 不需要等待所有 Follower 都完成同步，只要在 ISR 中的 Follower 完成數(shù)據(jù)同步就可以發(fā)送 ACK 給生產(chǎn)者即可認(rèn)為消息同步完成。

同時(shí)如果發(fā)現(xiàn) ISR 里面某一個(gè) follower 落后太多的話，就會(huì)把它剔除。

具體流程如下：

上述的做法并無法保證 Kafka 一定不丟消息。雖然 Kafka 通過多副本機(jī)制中最大限度保證消息不會(huì)丟失，但是如果數(shù)據(jù)已經(jīng)寫入系統(tǒng) page cache 中但是還沒來得及刷入磁盤，此時(shí)突然機(jī)器宕機(jī)或者掉電，那消息自然而然地就會(huì)丟失。

③Kafka 故障恢復(fù) 為什么Kafka如此之快？

Kafka 通過 Zookeeper 連坐集群的管理，所以這里的選舉機(jī)制采用的是Zab（zookeeper 使用）：

生產(chǎn)者發(fā)生消息給 leader ，這個(gè)時(shí)候 leader 完成數(shù)據(jù)存儲(chǔ)，突然發(fā)生故障，沒有給 producer 返回 ack。
通過 ZK 選舉，其中一個(gè) follower 成為 leader ，這個(gè)時(shí)候 producer 重新請(qǐng)求新的 leader，并存儲(chǔ)數(shù)據(jù)。

Kafka 為什么這么快

①順序?qū)懘疟P

Kafka 采用了順序?qū)懘疟P，而由于順序?qū)懘疟P相對(duì)隨機(jī)寫，減少了尋地址的耗費(fèi)時(shí)間。（在 Kafka 的每一個(gè)分區(qū)里面消息是有序的）

②Page Cache

Kafka 在 OS 系統(tǒng)方面使用了 Page Cache 而不是我們平常所用的 Buffer。Page Cache 其實(shí)不陌生，也不是什么新鮮事物。為什么Kafka如此之快？

我們?cè)?Linux 上查看內(nèi)存的時(shí)候，經(jīng)常可以看到 buff/cache，兩者都是用來加速 IO 讀寫用的，而 cache 是作用于讀。

也就是說，磁盤的內(nèi)容可以讀到 cache 里面，這樣應(yīng)用程序讀磁盤就非常快。

而 buff 是作用于寫，我們開發(fā)寫磁盤都是，一般如果寫入一個(gè) buff 里面再 flush 就非常快。

而 Kafka 正是把這兩者發(fā)揮到了極致：Kafka 雖然是 scala 寫的，但是依舊在 Java 的虛擬機(jī)上運(yùn)行。

盡管如此，Kafka 它還是盡量避開了 JVM 的限制，它利用了 Page cache 來存儲(chǔ)，這樣躲開了數(shù)據(jù)在 JVM 因?yàn)?GC 而發(fā)生的 STW。

另一方面也是 Page Cache 使得它實(shí)現(xiàn)了零拷貝，具體下面會(huì)講。

③零拷貝

無論是優(yōu)秀的 Netty 還是其他優(yōu)秀的 Java 框架，基本都在零拷貝減少了 CPU 的上下文切換和磁盤的 IO。

當(dāng)然 Kafka 也不例外。零拷貝的概念具體這里不作太詳細(xì)的復(fù)述，大致地給大家講一下這個(gè)概念。

傳統(tǒng)的一次應(yīng)用程請(qǐng)求數(shù)據(jù)的過程：

這里大致可以發(fā)傳統(tǒng)的方式發(fā)生了 4 次拷貝，2 次 DMA 和 2 次 CPU，而 CPU 發(fā)生了4次的切換。

DMA 簡(jiǎn)單理解就是，在進(jìn)行 I/O 設(shè)備和內(nèi)存的數(shù)據(jù)傳輸?shù)臅r(shí)候，數(shù)據(jù)搬運(yùn)的工作全部交給 DMA 控制器，而 CPU 不再參與任何與數(shù)據(jù)搬運(yùn)相關(guān)的事情。

④零拷貝的方式