Kafka集群Metadata管理

  • 對于集群中的每一個broker都保存著相同的完整的整個集群的metadata信息;
  • metadata信息里包括了每個topic的所有partition的信息: leader, leader_epoch, controller_epoch, isr, replicas等;
  • Kafka客戶端從任一broker都可以獲取到需要的metadata信息;

Metadata的存儲在哪里 --- MetadataCache組件
  • 在每個Broker的KafkaServer對象中都會創(chuàng)建MetadataCache組件, 負(fù)責(zé)緩存所有的metadata信息;
val metadataCache: MetadataCache = new MetadataCache(config.brokerId)
  • 所在文件: core/src/main/scala/kafka/server/MetadataCache.scala
  • 所有的metadata信息存儲在map里, key是topic, value又是一個map, 其中key是parition id, value是PartitionStateInfo
private val cache: mutable.Map[String, mutable.Map[Int, PartitionStateInfo]] =
    new mutable.HashMap[String, mutable.Map[Int, PartitionStateInfo]]()
  • PartitionStateInfo: 包括LeaderIsrAndControllerEpoch和Replica數(shù)組; 下面的readFrom方法從接受到的buffer構(gòu)造一個PartitionStateInfo對象:
def readFrom(buffer: ByteBuffer): PartitionStateInfo = {
    val controllerEpoch = buffer.getInt
    val leader = buffer.getInt
    val leaderEpoch = buffer.getInt
    val isrSize = buffer.getInt
    val isr = for(i <- 0 until isrSize) yield buffer.getInt
    val zkVersion = buffer.getInt
    val replicationFactor = buffer.getInt
    val replicas = for(i <- 0 until replicationFactor) yield buffer.getInt
    PartitionStateInfo(LeaderIsrAndControllerEpoch(LeaderAndIsr(leader, leaderEpoch, isr.toList, zkVersion), controllerEpoch),
                       replicas.toSet)
  }
  • MetadataCache還保存著推送過來的有效的broker信息
private var aliveBrokers: Map[Int, Broker] = Map()
MetadataCache如何獲取和更新metadata信息
  • KafkaApis對象處理UpdateMetadataRequest
case RequestKeys.UpdateMetadataKey => handleUpdateMetadataRequest(request)
  • handleUpdateMetadataRequest:
    val updateMetadataRequest = request.requestObj.asInstanceOf[UpdateMetadataRequest]
    
    authorizeClusterAction(request)

    replicaManager.maybeUpdateMetadataCache(updateMetadataRequest, metadataCache)

    val updateMetadataResponse = new UpdateMetadataResponse(updateMetadataRequest.correlationId)
    requestChannel.sendResponse(new Response(request, new RequestOrResponseSend(request.connectionId, updateMetadataResponse)))

可以看到是調(diào)用了ReplicaManager.maybeUpdateMetadataCache方法, 里面又會調(diào)用到MetadataCache.updateCache方法

  • MetadataCache.updateCache:
      aliveBrokers = updateMetadataRequest.aliveBrokers.map(b => (b.id, b)).toMap
      updateMetadataRequest.partitionStateInfos.foreach { case(tp, info) =>
        if (info.leaderIsrAndControllerEpoch.leaderAndIsr.leader == LeaderAndIsr.LeaderDuringDelete) {
          removePartitionInfo(tp.topic, tp.partition)
        } else {
          addOrUpdatePartitionInfo(tp.topic, tp.partition, info)
        }
      }

干三件事

  1. 更新aliveBrokers;
  2. 如果某個topic的的parition的leader是無效的, 則removePartitionInfo(tp.topic, tp.partition);
  3. 新增或更新某個topic的某個parition的信息, addOrUpdatePartitionInfo(tp.topic, tp.partition, info): 將信息meta信息保存到MetadataCachecache對象中;
Metadata信息從哪里來
  • 這個問題實際上就是在問UpdateMetaRequest什么時候發(fā)送的;
  • 來源肯定是KafkaController發(fā)送的;
  • broker變動, topic創(chuàng)建, partition增加等等時機都需要更新metadata;
誰使用metadata信息
  • 主要是客戶端, 客戶端從metadata中獲取topic的partition信息, 知道leader是誰, 才可以發(fā)送和消費msg;
  • KafkaApis對象處理MetadataRequest
case RequestKeys.MetadataKey => handleTopicMetadataRequest(request)
  • KafkaApis.handleTopicMetadataRequest:
    val metadataRequest = request.requestObj.asInstanceOf[TopicMetadataRequest]

    //if topics is empty -> fetch all topics metadata but filter out the topic response that are not authorized
    val topics = if (metadataRequest.topics.isEmpty) {
      val topicResponses = metadataCache.getTopicMetadata(metadataRequest.topics.toSet, request.securityProtocol)
      topicResponses.map(_.topic).filter(topic => authorize(request.session, Describe, new Resource(Topic, topic))).toSet
    } else {
      metadataRequest.topics.toSet
    }

    //when topics is empty this will be a duplicate authorization check but given this should just be a cache lookup, it should not matter.
    var (authorizedTopics, unauthorizedTopics) = topics.partition(topic => authorize(request.session, Describe, new Resource(Topic, topic)))

    if (!authorizedTopics.isEmpty) {
      val topicResponses = metadataCache.getTopicMetadata(authorizedTopics, request.securityProtocol)
      if (config.autoCreateTopicsEnable && topicResponses.size != authorizedTopics.size) {
        val nonExistentTopics: Set[String] = topics -- topicResponses.map(_.topic).toSet
        authorizer.foreach {
          az => if (!az.authorize(request.session, Create, Resource.ClusterResource)) {
            authorizedTopics --= nonExistentTopics
            unauthorizedTopics ++= nonExistentTopics
          }
        }
      }
    }

    val unauthorizedTopicMetaData = unauthorizedTopics.map(topic => new TopicMetadata(topic, Seq.empty[PartitionMetadata], ErrorMapping.TopicAuthorizationCode))

    val topicMetadata = if (authorizedTopics.isEmpty) Seq.empty[TopicMetadata] else getTopicMetadata(authorizedTopics, request.securityProtocol)
    val brokers = metadataCache.getAliveBrokers
    val response = new TopicMetadataResponse(brokers.map(_.getBrokerEndPoint(request.securityProtocol)), topicMetadata  ++ unauthorizedTopicMetaData, metadataRequest.correlationId)
    requestChannel.sendResponse(new RequestChannel.Response(request, new RequestOrResponseSend(request.connectionId, response)))

看著代碼不少, 實際上比較簡單:

  1. 先確定需要獲取哪些topic的metadata信息, 如果request里未指定topic, 則獲取當(dāng)前所有的topic的metadata信息;
  2. 有效性驗證,將topic分為authorizedTopicsunauthorizedTopics;
  3. 獲取authorizedTopics的metadata, 注意getTopicMetadata方法是關(guān)鍵所在, 它會先篩選出當(dāng)前不存在的topic, 如果auto.create.topics.enable=true, 則調(diào)用AdminUtils.createTopic先創(chuàng)建此topic, 但此時其PartitionStateInfo為空, 不過也會作為Metadata Response的一部分返回給客戶端.

Kafka源碼分析-匯總

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末镜盯,一起剝皮案震驚了整個濱河市勤晚,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌领虹,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,544評論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件求豫,死亡現(xiàn)場離奇詭異塌衰,居然都是意外死亡,警方通過查閱死者的電腦和手機蝠嘉,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,430評論 3 392
  • 文/潘曉璐 我一進(jìn)店門最疆,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人蚤告,你說我怎么就攤上這事努酸。” “怎么了杜恰?”我有些...
    開封第一講書人閱讀 162,764評論 0 353
  • 文/不壞的土叔 我叫張陵获诈,是天一觀的道長。 經(jīng)常有香客問我箫章,道長烙荷,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,193評論 1 292
  • 正文 為了忘掉前任檬寂,我火速辦了婚禮终抽,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘桶至。我一直安慰自己昼伴,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,216評論 6 388
  • 文/花漫 我一把揭開白布镣屹。 她就那樣靜靜地躺著圃郊,像睡著了一般。 火紅的嫁衣襯著肌膚如雪女蜈。 梳的紋絲不亂的頭發(fā)上持舆,一...
    開封第一講書人閱讀 51,182評論 1 299
  • 那天色瘩,我揣著相機與錄音,去河邊找鬼逸寓。 笑死居兆,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的竹伸。 我是一名探鬼主播泥栖,決...
    沈念sama閱讀 40,063評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼勋篓!你這毒婦竟也來了吧享?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,917評論 0 274
  • 序言:老撾萬榮一對情侶失蹤譬嚣,失蹤者是張志新(化名)和其女友劉穎钢颂,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體孤荣,經(jīng)...
    沈念sama閱讀 45,329評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡甸陌,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,543評論 2 332
  • 正文 我和宋清朗相戀三年须揣,在試婚紗的時候發(fā)現(xiàn)自己被綠了盐股。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,722評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡耻卡,死狀恐怖疯汁,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情卵酪,我是刑警寧澤幌蚊,帶...
    沈念sama閱讀 35,425評論 5 343
  • 正文 年R本政府宣布,位于F島的核電站溃卡,受9級特大地震影響溢豆,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜瘸羡,卻給世界環(huán)境...
    茶點故事閱讀 41,019評論 3 326
  • 文/蒙蒙 一漩仙、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧犹赖,春花似錦队他、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,671評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至粘昨,卻和暖如春垢啼,著一層夾襖步出監(jiān)牢的瞬間窜锯,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,825評論 1 269
  • 我被黑心中介騙來泰國打工芭析, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留衬浑,地道東北人。 一個月前我還...
    沈念sama閱讀 47,729評論 2 368
  • 正文 我出身青樓放刨,卻偏偏與公主長得像工秩,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子进统,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,614評論 2 353

推薦閱讀更多精彩內(nèi)容