240 發(fā)簡信
IP屬地:四川
  • 120
    Spark LDA主題模型百萬文本數(shù)據(jù)訓(xùn)練

    前言 LDA是文本挖掘中最常用的主題模型之一硫嘶,其可以理解為一篇文章有N個(gè)主題,每個(gè)主題有N個(gè)高頻詞匯梧税,也可以理解為主題是一個(gè)bucket沦疾,里面裝入一堆頻率較高的詞。本文根據(jù)搜...

  • 120
    Spark 大規(guī)模數(shù)據(jù)下基于物品協(xié)同過濾推薦

    前言 基于物品的個(gè)性化協(xié)同過濾推薦第队,即ItemCF 哮塞,說白了就是根據(jù)你喜歡的物品給你推薦相似的物品。不過作為推薦召回算法中的一種凳谦,也是重要的忆畅,該算法比較適合物品較少的場景,能...

  • 不知不覺中尸执,已經(jīng)寫了4萬字

    從2020年年初開始家凯,就給自己定了一個(gè)目標(biāo),簡書目標(biāo)今年10萬字如失,現(xiàn)在復(fù)盤肆饶,已經(jīng)寫了4萬還差六萬。 幾乎是一個(gè)月更一萬岖常。從最開始的無從下筆驯镊,到如今,每天一千字已經(jīng)不費(fèi)力竭鞍,我想...

  • SparkStreaming WordCount 文本分詞統(tǒng)計(jì)之NioSocketServer

    SparkStreaming是基于spark的流計(jì)算框架板惑,其可以實(shí)現(xiàn)高吞吐量的,具備容錯(cuò)機(jī)制的實(shí)時(shí)流數(shù)據(jù)處理偎快。 Spark Streaming將接收到的實(shí)時(shí)流數(shù)據(jù)冯乘,按照一定時(shí)...

個(gè)人介紹
專注大數(shù)據(jù)處理,流計(jì)算贴妻,圖計(jì)算切油,機(jī)器學(xué)習(xí)技術(shù),對知識圖譜名惩,問答系統(tǒng)澎胡,推薦系統(tǒng)等領(lǐng)域比較感興趣。
亚洲A日韩AV无卡,小受高潮白浆痉挛av免费观看,成人AV无码久久久久不卡网站,国产AV日韩精品