240 發(fā)簡信
IP屬地:四川
  • Resize,w 360,h 240
    Spark LDA主題模型百萬文本數(shù)據(jù)訓練

    前言 LDA是文本挖掘中最常用的主題模型之一,其可以理解為一篇文章有N個主題闻妓,每個主題有N個高頻詞匯菌羽,也可以理解為主題是一個bucket,里面裝...

  • Resize,w 360,h 240
    Spark 大規(guī)模數(shù)據(jù)下基于物品協(xié)同過濾推薦

    前言 基于物品的個性化協(xié)同過濾推薦由缆,即ItemCF 注祖,說白了就是根據(jù)你喜歡的物品給你推薦相似的物品猾蒂。不過作為推薦召回算法中的一種,也是重要的是晨,該...

  • SparkStreaming WordCount 文本分詞統(tǒng)計之NioSocketServer

    SparkStreaming是基于spark的流計算框架肚菠,其可以實現(xiàn)高吞吐量的,具備容錯機制的實時流數(shù)據(jù)處理罩缴。 Spark Streaming將...

個人介紹
專注大數(shù)據(jù)處理蚊逢,流計算,圖計算箫章,機器學習技術(shù)烙荷,對知識圖譜,問答系統(tǒng)檬寂,推薦系統(tǒng)等領(lǐng)域比較感興趣终抽。
亚洲A日韩AV无卡,小受高潮白浆痉挛av免费观看,成人AV无码久久久久不卡网站,国产AV日韩精品