qianzhenyang - 簡書

發(fā)簡信

qianzhenyang

11
關(guān)注
3
粉絲
3
文章
996

字?jǐn)?shù)
0

收獲喜歡
0

總資產(chǎn)

IP屬地：四川

qianzhenyang

Spark LDA主題模型百萬文本數(shù)據(jù)訓(xùn)練
前言 LDA是文本挖掘中最常用的主題模型之一硫嘶，其可以理解為一篇文章有N個(gè)主題，每個(gè)主題有N個(gè)高頻詞匯梧税，也可以理解為主題是一個(gè)bucket沦疾，里面裝入一堆頻率較高的詞。本文根據(jù)搜...

907 1 0
qianzhenyang

Spark 大規(guī)模數(shù)據(jù)下基于物品協(xié)同過濾推薦
前言基于物品的個(gè)性化協(xié)同過濾推薦第队，即ItemCF 哮塞，說白了就是根據(jù)你喜歡的物品給你推薦相似的物品。不過作為推薦召回算法中的一種凳谦，也是重要的忆畅，該算法比較適合物品較少的場景，能...

493 0 0

qianzhenyang

不知不覺中尸执，已經(jīng)寫了4萬字
從2020年年初開始家凯，就給自己定了一個(gè)目標(biāo)，簡書目標(biāo)今年10萬字如失，現(xiàn)在復(fù)盤肆饶，已經(jīng)寫了4萬還差六萬。幾乎是一個(gè)月更一萬岖常。從最開始的無從下筆驯镊，到如今，每天一千字已經(jīng)不費(fèi)力竭鞍，我想...

畫眉?xì)?/a>
11729 105 674
qianzhenyang

SparkStreaming WordCount 文本分詞統(tǒng)計(jì)之NioSocketServer
SparkStreaming是基于spark的流計(jì)算框架板惑，其可以實(shí)現(xiàn)高吞吐量的，具備容錯(cuò)機(jī)制的實(shí)時(shí)流數(shù)據(jù)處理偎快。 Spark Streaming將接收到的實(shí)時(shí)流數(shù)據(jù)冯乘，按照一定時(shí)...

388 0 0
qianzhenyang

程序員
小彤花園編，97069 篇文章晒夹，1661895 人關(guān)注

如果你是程序員裆馒，或者有一顆喜歡寫程序的心姊氓，喜歡分享技術(shù)干貨、項(xiàng)目經(jīng)驗(yàn)喷好、程序員日常囧事等等翔横，歡迎投稿《程序員》專題。專題主編：小彤花園 http://www.reibang.com/users/4a4eb4feee62/ 【程序員】專題拒稿指北：http://www.reibang.com/p/7c8b33b5f63b 投稿須知： 1.收錄相關(guān)技術(shù)文章梗搅，但不限于技術(shù)禾唁，也可以是項(xiàng)目經(jīng)驗(yàn)類的文章和程序員日常。 2.文章內(nèi)不得有任何推廣信息无切。包括但不限于公眾號荡短、微博、微信哆键，更不得在通過投稿后再修改文章加入推廣信息掘托。你可以將這些推廣以及個(gè)人信息放在個(gè)人主頁介紹里。 3.字?jǐn)?shù)極少籍嘹，段落混亂烫映，大段代碼沒有放到代碼框的文章不收錄 4.不相關(guān)的內(nèi)容不收錄，請確認(rèn)文章內(nèi)容和本專題相關(guān) 目前針對優(yōu)質(zhì)作者及愛好者噩峦，開設(shè)了官方程序員微信群，希望加入請發(fā)簡信給主編小彤花園索取個(gè)人微信抽兆，主編會將你加入到【程序員】微信群识补，分享內(nèi)容，收獲知識辫红。添加微信時(shí)備注昵稱凭涂。
qianzhenyang