LJ_cde0 - 簡書

發(fā)簡信

LJ_cde0

17
關(guān)注
1
粉絲
0
文章
0

字?jǐn)?shù)
0

收獲喜歡
1

總資產(chǎn)

IP屬地：四川

LJ_cde0

用人話講明白關(guān)鍵詞權(quán)重TF-IDF——數(shù)學(xué)之美讀書筆記3
好吧，又要開始bb叨模式了。這篇文章，我想把關(guān)鍵詞權(quán)重給描述清楚劫窒？大家想想這個(gè)場景，如果你在網(wǎng)上搜索“王健壕美的凈水器”，搜索引擎通過索引發(fā)現(xiàn)窍奋，一共有100篇網(wǎng)頁都含有這...

Bog5d
1716 1 9
LJ_cde0

加勒比海鮮王
寫了 30183 字，被 95 人關(guān)注酱畅，獲得了 115 個(gè)喜歡

未來是由很多個(gè)現(xiàn)在組成的琳袄。<br>深度學(xué)習(xí)探索者<br><a href="http://blog.csdn.net/yinruiyang94/" rel="nofollow" target="_blank">http://blog.csdn.net/yinruiyang94/</a><br>歡迎交流

LJ_cde0

數(shù)學(xué)之美--信息的度量和作用--信息熵，條件熵和交叉熵
保留初心纺酸，砥礪前行這一章節(jié)講解的是關(guān)于信息的某些度量窖逗。我們常常說信息很多，或者信息較少餐蔬，但卻很難說清楚信息到底有多少碎紊。......直到1948年，Shannon在他著名的...

加勒比海鮮王
1265 2 15
LJ_cde0

基于互信息和左右熵的新詞發(fā)現(xiàn)算法——python實(shí)現(xiàn)
今天筆者來介紹一下新詞發(fā)現(xiàn)算法樊诺，顧名思義矮慕，新詞發(fā)現(xiàn)算法餓的目的就是幫助我們發(fā)現(xiàn)新詞。我們?nèi)绻捎矛F(xiàn)在的分詞技術(shù)啄骇，有時(shí)候一下生僻詞或者專有詞匯經(jīng)常會(huì)被分錯(cuò)痴鳄，而改進(jìn)措施就是可以用...

王同學(xué)死磕技術(shù)
7756 2 13
LJ_cde0

關(guān)鍵詞提取
提到從文本中提取關(guān)鍵詞，我們第一想到的肯定是通過計(jì)算詞語的 TF-IDF 值來完成缸夹，簡單又粗暴痪寻。但是由于 TF-IDF 的結(jié)構(gòu)過于簡單，有時(shí)提取關(guān)鍵詞的效果會(huì)很不理想虽惭。本文將...

Shira0905
739 0 2
LJ_cde0

歌當(dāng)對酒
寫了 43188 字橡类，被 45 人關(guān)注，獲得了 103 個(gè)喜歡

產(chǎn)品設(shè)計(jì)師
LJ_cde0

SpareNoEfforts
寫了 122855 字芽唇，被 314 人關(guān)注顾画，獲得了 363 個(gè)喜歡

LJ_cde0

x00c
寫了 15388 字取劫，被 24 人關(guān)注，獲得了 33 個(gè)喜歡
LJ_cde0

自然語言處理中的N-Gram模型詳解
N-Gram（有時(shí)也稱為N元模型）是自然語言處理中一個(gè)非常重要的概念研侣，通常在NLP中谱邪，人們基于一定的語料庫，可以利用N-Gram來預(yù)計(jì)或者評(píng)估一個(gè)句子是否合理庶诡。另外一方面惦银，N...

x00c
38767 4 16
LJ_cde0

歲月淡如水
寫了 7159 字，被 9 人關(guān)注末誓，獲得了 28 個(gè)喜歡
LJ_cde0

文本關(guān)鍵詞提取算法-TextRank
TextRank是一種用來做關(guān)鍵詞提取的算法扯俱，也可以用于提取短語和自動(dòng)摘要。因?yàn)門extRank是基于PageRank的喇澡，所以首先簡要介紹下PageRank算法迅栅。 1.Pag...

歲月淡如水
5649 0 3
LJ_cde0

利炳根
寫了 188624 字，被 1613 人關(guān)注晴玖，獲得了 701 個(gè)喜歡

寫代碼读存、學(xué)日語，不做任何付費(fèi)咨詢

LJ_cde0

學(xué)習(xí)筆記CB007:分詞窜醉、命名實(shí)體識(shí)別、詞性標(biāo)注艺谆、句法分析樹
中文分詞把文本切分成詞語榨惰，還可以反過來，把該拼一起的詞再拼到一起静汤，找到命名實(shí)體琅催。概率圖模型條件隨機(jī)場適用觀測值條件下決定隨機(jī)變量有有限個(gè)取值情況。給定觀察序列X虫给，某個(gè)特定標(biāo)...

利炳根
1934 0 3
LJ_cde0

NLP基本功-文本相似度 | AI產(chǎn)品經(jīng)理需要了解的AI技術(shù)通識(shí)
Insight的第3篇分享文章藤抡，用產(chǎn)品經(jīng)理看得懂的語言來介紹“文本相似度”，詳見我公眾號(hào)發(fā)布的鏈接《NLP基本功-文本相似度 | AI產(chǎn)品經(jīng)理需要了解的AI技術(shù)通識(shí)》

黃釗hanniman
395 0 1
LJ_cde0

第11章如何確定網(wǎng)頁和查詢的相關(guān)性
以下內(nèi)容學(xué)習(xí)抹估、摘錄自《數(shù)學(xué)之美》 2007年作者為Google黑板報(bào)寫本章節(jié)時(shí)缠黍，技術(shù)和算法的重要性依然高于數(shù)據(jù)，因此確定網(wǎng)頁和查詢的相關(guān)性主要依靠算法药蜻。但是今天瓷式，由于商業(yè)搜索...

whybask
975 0 2
LJ_cde0

whybask
寫了 466180 字，被 147 人關(guān)注语泽，獲得了 300 個(gè)喜歡

今天的記錄贸典，有助于改變明天的我。
LJ_cde0

cb9841112785
寫了 0 字踱卵，被 15885 人關(guān)注廊驼，獲得了 1951 個(gè)喜歡