數(shù)據(jù)小新手

發(fā)簡(jiǎn)信

數(shù)據(jù)小新手

5
關(guān)注
25
粉絲
67
文章
40756

字?jǐn)?shù)
38

收獲喜歡
4

總資產(chǎn)

IP屬地：上海

LiBiscuit

Margin Disparity Discrepancy(MDD)
一下子就二月了~時(shí)間真的好快進(jìn)度條被迅速拉近~也快過年了贿条。我現(xiàn)在雖然有一些粉絲贊也不少但我不知道真正還有在看的有多少人因?yàn)樽罱龅揭恍┦虑?所以想說一下我的本意就是...

5432 2 6
LiBiscuit

論文閱讀：MirrorGAN
六月啦~小李又上線啦！夏天到了真的悶熱（不想動(dòng)的借口）哈哈今天更新的還是論文閱讀。（可以發(fā)現(xiàn)我最近的更新都是文本到圖片的生成感覺再多看一些都可以寫個(gè)這方面的綜述了--...

824 0 5
最A(yù)I的小PAI

對(duì)話生成模型的原理及優(yōu)化
更多干貨內(nèi)容敬請(qǐng)關(guān)注「平安壽險(xiǎn)PAI」（公眾號(hào)ID：PAL-AI）跪妥，文末有本期分享內(nèi)容資料獲取方式。人機(jī)對(duì)話作為人機(jī)交互系統(tǒng)的核心功能之一，發(fā)揮著十分重要的作用。目前山孔，生成...

1858 0 2
數(shù)據(jù)小新手

無監(jiān)督第四節(jié)：LDA（線性判別分析）及其和PCA的關(guān)系
LDA的全稱是Linear Discriminant Analysis（線性判別分析），是一種supervised learning荷憋。因?yàn)槭怯蒄isher在1936年提出的台颠，...

2051 0 3
數(shù)據(jù)小新手

無監(jiān)督第四節(jié)：LDA (Latent Dirichlet Allocation快速理解)（主題模型）
1. 簡(jiǎn)介 LDA 是一種基于概率的生成式模型，所以在LDA的過程中會(huì)涉及到很多概率的知識(shí)勒庄，不太熟悉的話建議先學(xué)習(xí)概率知識(shí)串前。LDA在NLP中應(yīng)用廣泛，主要是用于主題模型(to...

2259 0 2
數(shù)據(jù)小新手

無監(jiān)督第五節(jié)：LDA (Latent Dirichlet Allocation算法細(xì)節(jié))（主題模型）
1.算法實(shí)現(xiàn) LDA是生成式概率模型锅铅±疑耄基本的觀點(diǎn)是一個(gè)文檔由多個(gè)隱主題生成，每個(gè)主題是由單詞的分布式表達(dá)盐须。 LDA假設(shè)在語料庫(kù)D中每個(gè)文檔的生成過程如下：選擇 N ～ Po...

697 0 2
數(shù)據(jù)小新手

無監(jiān)督第六節(jié)：LDA和其他隱變量模型的關(guān)系
1.unigram model 在unigram 模型中，每個(gè)文檔中的單詞從單一的多項(xiàng)式分布中獨(dú)立生成漆腌。 2.mixture of unigrams: 將unigram mo...

200 0 1
數(shù)據(jù)小新手

NLP 中subword編碼方式總結(jié)
NLP subword: 1.傳統(tǒng)方法空格token 傳統(tǒng)詞表示方法無法很好的處理未知或罕見的詞匯（OOV問題）傳統(tǒng)詞tokenization方法不利于模型學(xué)習(xí)詞綴之間的...

1197 0 1
施孫甲由

神經(jīng)網(wǎng)絡(luò)語言建模系列之六：字符級(jí)模型
語言建模一直均以分詞為最小單位贼邓，即詞級(jí)語言模型。后來研究者嘗試在字符級(jí)別進(jìn)行語言建模闷尿，提出了數(shù)種字符級(jí)的語言模型塑径，其中最為成功是Y. Kim and et. al. (201...

4342 12 75