風(fēng)馳電掣一瓜牛

發(fā)簡信

風(fēng)馳電掣一瓜牛

0
關(guān)注
51
粉絲
22
文章
11701

字?jǐn)?shù)
58

收獲喜歡
2

總資產(chǎn)

IP屬地：廣東

風(fēng)馳電掣一瓜牛

本身就是批量提取，你看用訓(xùn)練模型預(yù)測的命令行，輸入文件可以是多篇文章狸捕，每一行對應(yīng)一篇文章的json數(shù)據(jù)

關(guān)鍵詞抽取工具包THUTag安裝與使用
安裝安裝環(huán)境為64位Linux系統(tǒng) 從github下載 THUTag 從官網(wǎng)下載 java8 解壓 jre-8u131-linux-x64.tar.gz，將 jre1.8....

風(fēng)馳電掣一瓜牛
1395 4 0
風(fēng)馳電掣一瓜牛

搭配詞抽取
參考：《Foundations of Statistical Natural Language Processing》第5章實(shí)現(xiàn)了兩種方法：互信息和卡方測試凤价，直觀上看卡方...

846 0 0

風(fēng)馳電掣一瓜牛

@喵_喵喵語言模型就是用來計(jì)算一個(gè)句子的概率的便斥，具體應(yīng)用可以看看機(jī)器翻譯或者語音識(shí)別国夜，比如在機(jī)器翻譯中米愿，翻譯句子的概率 = 語言模型概率 * 翻譯模型概率

TensorFlow 語言模型訓(xùn)練實(shí)戰(zhàn)
實(shí)驗(yàn)1：PTB數(shù)據(jù)集實(shí)驗(yàn) 教程: https://www.tensorflow.org/versions/r0.12/tutorials/recurrent/ 數(shù)據(jù)地址： h...

風(fēng)馳電掣一瓜牛
5625 2 5
風(fēng)馳電掣一瓜牛

深度學(xué)習(xí)經(jīng)典模型
先挖坑厦凤，后面填。 CNN 參考： CS231n Convolutional Neural Networks for Visual Recognition 基于tensorfl...

709 0 0
風(fēng)馳電掣一瓜牛

語義相似計(jì)算資料
文章 Sentence Embedding 干貨 | NIPS 2015 Deep Learning Symposium(二）干貨 | NIPS 2015 Deep Lea...

1769 0 5
風(fēng)馳電掣一瓜牛

中文編碼json數(shù)據(jù)操作（by Python）
現(xiàn)在有一個(gè)問題：通過json.loads()函數(shù)讀取的數(shù)據(jù)是unicode的育苟，后續(xù)沒法處理较鼓。解決方法：通過json.loads函數(shù)中的object_hook參數(shù)指定解析方式...

496 0 0
風(fēng)馳電掣一瓜牛

CentOS下gcc4.9編譯安裝教程
安裝安裝環(huán)境： CentOS 64位系統(tǒng) 首先下載gcc安裝包： gcc-4.9.2.tar.bz2 如上解壓之后，執(zhí)行./contrib/download_prerequ...

1772 0 0

風(fēng)馳電掣一瓜牛

語言模型-計(jì)算句子概率
相關(guān)軟件包： mitlm arpa mitlm只能訓(xùn)練語言模型，沒有計(jì)算句子概率的函數(shù)博烂，需要自己編寫香椎。但是mitlm可以輸出arpa格式的語言模型文件，通過python包a...

4693 0 3
風(fēng)馳電掣一瓜牛

DSSM: 深層結(jié)構(gòu)語義模型
參考用于Sentence Embedding的DSSM與LSTM：管中窺豹學(xué)習(xí)記錄一下深度語義匹配模型-DSSM Model DSSM on Tensorflow 代碼:...

10003 0 3
風(fēng)馳電掣一瓜牛

java編碼的一個(gè)小坑
問題是這樣的：當(dāng)一行一行讀取中文文件時(shí)禽篱，調(diào)用println輸出的是亂碼畜伐，將InputStreamReader設(shè)置為正確的編碼還是不行代碼如下：網(wǎng)上搜了老半天，終于找到原...

467 0 0
風(fēng)馳電掣一瓜牛

python日志模塊
目前有一種需求是啟動(dòng)一個(gè)server谆级，記錄每天的訪問情況烤礁，查下了下資料讼积，用python的logging模塊可以實(shí)現(xiàn)肥照。具體來說是使用TimedRotatingFileHand...

879 0 0
風(fēng)馳電掣一瓜牛

TensorFlow訓(xùn)練詞向量
參考： https://www.tensorflow.org/tutorials/word2vec 官網(wǎng)的這個(gè)教程主要講word2vec的skip-gram模型，沒有講CBO...

10952 0 8

風(fēng)馳電掣一瓜牛

詞向量原理
了解詞向量要從語言模型說起勤众，語言模型其實(shí)就是計(jì)算任意一個(gè)句子的概率舆绎。經(jīng)典的語言模型是n-gram模型，該模型假設(shè)每個(gè)詞的生成僅僅依賴前面n個(gè)詞们颜，所以從大規(guī)模語料中統(tǒng)計(jì)每個(gè)詞...

2963 0 2
風(fēng)馳電掣一瓜牛

TensorFlow基礎(chǔ)：共享變量
參考： https://www.tensorflow.org/programmers_guide/variable_scope 舉例說明 TensorFlow中的變量一般就是...

17000 0 15
風(fēng)馳電掣一瓜牛

孿生LSTM模型計(jì)算短語和句子相似性
孿生LSTM(Siamese LSTM)模型可以很容易來表征兩個(gè)短語或者兩個(gè)句子的相似性吕朵，輸入數(shù)據(jù)是相似或不相似的短語對或句子對，輸出是兩個(gè)詞語的相似性窥突，對應(yīng)的隱層可以視為詞...

3773 0 5
風(fēng)馳電掣一瓜牛

TensorFlow 安裝小記
安裝系統(tǒng)： Ubuntu 17.04 按照官網(wǎng) 教程努溃，有4種方法： virtualenv "native" pip Docker Anaconda 這里選擇virtunale...

454 0 0
風(fēng)馳電掣一瓜牛

基于gensim計(jì)算文檔相似性
gensim 官網(wǎng)： https://radimrehurek.com/gensim/tutorial.html 訓(xùn)練tfidf, lsi, lda, doc2vec等4種模...

794 1 2

風(fēng)馳電掣一瓜牛

TensorFlow seq2seq模型實(shí)戰(zhàn)
中法翻譯模型教程: https://www.tensorflow.org/versions/r0.12/tutorials/seq2seq/ 目標(biāo): 訓(xùn)練一個(gè)端到端的英語到...

13977 5 8