谷歌推出的Bert繁成,最近有多火,估計做自然語言處理的都知道记焊。據(jù)稱在SQuAD等11項任務(wù)當(dāng)中達到了state of the art酣溃。bert的原理可參考論文瘦穆,或者網(wǎng)上其他人翻...
IP屬地:上海
谷歌推出的Bert繁成,最近有多火,估計做自然語言處理的都知道记焊。據(jù)稱在SQuAD等11項任務(wù)當(dāng)中達到了state of the art酣溃。bert的原理可參考論文瘦穆,或者網(wǎng)上其他人翻...
如果使用基于最大似然估計的模型赊豌,模型中存在隱變量扛或,就要用EM算法做參數(shù)估計。個人認為亿絮,理解EM算法背后的idea告喊,遠比看懂它的數(shù)學(xué)推導(dǎo)重要麸拄。idea會讓你有一個直觀的感受派昧,從...
前言 學(xué)習(xí)pytorch已經(jīng)一周了,pytorch官網(wǎng)的示例代碼基本上都敲了一遍拢切,關(guān)于tensor的使用蒂萎,數(shù)據(jù)集,網(wǎng)絡(luò)定義等淮椰。和之前學(xué)習(xí)caffe痛苦的經(jīng)歷相比五慈,pytorc...
最近在學(xué)習(xí)pytorch,在學(xué)過了linear分類以后嘗試入門cnn主穗,但是網(wǎng)上的教程基本都是使用別人標(biāo)注好的手寫數(shù)據(jù)集泻拦。于是我看了下讀入圖片的數(shù)據(jù)格式,發(fā)現(xiàn)是一個n*1*si...
最大熵模型屬于運用最大熵原理的多分類模型忽媒,這個模型在面試中經(jīng)常會與邏輯回歸一起問争拐,比如,為什么說二者是類似的晦雨?要解答這個問題架曹,需要對兩個模型的原理都有清晰的理解,很多面試者雖...
生成模型和判別模型是機器學(xué)習(xí)中兩類基本的模型闹瞧,在機器學(xué)習(xí)面試中绑雄,經(jīng)常會被問到。能否清晰簡明地說明二者的不同奥邮,直接影響到面試官對求職者基礎(chǔ)知識掌握程度的判斷万牺。本文試圖給出一個回...