谷歌推出的Bert尾序,最近有多火,估計(jì)做自然語(yǔ)言處理的都知道。據(jù)稱在SQuAD等11項(xiàng)任務(wù)當(dāng)中達(dá)到了state of the art。bert的原理可參考論文,或者網(wǎng)上其他人翻...
谷歌推出的Bert尾序,最近有多火,估計(jì)做自然語(yǔ)言處理的都知道。據(jù)稱在SQuAD等11項(xiàng)任務(wù)當(dāng)中達(dá)到了state of the art。bert的原理可參考論文,或者網(wǎng)上其他人翻...
如果使用基于最大似然估計(jì)的模型,模型中存在隱變量笨蚁,就要用EM算法做參數(shù)估計(jì)睹晒。個(gè)人認(rèn)為,理解EM算法背后的idea括细,遠(yuǎn)比看懂它的數(shù)學(xué)推導(dǎo)重要伪很。idea會(huì)讓你有一個(gè)直觀的感受,從...
前言 學(xué)習(xí)pytorch已經(jīng)一周了奋单,pytorch官網(wǎng)的示例代碼基本上都敲了一遍锉试,關(guān)于tensor的使用,數(shù)據(jù)集览濒,網(wǎng)絡(luò)定義等呆盖。和之前學(xué)習(xí)caffe痛苦的經(jīng)歷相比,pytorc...
最近在學(xué)習(xí)pytorch,在學(xué)過了linear分類以后嘗試入門cnn昨忆,但是網(wǎng)上的教程基本都是使用別人標(biāo)注好的手寫數(shù)據(jù)集。于是我看了下讀入圖片的數(shù)據(jù)格式杉允,發(fā)現(xiàn)是一個(gè)n*1*si...
最大熵模型屬于運(yùn)用最大熵原理的多分類模型邑贴,這個(gè)模型在面試中經(jīng)常會(huì)與邏輯回歸一起問,比如叔磷,為什么說二者是類似的拢驾?要解答這個(gè)問題,需要對(duì)兩個(gè)模型的原理都有清晰的理解改基,很多面試者雖...
生成模型和判別模型是機(jī)器學(xué)習(xí)中兩類基本的模型繁疤,在機(jī)器學(xué)習(xí)面試中,經(jīng)常會(huì)被問到秕狰。能否清晰簡(jiǎn)明地說明二者的不同稠腊,直接影響到面試官對(duì)求職者基礎(chǔ)知識(shí)掌握程度的判斷。本文試圖給出一個(gè)回...