2016-05-14:資料+PRML

收藏強(qiáng)迫癥

這個(gè)就是資料~

1. 教學(xué)算法github

https://github.com/nryoung/algorithms

2. 中文awesome-python

https://github.com/jobbole/awesome-python-cn

3. 中文awesome-machine-learning

https://github.com/jobbole/awesome-machine-learning-cn

4. 基于tensorflow的詞向量模型

https://github.com/GradySimon/tensorflow-glove

5. 中文的tensorFow教程

http://my.oschina.net/yilian/blog/664632?fromerr=PHHDnjdO

6. word2vec的python接口

https://github.com/danielfrg/word2vec
http://nbviewer.jupyter.org/github/danielfrg/word2vec/blob/master/examples/word2vec.ipynb


PRML隨手記

以后會(huì)好好整理滴~~~

  • 正確分類與訓(xùn)練集不同的新樣本的能力叫做泛化(generalization)
  • 原始輸入向量通常被預(yù)處理(pre-processed),變換到新的變量空間
  • 這個(gè)預(yù)處理階段有時(shí)被叫做特征抽妊ⅰ(feature extraction)
  • 訓(xùn)練數(shù)據(jù)的樣本包含輸?向量以及對(duì)應(yīng)的目標(biāo)向量的應(yīng)用叫做有監(jiān)督學(xué)習(xí)(supervised learning)問(wèn)題
  • 訓(xùn)練數(shù)據(jù)由一組輸入向量x組成色难,沒(méi)有任何對(duì)應(yīng)的目標(biāo)值祸挪。無(wú)監(jiān)督學(xué)習(xí)(unsupervised learning)
  • 無(wú)監(jiān)督學(xué)習(xí)中,發(fā)現(xiàn)數(shù)據(jù)中相似樣本的分組缘眶,這被稱為聚類(clustering)
  • 發(fā)現(xiàn)數(shù)據(jù)中輸入空間中數(shù)據(jù)的分布,這被稱為密度估計(jì)(density estimation)
  • 反饋學(xué)習(xí)(reinforcement learning)技術(shù)關(guān)注的問(wèn)題是在給定的條件下,找到合適的動(dòng)作面殖,使得獎(jiǎng)勵(lì)達(dá)到最大值
  • 符合高斯分布的隨機(jī)噪聲


    其中M是多項(xiàng)式的階數(shù)(order),xj 表示x的j次冪哭廉。多項(xiàng)式系數(shù)w0... wM 整體記作向量w
  • 注意脊僚,雖然多項(xiàng)式函數(shù)y(x,w)是x的一個(gè)非線性函數(shù)遵绰,它是系數(shù)w的一個(gè)線性函數(shù)吃挑。
    函數(shù)的這種關(guān)于未知參數(shù)滿足線性關(guān)系的函數(shù)有著重要的性質(zhì),被叫做線性模型


    誤差函數(shù)(error function)

    最小化誤差函數(shù)(error function)的方法實(shí)現(xiàn)實(shí)現(xiàn)參數(shù)訓(xùn)練


    根均根(RMS)誤差

    根均根(RMS)誤差:除以N讓我們能夠以相同的基礎(chǔ)對(duì)比不同大小的數(shù)據(jù)集街立,平方根確保了ERMS 與目標(biāo)變量t使用相同的規(guī)模和單位進(jìn)行度量
  • 經(jīng)常用來(lái)控制過(guò)擬合現(xiàn)象的一種技術(shù)是正則化(regularization)舶衬。這種技術(shù)涉及到給誤差函數(shù)增加一個(gè)懲罰項(xiàng),使得系數(shù)不會(huì)達(dá)到很大的值赎离。這種懲罰項(xiàng)最簡(jiǎn)單的形式采用所有系數(shù)的平方和的形式逛犹。
  • 通常系數(shù)w0 從正則化項(xiàng)中省略,因?yàn)榘瑆0 會(huì)使得結(jié)果依賴于目標(biāo)變量原點(diǎn)的選擇
  • 在統(tǒng)計(jì)學(xué)中被叫做收縮(shrinkage)方法
  • 二次正則項(xiàng)的一個(gè)特殊情況被稱為山脊回歸(ridge regression)
  • 神經(jīng)網(wǎng)絡(luò)的情形中梁剔,這種方法被叫做權(quán)值衰減(weight decay)
隨著?的λ增大虽画,系數(shù)的大小變化
  • 隨著?的λ增大,系數(shù)的大小逐漸變小荣病。


    隨著?的λ增大码撰,RMS變化
  • 概率論的兩個(gè)基本規(guī)則:加和規(guī)則(sum rule)、乘積規(guī)則(product rule)
  • X取值xi 且Y 取值yj 的概率被記作p(X = xi; Y = yj)个盆,被稱為X = xi 和Y = yj 的聯(lián)合概率(joint probability)
  • 注意脖岛,p(X = xi)有時(shí)被稱為邊緣概率(marginal probability),因?yàn)樗ㄟ^(guò)把其他變量(本例中的Y )邊緣化或者加和得到
  • 如果我們只考慮那些X = xi的實(shí)例颊亮,那么這些實(shí)例中Y = yj 的實(shí)例所占的比例被寫(xiě)p(Y = yj j X = xi)柴梆,被稱為給定X = xi 的Y = yj 的條件概率conditional probability)


    加法準(zhǔn)則和乘法準(zhǔn)則

    由乘法規(guī)則可以得到貝葉斯定理(Bayes' theorem)

    分母用加法準(zhǔn)則表示
  • 可以把貝葉斯定理的分母看做歸一化常數(shù),用來(lái)確保貝葉斯公式左側(cè)的條件概率對(duì)于所有的Y 的取值之和為1
  • 對(duì)于離散的數(shù)值來(lái)說(shuō)终惑,是概率
  • 對(duì)于連續(xù)的數(shù)值來(lái)說(shuō)绍在,是概率密度(probability density)


    概率密度(probability density)

    位于區(qū)間( -無(wú)窮 , z)的x的概率是累積分布函數(shù)(cumulative distribution function)
  • 到概率的一個(gè)重要的操作是尋找函數(shù)的加權(quán)平均值。在概率分布p(x)下偿渡,函數(shù)f(x)的平均值被稱為f(x)的期望(expectation)臼寄,記作E [f]。


    離散變量的期望

    連續(xù)變量的期望

    條件分布的條件期望(conditional expectation)

    f(x)的方差(variance)
  • 它度量了f(x)在均值E [f(x)]附近變化性的大小溜宽。


    兩個(gè)隨機(jī)變量x和y脯厨,協(xié)方差(covariance)
  • 它表示在多大程度上x(chóng)和y會(huì)共同變化。如果x和y相互獨(dú)立坑质,那么它們的協(xié)方差為0
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末合武,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子涡扼,更是在濱河造成了極大的恐慌稼跳,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,544評(píng)論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件吃沪,死亡現(xiàn)場(chǎng)離奇詭異汤善,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)票彪,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,430評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門(mén)红淡,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人降铸,你說(shuō)我怎么就攤上這事在旱。” “怎么了推掸?”我有些...
    開(kāi)封第一講書(shū)人閱讀 162,764評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵桶蝎,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我谅畅,道長(zhǎng)登渣,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,193評(píng)論 1 292
  • 正文 為了忘掉前任毡泻,我火速辦了婚禮胜茧,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘仇味。我一直安慰自己呻顽,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,216評(píng)論 6 388
  • 文/花漫 我一把揭開(kāi)白布邪铲。 她就那樣靜靜地躺著芬位,像睡著了一般无拗。 火紅的嫁衣襯著肌膚如雪带到。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 51,182評(píng)論 1 299
  • 那天,我揣著相機(jī)與錄音揽惹,去河邊找鬼被饿。 笑死,一個(gè)胖子當(dāng)著我的面吹牛搪搏,可吹牛的內(nèi)容都是我干的狭握。 我是一名探鬼主播,決...
    沈念sama閱讀 40,063評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼疯溺,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼论颅!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起囱嫩,我...
    開(kāi)封第一講書(shū)人閱讀 38,917評(píng)論 0 274
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤恃疯,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后墨闲,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體今妄,經(jīng)...
    沈念sama閱讀 45,329評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,543評(píng)論 2 332
  • 正文 我和宋清朗相戀三年鸳碧,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了盾鳞。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,722評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡瞻离,死狀恐怖腾仅,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情套利,我是刑警寧澤攒砖,帶...
    沈念sama閱讀 35,425評(píng)論 5 343
  • 正文 年R本政府宣布,位于F島的核電站日裙,受9級(jí)特大地震影響吹艇,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜昂拂,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,019評(píng)論 3 326
  • 文/蒙蒙 一受神、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧格侯,春花似錦鼻听、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,671評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至朝墩,卻和暖如春醉拓,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,825評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工亿卤, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留愤兵,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,729評(píng)論 2 368
  • 正文 我出身青樓排吴,卻偏偏與公主長(zhǎng)得像秆乳,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子钻哩,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,614評(píng)論 2 353

推薦閱讀更多精彩內(nèi)容

  • 【概述】 SVM訓(xùn)練分類器的方法是尋找到超平面屹堰,使正負(fù)樣本在超平面的兩側(cè)(分類正確性即“分得開(kāi)”),且樣本到超平面...
    sealaes閱讀 11,072評(píng)論 0 7
  • 以西瓜書(shū)為主線街氢,以其他書(shū)籍作為參考進(jìn)行補(bǔ)充双藕,例如《統(tǒng)計(jì)學(xué)習(xí)方法》,《PRML》等 第一章 緒論 1.2 基本術(shù)語(yǔ) ...
    danielAck閱讀 4,515評(píng)論 0 6
  • 原文章為scikit-learn中"用戶指南"-->"監(jiān)督學(xué)習(xí)的第四節(jié):Support Vector Machin...
    HabileBadger閱讀 2,846評(píng)論 0 11
  • 記得這個(gè)地方阳仔,是我與她常來(lái)的地方∮桥悖現(xiàn)在什么都沒(méi)有了,農(nóng)忙時(shí)近范,有點(diǎn)熱鬧嘶摊,平常一片荒涼。沒(méi)有她评矩,哪有生命的意義叶堆。附詞兩...
    黃土不多百年太久閱讀 206評(píng)論 0 0
  • 問(wèn):面對(duì)新單位虱颗、新同事、新工作蔗喂,如何克服緊張情緒忘渔? 答:這是一個(gè)短期的問(wèn)題,時(shí)間長(zhǎng)了自然就好了缰儿。有些問(wèn)題隨著時(shí)間的...
    王肖杰閱讀 631評(píng)論 0 7