數(shù)學(xué)之美總結(jié)

1.信息度量

信息就是不確定性的多少,信息就是要減少不確定性奸忽;

熵: 信息的混雜程度堕伪,越大,信息越雜月杉,越不純刃跛;

條件熵: 一個信息確定的條件下抠艾,另外一個信息不確定度的減少量苛萎;

互信息: 在一個信息的條件下,為了是另外一個信息不確定度減少所需要提供的信息量检号;

相對熵: 衡量兩個函數(shù)值為正數(shù)的函數(shù)的相關(guān)性腌歉。


2.指紋信息

指紋: 每段信息包括文字,圖片齐苛,音頻翘盖,等都可以對應(yīng)一組不太長的隨機數(shù)

偽隨機數(shù):壓縮

基于加密的偽隨機數(shù):密碼

集合的判定,文章凹蜂,網(wǎng)頁的判定馍驯,視頻的判定

指紋可能重復(fù)阁危,但可能性很小

相似哈希:詞,權(quán)重汰瘫,指紋狂打,二進制的結(jié)合(提供了一種思路)


3.最大熵模型

最大熵原理: 保留全部的不確定性,讓風(fēng)險降到最谢烀帧趴乡;

最大熵模型: 在所有滿足約束條件的模型中選出熵最大的模型;

模型學(xué)習(xí): 任何一組不自相矛盾的信息蝗拿,最大熵模型存在并且唯一晾捏,都具有相同的形式,指數(shù)形式哀托;

特點: 能同時滿足成千上萬的中不同條件的模型(有效的組合很多特征)

參數(shù)訓(xùn)練: 對數(shù)似然函數(shù)求極大


4.期望最大

如果模型的變量都是觀測變量惦辛,用極大似然估計或貝葉斯估計

如果存在隱含變量,用EM迭代萤捆,最大后驗概率

典型:kmeans聚類裙品,隱馬的參數(shù)訓(xùn)練,最大熵模型的訓(xùn)練

特點: 局部最優(yōu)俗或,計算速度慢


5.散列表與布隆過濾器

散列表的核心:哈希函數(shù)hashcode(),equals()函數(shù)市怎;

散列表的特點:時間復(fù)雜度o(1),浪費空間,沖突辛慰;

布隆過濾器核心: 一組二進制數(shù)和隨機映射函數(shù)区匠;

布隆過濾器的特點: 時間復(fù)雜度o(1),節(jié)約空間帅腌,到存在錯誤率


6.文本分類

相似性: 余弦定理驰弄,距離

方法: k近鄰思想,自底向上的兩兩合并速客,EM迭代戚篙,奇異值分解;

技巧: 計算時存儲重復(fù)計算的變量溺职,只考慮非零元素岔擂,刪除虛詞

余弦定理和奇異分解:余弦定理多次迭代,計算量大浪耘,消耗資源多乱灵;svd無需多次迭代,時間短七冲,但存儲空間需求大痛倚,適合超大規(guī)模分類;建議svd粗分類澜躺,余弦定理細分類

TF-IDF解決兩個重要問題:詞的預(yù)測能力越強蝉稳,權(quán)重越大抒蚜;停止詞的權(quán)重為零


7.隱馬爾可夫

馬爾可夫假設(shè): t時刻的狀態(tài)只取決于t-1時刻

馬爾可夫鏈: 狀態(tài)鏈

隱馬模型: 初始概率分布,狀態(tài)轉(zhuǎn)移概率分布耘戚,觀測概率分布(馬爾可夫假設(shè)削锰,觀測獨立)

3個問題:

參數(shù)估計-baum-uelch算法

計算概率-直接,前向毕莱,后向算法

預(yù)測狀態(tài)-維特比算法(動態(tài)規(guī)劃)


8.貝葉斯網(wǎng)絡(luò)

是馬爾可夫鏈的推廣(鏈狀-拓撲)

又稱信念網(wǎng)絡(luò): 弧+可信度

訓(xùn)練: 結(jié)構(gòu)和參數(shù)訓(xùn)練器贩,交叉進行

方法: 貪心算法,蒙卡朋截,互信息


9.條件隨機場

特點:觀測值可能和前后的狀態(tài)都有關(guān)

條件隨機場是無向圖蛹稍,貝葉斯網(wǎng)絡(luò)是有向圖

核心:找到符合所有邊緣分布的最大熵模型


10.有限狀態(tài)機和動態(tài)規(guī)劃

有限狀態(tài)機: 開始,終止狀態(tài)部服,有向弧唆姐,條件

常見: ?建立狀態(tài)機,已知狀態(tài)機匹配字符串

區(qū)別: 基于概率的有限狀態(tài)機和離散馬爾可夫鏈等效

動態(tài)規(guī)劃: 把全程路徑最短鎖定到局部路徑最短

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末廓八,一起剝皮案震驚了整個濱河市奉芦,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌剧蹂,老刑警劉巖声功,帶你破解...
    沈念sama閱讀 210,914評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異宠叼,居然都是意外死亡先巴,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 89,935評論 2 383
  • 文/潘曉璐 我一進店門冒冬,熙熙樓的掌柜王于貴愁眉苦臉地迎上來伸蚯,“玉大人,你說我怎么就攤上這事简烤〖劣剩” “怎么了?”我有些...
    開封第一講書人閱讀 156,531評論 0 345
  • 文/不壞的土叔 我叫張陵横侦,是天一觀的道長挥萌。 經(jīng)常有香客問我,道長丈咐,這世上最難降的妖魔是什么瑞眼? 我笑而不...
    開封第一講書人閱讀 56,309評論 1 282
  • 正文 為了忘掉前任龙宏,我火速辦了婚禮棵逊,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘银酗。我一直安慰自己辆影,他們只是感情好徒像,可當我...
    茶點故事閱讀 65,381評論 5 384
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著蛙讥,像睡著了一般锯蛀。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上次慢,一...
    開封第一講書人閱讀 49,730評論 1 289
  • 那天旁涤,我揣著相機與錄音,去河邊找鬼迫像。 笑死劈愚,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的闻妓。 我是一名探鬼主播菌羽,決...
    沈念sama閱讀 38,882評論 3 404
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼由缆!你這毒婦竟也來了注祖?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,643評論 0 266
  • 序言:老撾萬榮一對情侶失蹤均唉,失蹤者是張志新(化名)和其女友劉穎是晨,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體舔箭,經(jīng)...
    沈念sama閱讀 44,095評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡署鸡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,448評論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了限嫌。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片靴庆。...
    茶點故事閱讀 38,566評論 1 339
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖怒医,靈堂內(nèi)的尸體忽然破棺而出炉抒,到底是詐尸還是另有隱情,我是刑警寧澤稚叹,帶...
    沈念sama閱讀 34,253評論 4 328
  • 正文 年R本政府宣布焰薄,位于F島的核電站,受9級特大地震影響扒袖,放射性物質(zhì)發(fā)生泄漏塞茅。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,829評論 3 312
  • 文/蒙蒙 一季率、第九天 我趴在偏房一處隱蔽的房頂上張望野瘦。 院中可真熱鬧,春花似錦、人聲如沸鞭光。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,715評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽惰许。三九已至席覆,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間汹买,已是汗流浹背佩伤。 一陣腳步聲響...
    開封第一講書人閱讀 31,945評論 1 264
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留晦毙,地道東北人畦戒。 一個月前我還...
    沈念sama閱讀 46,248評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像结序,于是被迫代替她去往敵國和親障斋。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 43,440評論 2 348

推薦閱讀更多精彩內(nèi)容