1哀九、 數(shù)據(jù)倉(cāng)庫(kù)可以分為幾層? 數(shù)據(jù)運(yùn)營(yíng)層(Operation Data Store 荸镊,ODS):將業(yè)務(wù)數(shù)據(jù)庫(kù)咽斧、埋點(diǎn)日志、其他數(shù)據(jù)源原樣存儲(chǔ)躬存,不做任何處理张惹; 數(shù)據(jù)倉(cāng)庫(kù)層(Dat...
1哀九、 數(shù)據(jù)倉(cāng)庫(kù)可以分為幾層? 數(shù)據(jù)運(yùn)營(yíng)層(Operation Data Store 荸镊,ODS):將業(yè)務(wù)數(shù)據(jù)庫(kù)咽斧、埋點(diǎn)日志、其他數(shù)據(jù)源原樣存儲(chǔ)躬存,不做任何處理张惹; 數(shù)據(jù)倉(cāng)庫(kù)層(Dat...
前兩天面試被問(wèn)到“哪種機(jī)器學(xué)習(xí)算法沒(méi)有參數(shù)?”回答的不是很好岭洲,因此在這里重新梳理一下宛逗。 1、參數(shù)模型 如果我們對(duì)所要學(xué)習(xí)的問(wèn)題有足夠的認(rèn)識(shí)盾剩,具備一定的先驗(yàn)知識(shí)雷激,此時(shí)我們一般會(huì)...
接上篇,上篇介紹了我面試遇到的MySQL行轉(zhuǎn)列的筆試題彪腔,本篇將拓展一下行列互轉(zhuǎn)的其他知識(shí)侥锦。 建表語(yǔ)句: 行轉(zhuǎn)列實(shí)現(xiàn): 注意:union 與union all 的區(qū)別 對(duì)重復(fù)結(jié)...
復(fù)盤一下前兩天MySQL的一道筆試題德挣。 建表語(yǔ)句為: 這是典型的行轉(zhuǎn)列操作。方法有以下兩種: 注意:max() 是為了能夠使用 group by 根據(jù) id 進(jìn)行分組快毛,因?yàn)槊?..
數(shù)據(jù)的缺失主要包含記錄的缺失和記錄中某個(gè)字段的缺失唠帝,兩者都會(huì)造成分析結(jié)果的不準(zhǔn)確屯掖。以下將從缺失值產(chǎn)生的原因、缺失值產(chǎn)生的影響襟衰、缺失值的類型以及缺失值處理三個(gè)方面展開(kāi)分析贴铜。 1...
什么是異常值異常值常出現(xiàn)的原因常見(jiàn)的異常值檢測(cè)方法簡(jiǎn)單統(tǒng)計(jì)量分析3δ原則箱型圖分析DBSCAN聚類Robust Random Cut Forest異常值的處理 1. 什么是異...
正態(tài)分布概念: 參見(jiàn)上篇簡(jiǎn)文中心極限定理與正態(tài)分布 好,進(jìn)入本文重點(diǎn)绍坝,為什么很多模型都假設(shè)變量服從正態(tài)分布呢徘意,尤其是回歸模型 1.正態(tài)分布的奇妙之處就在于它是自然分布,任何看...
本文第一節(jié)源于周志華教授《關(guān)于深度學(xué)習(xí)的一點(diǎn)思考》提出深度森林的探索, 在此基礎(chǔ)上對(duì)深度森林做了原理解析并實(shí)踐。周志華教授把介,畢業(yè)于南京大學(xué)勤讽,歐洲科學(xué)院外籍院士,國(guó)家杰出青年基...
中心極限定理: 1.大量相互獨(dú)立的隨機(jī)變量拗踢,在采樣次數(shù)足夠大的時(shí)候(一般要超過(guò)30次以上)脚牍,其均值或者和的分布以正態(tài)分布為極限,中心極限定理的有趣的地方在于秒拔,無(wú)論隨機(jī)變量呈現(xiàn)...