第十三周

Algorithm

什么是"正確"的算法?

"正確"的算法是要根據(jù)不同應(yīng)用環(huán)境和場(chǎng)景確定的挪拟。假設(shè)面試官就問對(duì)一組數(shù)據(jù)進(jìn)行排序校坑,你將怎么做闯团?一般人第一反應(yīng)就會(huì)是使用快速排序算法O(nlogn)作答晾虑。但這個(gè)回答卻忽略了使用環(huán)境因素决左,和數(shù)據(jù)特征。

  • 如果包括大量重復(fù)元素則 三路快排則是一個(gè)非常好的選擇走贪。
  • 如果大部分?jǐn)?shù)據(jù)離正確位置很近,就是說數(shù)據(jù)近乎有序惑芭,那么插入排序法則是更好的選擇
  • 如果數(shù)據(jù)范圍有限坠狡,那么使用計(jì)數(shù)排序則會(huì)更好。
  • 如果需要是穩(wěn)定的排序遂跟,那么需要是歸并排序逃沿。
  • 查看一下 數(shù)據(jù)量多大,是否只能使用鏈表或者一臺(tái)機(jī)器根本存不下這些數(shù)據(jù)幻锁。

優(yōu)化算法的思路

  • 遍歷常見的算法思路:?jiǎn)栴}分類凯亮,是索引指針,還是遞歸哄尔,分治假消,動(dòng)態(tài)規(guī)劃等方式。
  • 遍歷常見的數(shù)據(jù)結(jié)構(gòu):棧岭接,隊(duì)列富拗,數(shù)臼予,圖來解決問題。
  • 空間和時(shí)間的交換(哈希表)
  • 預(yù)處理信息(排序)
  • 瓶頸處找答案啃沪。

算法復(fù)雜度和數(shù)據(jù)規(guī)模

1秒內(nèi):

O(n^2) 處理大約10^4級(jí)別的數(shù)據(jù)

O(nlogn) 處理大約10^8級(jí)別的數(shù)據(jù)

O(n) 處理大約10^7級(jí)別的數(shù)據(jù)

遞歸的時(shí)間復(fù)雜度是什么粘拾?

如果遞歸函數(shù)中,只進(jìn)行一次遞歸調(diào)用创千,遞歸深度為depth缰雇;
在每個(gè)遞歸函數(shù)中,時(shí)間復(fù)雜度為T追驴;則總體的時(shí)間復(fù)雜度為O(T * depth)

Review

一械哟、《Flink-客戶端操作》

Flink提供了豐富的客戶端操作來提交任務(wù)和與任務(wù)進(jìn)行交互。本期課程將分為5個(gè)部分進(jìn)行講
解氯檐,包括 Flink命令行戒良,Scala Shell,SQL Client(后續(xù)支持DDL語句)冠摄,Restful API 和 Web糯崎。)

鏈接

二、《Flink Window Time》

鏈接

Tips/Technology

一河泳、Google大數(shù)據(jù)處理發(fā)展過程

第一階段:無統(tǒng)一大數(shù)據(jù)處理框架沃呢,MapReduce應(yīng)運(yùn)而生解決了統(tǒng)一容錯(cuò),讓開發(fā)人員只關(guān)心業(yè)務(wù)邏輯等問題
拆挥。

第二階段:MapReduce無法自動(dòng)調(diào)優(yōu)薄霜,大量Map和Reduce代碼后期很難維護(hù)。FlumeJava出現(xiàn)了纸兔,將執(zhí)行計(jì)劃先遍歷一遍形成有向無環(huán)圖自動(dòng)惰瓜。

第三階段:FlumeJava只支持批處理,無法對(duì)無解數(shù)據(jù)進(jìn)行處理所以在2015年發(fā)布了Dataflow模型汉矿,希望集合現(xiàn)在市場(chǎng)上的框架崎坊,進(jìn)行流批的統(tǒng)一。

第四階段:Google全面推進(jìn)Beam

  1. MapReduce: https://research.google.com/archive/mapreduce-osdi04.pdf
  2. Flumejava: https://research.google.com/pubs/archive/35650.pdf
  3. MillWheel: https://research.google.com/pubs/archive/41378.pdf
  4. Data flow Model: https://www.vldb.org/pvldb/vol8/p1792-Akidau.pdf

二洲拇、Flink和Spark對(duì)比

  • 從流處理角度:Spark是微批處理奈揍,所以窗口操作只支持處理時(shí)間和事件事件,不支持?jǐn)?shù)據(jù)時(shí)間和自定義窗口赋续。Flink沒有這些問題男翰。
  • 從SQL角度:都提供SQL交互,Spark目前比較完善纽乱,F(xiàn)link后期會(huì)把Blink的DDL語句進(jìn)行合并蛾绎。
  • 從迭代計(jì)算角度:Flink支持有環(huán)圖,針對(duì)機(jī)器學(xué)習(xí)的算法效率高。
  • 從生態(tài)角度:Spark歷史比較久社區(qū)活躍秘通,支持的庫(kù)比較多为严。Flink支持的庫(kù)比較少但在國(guó)內(nèi)由阿里在推廣。

Share

《慢下來》

紀(jì)伯倫有句話:我們已經(jīng)走得太遠(yuǎn)肺稀,以至于忘記了為什么出發(fā)第股。我們做事情總是很急,總怕自己錯(cuò)過了什么话原,到頭來其實(shí)什么也沒記住夕吻,但卻滿足了自身的焦慮感。有些時(shí)候我們目的還沒有搞清楚繁仁,在世俗的驅(qū)動(dòng)下涉馅,隨波逐流的就去做了,做了半天其實(shí)方向都是錯(cuò)的黄虱。給自己一個(gè)建議稚矿,慢下來,只要方向是對(duì)的慢慢走早晚會(huì)到終點(diǎn)捻浦。

Research

項(xiàng)目部署晤揣、袋鼠云版本遷移、華為產(chǎn)品對(duì)接

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末朱灿,一起剝皮案震驚了整個(gè)濱河市昧识,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌盗扒,老刑警劉巖跪楞,帶你破解...
    沈念sama閱讀 221,198評(píng)論 6 514
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異侣灶,居然都是意外死亡甸祭,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,334評(píng)論 3 398
  • 文/潘曉璐 我一進(jìn)店門褥影,熙熙樓的掌柜王于貴愁眉苦臉地迎上來淋叶,“玉大人,你說我怎么就攤上這事伪阶。” “怎么了处嫌?”我有些...
    開封第一講書人閱讀 167,643評(píng)論 0 360
  • 文/不壞的土叔 我叫張陵栅贴,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我熏迹,道長(zhǎng)檐薯,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,495評(píng)論 1 296
  • 正文 為了忘掉前任,我火速辦了婚禮坛缕,結(jié)果婚禮上墓猎,老公的妹妹穿的比我還像新娘。我一直安慰自己赚楚,他們只是感情好毙沾,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,502評(píng)論 6 397
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著宠页,像睡著了一般左胞。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上举户,一...
    開封第一講書人閱讀 52,156評(píng)論 1 308
  • 那天烤宙,我揣著相機(jī)與錄音,去河邊找鬼俭嘁。 笑死躺枕,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的供填。 我是一名探鬼主播拐云,決...
    沈念sama閱讀 40,743評(píng)論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼捕虽!你這毒婦竟也來了慨丐?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,659評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤泄私,失蹤者是張志新(化名)和其女友劉穎房揭,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體晌端,經(jīng)...
    沈念sama閱讀 46,200評(píng)論 1 319
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡捅暴,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,282評(píng)論 3 340
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了咧纠。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片蓬痒。...
    茶點(diǎn)故事閱讀 40,424評(píng)論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖漆羔,靈堂內(nèi)的尸體忽然破棺而出梧奢,到底是詐尸還是另有隱情,我是刑警寧澤演痒,帶...
    沈念sama閱讀 36,107評(píng)論 5 349
  • 正文 年R本政府宣布亲轨,位于F島的核電站,受9級(jí)特大地震影響鸟顺,放射性物質(zhì)發(fā)生泄漏惦蚊。R本人自食惡果不足惜器虾,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,789評(píng)論 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望蹦锋。 院中可真熱鬧兆沙,春花似錦、人聲如沸莉掂。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,264評(píng)論 0 23
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽巫湘。三九已至装悲,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間尚氛,已是汗流浹背诀诊。 一陣腳步聲響...
    開封第一講書人閱讀 33,390評(píng)論 1 271
  • 我被黑心中介騙來泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留阅嘶,地道東北人属瓣。 一個(gè)月前我還...
    沈念sama閱讀 48,798評(píng)論 3 376
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像讯柔,于是被迫代替她去往敵國(guó)和親抡蛙。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,435評(píng)論 2 359

推薦閱讀更多精彩內(nèi)容