李智慧:從0開始學(xué)大數(shù)據(jù)(1~2)

為什么軟件工程師都應(yīng)該懂大數(shù)據(jù)技術(shù)?

軟件編程技術(shù)出現(xiàn)已經(jīng)半個多世紀(jì)了,核心價值就是把現(xiàn)實世界的業(yè)務(wù)操作搬到計算機上崭倘,通過計算機軟件和網(wǎng)絡(luò)進(jìn)行業(yè)務(wù)和數(shù)據(jù)處理钞翔。

人類擁有了更為高效的存儲,更快速的信息傳遞網(wǎng)絡(luò)和計算設(shè)備暂吉。

舉例說明一下
讓你一個月在家里呆著不出門,然后可以衣食無憂。
吃喝:美團(tuán)鉴象,餓了嗎,京東到家何鸡,跑腿
玩樂:游戲纺弊,抖音,奈非骡男,直播

人們與現(xiàn)實世界的連接會越來越少淆游。

大數(shù)據(jù)技術(shù)和機器學(xué)習(xí)技術(shù),也就是后來我們都耳熟能詳?shù)娜斯ぶ悄?AI 技術(shù)隔盛。

Google的AlphaGo,大數(shù)據(jù) + 機器學(xué)習(xí)

他們并不管工程師叫工程師犹菱,而是叫“僧侶”;也不管核電站叫核電站吮炕,而是叫“圣殿”腊脱;維修也不是叫維修,而是叫“祈禱”龙亲。

用阿西莫夫的《基地》中的情節(jié)來得出“你看陕凹,科學(xué)和宗教并不是互斥的,科學(xué)也可以成為宗教鳄炉,當(dāng)人們面對自己不懂的東西的時候杜耙,會傾向于用宗教的原理去解釋∮ぃ”有點不合適泥技,《基地》中的情節(jié)是想象出來的,不是事實。

必須能夠發(fā)掘出用戶自己都沒有發(fā)現(xiàn)的需求珊豹,必須洞悉用戶自己都不了解的自己簸呈。

數(shù)據(jù)會越來越成為公司的核心資產(chǎn)和主要競爭力,公司的業(yè)務(wù)展開和產(chǎn)品進(jìn)化也越來越朝著如何利用好數(shù)據(jù)價值的方向發(fā)展店茶。

同理蜕便,數(shù)據(jù)會成為每個人的核心競爭力。處理數(shù)據(jù)贩幻,并得出有價值的結(jié)論會讓你的過去的積累更為值錢轿腺。

如果未來是面向AI編程的,希望軟件工程師不要把AI 當(dāng)做什么萬能的東西丛楚。

大數(shù)據(jù)技術(shù)發(fā)展史:大數(shù)據(jù)的前世今生

今天我們常說的大數(shù)據(jù)技術(shù)族壳,其實起源于 Google 在 2004 年前后發(fā)表的三篇論文,也就是我們經(jīng)常聽到的“三駕馬車”趣些,分別是分布式文件系統(tǒng) GFS仿荆、大數(shù)據(jù)分布式計算框架 MapReduce 和 NoSQL 數(shù)據(jù)庫系統(tǒng) BigTable。

GFS
https://static.googleusercontent.com/media/research.google.com/zh-CN//archive/gfs-sosp2003.pdf

MapReduce
MapReduce: Simplified Data Processing on Large Clusters – Google AI

BigTable
Bigtable: A Distributed Storage System for Structured Data – Google AI

我們所開發(fā)的軟件價值點在哪里坏平?

阿里巴巴的TFS
https://github.com/alibaba/tfs

大數(shù)據(jù)處理的主要應(yīng)用場景包括數(shù)據(jù)分析拢操、數(shù)據(jù)挖掘與機器學(xué)習(xí)。數(shù)據(jù)分析主要使用 Hive舶替、Spark SQL 等 SQL 引擎完成令境;數(shù)據(jù)挖掘與機器學(xué)習(xí)則有專門的機器學(xué)習(xí)框架 TensorFlow、Mahout 以及 MLlib 等顾瞪,內(nèi)置了主要的機器學(xué)習(xí)和數(shù)據(jù)挖掘算法舔庶。

思考題
你從大數(shù)據(jù)生態(tài)的發(fā)展史中,能得出什么樣的結(jié)論陈醒?又有怎樣的思考栖茉?

歡迎你寫下自己的思考或疑問,與我和其他同學(xué)一起討論孵延。

大數(shù)據(jù)生態(tài)的發(fā)展史?

這讓我想到陶器和瓷器的發(fā)展
瓷器沒有出來之前亲配,人們都是試用陶器作為盛器尘应,陶器制作過程比較簡單,將黏土吼虎,陶器是黏土在溫度下燒制而成犬钢,在沒有發(fā)現(xiàn)高嶺土和爐溫達(dá)到1200度之前,一直是使用的是陶器思灰。

在未來處理數(shù)據(jù)的速度就像爐溫玷犹,每當(dāng)處理速度上升了一個新的量級,就會產(chǎn)生完全不同的東西出來洒疚。

互聯(lián)網(wǎng)運營數(shù)據(jù)指標(biāo)與可視化監(jiān)控

數(shù)據(jù)驅(qū)動運營

大數(shù)據(jù)包括的內(nèi)容

技術(shù)和工具

  • 熟悉Hadoop歹颓、Hbase坯屿、 Kudu、Hive巍扛、 Spark领跛、
    MapReduce、Kafka撤奸、 Storm吠昭、 Flink或Jstorm、
    ETL等相關(guān)技術(shù)或者工具至少3個以上

  • 精通Java胧瓜、Python矢棚, 了 解數(shù)據(jù)挖掘、機器學(xué)
    習(xí)府喳、并行計算相關(guān)理論

  • 模型構(gòu)建

  • 熟悉數(shù)據(jù)庫原理,對數(shù)據(jù)處理和數(shù)據(jù)質(zhì)量有較深
    認(rèn)識蒲肋,有NoSQL數(shù)據(jù)庫數(shù)據(jù)處理和數(shù)據(jù)處理性能
    優(yōu)化經(jīng)驗;

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市劫拢,隨后出現(xiàn)的幾起案子肉津,更是在濱河造成了極大的恐慌,老刑警劉巖舱沧,帶你破解...
    沈念sama閱讀 219,490評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件妹沙,死亡現(xiàn)場離奇詭異,居然都是意外死亡熟吏,警方通過查閱死者的電腦和手機距糖,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,581評論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來牵寺,“玉大人悍引,你說我怎么就攤上這事∶泵ィ” “怎么了趣斤?”我有些...
    開封第一講書人閱讀 165,830評論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長黎休。 經(jīng)常有香客問我浓领,道長,這世上最難降的妖魔是什么势腮? 我笑而不...
    開封第一講書人閱讀 58,957評論 1 295
  • 正文 為了忘掉前任联贩,我火速辦了婚禮,結(jié)果婚禮上捎拯,老公的妹妹穿的比我還像新娘泪幌。我一直安慰自己,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,974評論 6 393
  • 文/花漫 我一把揭開白布祸泪。 她就那樣靜靜地躺著吗浩,像睡著了一般。 火紅的嫁衣襯著肌膚如雪浴滴。 梳的紋絲不亂的頭發(fā)上拓萌,一...
    開封第一講書人閱讀 51,754評論 1 307
  • 那天,我揣著相機與錄音升略,去河邊找鬼微王。 笑死,一個胖子當(dāng)著我的面吹牛品嚣,可吹牛的內(nèi)容都是我干的炕倘。 我是一名探鬼主播,決...
    沈念sama閱讀 40,464評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼翰撑,長吁一口氣:“原來是場噩夢啊……” “哼罩旋!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起眶诈,我...
    開封第一講書人閱讀 39,357評論 0 276
  • 序言:老撾萬榮一對情侶失蹤涨醋,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后逝撬,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體浴骂,經(jīng)...
    沈念sama閱讀 45,847評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,995評論 3 338
  • 正文 我和宋清朗相戀三年宪潮,在試婚紗的時候發(fā)現(xiàn)自己被綠了溯警。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,137評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡狡相,死狀恐怖梯轻,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情尽棕,我是刑警寧澤喳挑,帶...
    沈念sama閱讀 35,819評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站滔悉,受9級特大地震影響蟀悦,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜氧敢,卻給世界環(huán)境...
    茶點故事閱讀 41,482評論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望询张。 院中可真熱鬧孙乖,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,023評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至恋拷,卻和暖如春资厉,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背蔬顾。 一陣腳步聲響...
    開封第一講書人閱讀 33,149評論 1 272
  • 我被黑心中介騙來泰國打工宴偿, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人诀豁。 一個月前我還...
    沈念sama閱讀 48,409評論 3 373
  • 正文 我出身青樓窄刘,卻偏偏與公主長得像,于是被迫代替她去往敵國和親舷胜。 傳聞我的和親對象是個殘疾皇子娩践,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,086評論 2 355

推薦閱讀更多精彩內(nèi)容

  • 今天談一個嚴(yán)肅的話題,認(rèn)真臉.jpg烹骨。 青年危機翻伺,也叫四分之一人生危機,Quarter-life Crisis沮焕,伴...
    至善叔叔閱讀 392評論 0 0
  • 詩意的棲居在這深山老林吨岭, 陽光明媚人們熱情而友好。 早起刷牙洗臉去吃了早點遇汞, 隨鈴聲一響慢慢的去讀書未妹, 讀碎了中文...
    鳴愿閱讀 218評論 0 8
  • 相遇是那么的不經(jīng)意,心動來的那么輕易空入;我們的開始沒有轟轟烈烈络它,只是無意間的眼神交錯,就已逃不開了你的囚禁歪赢;驚奇驚奇...
    A區(qū)孩閱讀 178評論 12 3
  • 很高興點評戰(zhàn)友(盧雅雯)的文章埋凯,寫的真是太棒了点楼! 肖申克的救贖,這部電影我也看了白对,但卻沒有你這么深的領(lǐng)悟掠廓。 讀你的...
    超級賦能王張勝萍閱讀 483評論 2 5
  • 人際關(guān)系 TV版動畫延續(xù)了OVA的概念設(shè)定,講述人與人相處和產(chǎn)生的摩擦間隙甩恼。故事花了很大篇幅講述人物面對來自親友的...
    空白_7閱讀 870評論 0 0