編程技能(九)掌握SQL——SQL簡(jiǎn)介及數(shù)據(jù)庫(kù)常見類型

思維導(dǎo)圖

Q1:什么是SQL带斑?為什么要用到SQL?

1.SQL(Structured Query Language,結(jié)構(gòu)化查詢語(yǔ)言)

  • SQL是一種數(shù)據(jù)庫(kù)查詢和程序設(shè)計(jì)語(yǔ)言仲墨,用于存取數(shù)據(jù),以及查詢揍障、更新和管理關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)

  • 通俗地講目养,SQL就是用來提取數(shù)據(jù)的語(yǔ)言

  • 由于數(shù)據(jù)庫(kù)類型以及數(shù)據(jù)存儲(chǔ)方式的不同,對(duì)應(yīng)的SQL語(yǔ)法也會(huì)有所區(qū)別毒嫡,但整體的SQL語(yǔ)法結(jié)構(gòu)是統(tǒng)一的

  • 目前癌蚁,大多考查的是Hive SQL語(yǔ)句

2.SQL的用途

  • 使用R/Python進(jìn)行數(shù)據(jù)分析前,需要將數(shù)據(jù)從數(shù)據(jù)庫(kù)中提取出來兜畸,這時(shí)需要用到SQL語(yǔ)句


Q2:簡(jiǎn)述Hive努释、Hadoop、HDFS咬摇、MapReduce伐蒂。

1. Hive

  • Hive是基于Hadoop的一個(gè)數(shù)據(jù)倉(cāng)庫(kù)工具,可以將結(jié)構(gòu)化的數(shù)據(jù)文件映射為一個(gè)數(shù)據(jù)庫(kù)表肛鹏,并提供類SQL查詢功能(Hive SQL)

2.Hadoop

  • Hadoop是現(xiàn)在各大公司用得非常多的一種數(shù)據(jù)存儲(chǔ)和計(jì)算架構(gòu)系統(tǒng)

  • Hadoop可以使用戶在不了解分布式底層細(xì)節(jié)的情況下開發(fā)分布式程序逸邦,充分利用集群的威力進(jìn)行高速計(jì)算和存儲(chǔ)

  • Hadoop解決了兩大問題:大數(shù)據(jù)存儲(chǔ)(HDFS)恩沛、大數(shù)據(jù)分析(MapReduce)

3.HDFS(Hadoop Distributed File System)

  • HDFS是可擴(kuò)展的、容錯(cuò)的缕减、高性能的分布式文件系統(tǒng)雷客,異步復(fù)制,一次寫入桥狡、多次讀取

  • HDFS主要負(fù)責(zé)存儲(chǔ)

4.MapReduce

  • MapReduce是分布式計(jì)算框架佛纫,包含Map(映射)和Reduce(歸約)過程

  • MapReduce負(fù)責(zé)在HDFS上進(jìn)行計(jì)算


Q3:簡(jiǎn)述Hadoop和MySQL的區(qū)別以及適用情況。

1.Hive SQL

  • 相當(dāng)于將SQL語(yǔ)句轉(zhuǎn)換成對(duì)應(yīng)的Java語(yǔ)句來實(shí)現(xiàn)Map和Reduce過程

2.Hadoop

  • Hadoop系統(tǒng)可以存儲(chǔ)并計(jì)算海量數(shù)據(jù)总放,滿足互聯(lián)網(wǎng)公司上億數(shù)據(jù)量計(jì)算的需求

  • 但處理“前端實(shí)時(shí)展示數(shù)據(jù)的變化情況”這類問題效率低呈宇,從HDFS中實(shí)時(shí)獲取數(shù)據(jù)后再展示在前端,會(huì)因?yàn)镠adoop系統(tǒng)本身啟動(dòng)慢而無法保證實(shí)時(shí)性

3.MySQL

  • MySQL是將數(shù)據(jù)存儲(chǔ)在本地服務(wù)器上的關(guān)系數(shù)據(jù)庫(kù)

  • 對(duì)于單次計(jì)算量不是很大的查詢能夠很快地進(jìn)行響應(yīng)局雄,獲取相關(guān)結(jié)果甥啄,滿足數(shù)據(jù)看板等實(shí)時(shí)展示數(shù)據(jù)的需要

  • 但是當(dāng)數(shù)據(jù)量非常大時(shí),MySQL的速度相比于Hadoop系統(tǒng)就會(huì)慢得多炬搭,并且可能會(huì)因?yàn)橛?jì)算量過大使得任務(wù)被直接殺死

4.目前通用的方法

  • 在Hadoop中通過Hive SQL對(duì)原始數(shù)據(jù)集進(jìn)行處理蜈漓,盡量在Hive中完成大數(shù)據(jù)量的計(jì)算,之后將處理好的數(shù)據(jù)通過出倉(cāng)的方式導(dǎo)入MySQL中

  • MySQL中的數(shù)據(jù)就是在原始數(shù)據(jù)基礎(chǔ)上進(jìn)行加工得到的數(shù)據(jù)宫盔,前端進(jìn)行調(diào)用時(shí)融虽,可以直接獲取或者進(jìn)行非常簡(jiǎn)單的計(jì)算


參考文獻(xiàn)

1.《拿下Offer 數(shù)據(jù)分析師求職面試指南》徐麟 著

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市灼芭,隨后出現(xiàn)的幾起案子有额,更是在濱河造成了極大的恐慌,老刑警劉巖彼绷,帶你破解...
    沈念sama閱讀 217,734評(píng)論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件巍佑,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡寄悯,警方通過查閱死者的電腦和手機(jī)萤衰,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,931評(píng)論 3 394
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來猜旬,“玉大人脆栋,你說我怎么就攤上這事∪鞑粒” “怎么了椿争?”我有些...
    開封第一講書人閱讀 164,133評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)秘遏。 經(jīng)常有香客問我丘薛,道長(zhǎng),這世上最難降的妖魔是什么邦危? 我笑而不...
    開封第一講書人閱讀 58,532評(píng)論 1 293
  • 正文 為了忘掉前任洋侨,我火速辦了婚禮舍扰,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘希坚。我一直安慰自己边苹,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,585評(píng)論 6 392
  • 文/花漫 我一把揭開白布裁僧。 她就那樣靜靜地躺著个束,像睡著了一般。 火紅的嫁衣襯著肌膚如雪聊疲。 梳的紋絲不亂的頭發(fā)上茬底,一...
    開封第一講書人閱讀 51,462評(píng)論 1 302
  • 那天,我揣著相機(jī)與錄音获洲,去河邊找鬼阱表。 笑死,一個(gè)胖子當(dāng)著我的面吹牛贡珊,可吹牛的內(nèi)容都是我干的阴幌。 我是一名探鬼主播做修,決...
    沈念sama閱讀 40,262評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼肠套!你這毒婦竟也來了愤估?” 一聲冷哼從身側(cè)響起樱拴,我...
    開封第一講書人閱讀 39,153評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤爹土,失蹤者是張志新(化名)和其女友劉穎纺且,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體牢裳,經(jīng)...
    沈念sama閱讀 45,587評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡逢防,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,792評(píng)論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了蒲讯。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,919評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡灰署,死狀恐怖判帮,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情溉箕,我是刑警寧澤晦墙,帶...
    沈念sama閱讀 35,635評(píng)論 5 345
  • 正文 年R本政府宣布,位于F島的核電站肴茄,受9級(jí)特大地震影響晌畅,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜寡痰,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,237評(píng)論 3 329
  • 文/蒙蒙 一抗楔、第九天 我趴在偏房一處隱蔽的房頂上張望棋凳。 院中可真熱鬧,春花似錦连躏、人聲如沸剩岳。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,855評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)拍棕。三九已至,卻和暖如春勺良,著一層夾襖步出監(jiān)牢的瞬間绰播,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,983評(píng)論 1 269
  • 我被黑心中介騙來泰國(guó)打工尚困, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留蠢箩,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,048評(píng)論 3 370
  • 正文 我出身青樓尾组,卻偏偏與公主長(zhǎng)得像忙芒,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子讳侨,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,864評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容