2020-05-18-SQL入門操作

創(chuàng)建數(shù)據(jù)庫文件

文件-新建連接-sqllite-新建sqllite3-數(shù)據(jù)庫文件-選擇存放位置

導(dǎo)入數(shù)據(jù)

下載文件
這是數(shù)據(jù)分析師的excel實(shí)戰(zhàn)數(shù)據(jù)的下載地址:

https://pan.baidu.com/s/1eUjcGaI

提取密碼:g5xa


選擇編碼
gb2312-windows電腦數(shù)據(jù)文件
utf-8 linux電腦數(shù)據(jù)文件


image.png

image.png

image.png

table是表名低葫,column是我們想要查詢的字段/列,column可以用 * 代替仍律,指代全部字段嘿悬,意為從table表查詢所有數(shù)據(jù)。

select column from table

where 是基礎(chǔ)查詢語法染苛,用于條件判斷鹊漠。

select * from DataAnalyst
where city = '上海'

上圖是最簡化的查詢語句,將所有城市為上海的職位數(shù)據(jù)過濾出來茶行。我們也可以用 and 進(jìn)行多條件判斷。

select * from DataAnalyst
where city = '上海' and positionName = '數(shù)據(jù)分析師'

當(dāng)我們涉及到非常復(fù)雜的與或邏輯判斷登钥,應(yīng)該怎么辦畔师?比如即滿足條件AB,又要滿足條件C牧牢,或者是滿足條件DE看锉。此時(shí)需要用括號明確邏輯判斷的優(yōu)先級姿锭。

select * from DataAnalyst

where (city = '上海' and positionName = '數(shù)據(jù)分析師') or (city = '北京' and positionName = '數(shù)據(jù)產(chǎn)品經(jīng)理')

接下來的問題來了,當(dāng)我們要查詢多個(gè)條件伯铣,比如北京上海廣州深圳南京這些城市呻此,難道一個(gè)個(gè)用and關(guān)聯(lián)起來?這太麻煩了腔寡,我們可以使用 in 焚鲜。

select * from DataAnalyst
where city in ('北京','上海','廣州','深圳','南京')

當(dāng)我們遇到字段數(shù)據(jù)類型是數(shù)值時(shí),也可以使用符號> 放前、>=忿磅、< 、<=凭语、!= 進(jìn)行邏輯判斷葱她,!= 指的是不等于,等價(jià)于 <> 似扔。

select * from DataAnalyst
where companyId >= 10000

當(dāng)我們需要取區(qū)間數(shù)值時(shí)吨些,使用 between and

select * from DataAnalyst
where companyId between 10000 and 20000

between and 包括數(shù)值兩端的邊界,等同于 companyId >=10000 and companyId <= 20000炒辉。

如果要模糊查找豪墅,能用like。

select * from DataAnalyst
where positionName like '%數(shù)據(jù)分析%'

語句的含義是在positionName列查找包含「數(shù)據(jù)分析」字段的數(shù)據(jù)辆脸,%代表的是通配符但校,含義是無所謂「數(shù)據(jù)分析」前面后面是什么內(nèi)容。如果是 '數(shù)據(jù)分析%' 啡氢,則代表字段必須以數(shù)據(jù)分析開頭状囱,無所謂后面是什么。

group by倘是,它是數(shù)據(jù)分析中常見的語法亭枷,目的是將數(shù)據(jù)按組/維度劃分。類似于Excel中的數(shù)據(jù)透視表搀崭,我們以city為例叨粘。

select * from DataAnalyst
group by city
image.png

它將城市劃分成幾組,通過group by 可以快速的瀏覽數(shù)據(jù)有哪些城市瘤睹。我們看一下它的高階用法升敲。

select city,count(1) from DataAnalyst
group by city
image.png

上述語句,使用count函數(shù)轰传,統(tǒng)計(jì)計(jì)數(shù)了每個(gè)城市擁有的職位數(shù)量驴党。括號里面的1代表以第一列為計(jì)數(shù)標(biāo)準(zhǔn)。這里出現(xiàn)新的問題获茬,當(dāng)我們遇到重復(fù)數(shù)據(jù)怎么辦港庄?在DataAnalyst 這張表中倔既,北京職位包含重復(fù)的職位ID,我們需要去重鹏氧。

select city,count(distinct positionId) from DataAnalyst
group by city
image.png

北京的數(shù)據(jù)一下子少了2000渤涌,多余的重復(fù)值被排除在外。distinct 是去重函數(shù)把还,distinct positionId 會只計(jì)算唯一的positionId個(gè)數(shù)实蓬。日常工作中,活躍用戶數(shù)笨篷、文章UV瞳秽,都是用distinct 計(jì)算獲得,這是唯一標(biāo)示符ID的重要作用率翅。

除了count练俐,還有max,min冕臭,sum腺晾,avg等函數(shù),也叫做聚合函數(shù)辜贵。用法和Excel沒什么區(qū)別悯蝉。

當(dāng)我們在group by 添加多個(gè)字段,它將以多維的形式進(jìn)行數(shù)據(jù)聚合托慨。

select city,workYear,count(distinct positionId) from DataAnalyst
group by city,workYear

接下來是新的問題鼻由,如果我想找出各個(gè)城市,數(shù)據(jù)分析師崗位數(shù)量在500以上的城市有哪些厚棵,應(yīng)該怎么計(jì)算蕉世?有兩種方法,第一種婆硬,是使用having語句狠轻,它對聚合后的數(shù)據(jù)結(jié)果進(jìn)行過濾。

select city,count(distinct positionId) from DataAnalyst
group by city having count(distinct positionId) >= 500
image.png

第二種彬犯,是利用嵌套子查詢向楼。

image

我們將第一次查詢獲得的城市職位數(shù)的結(jié)果,看作一張新的表谐区,利用as 將它命名為t1( table1 的簡寫)湖蜕,將職位數(shù)命名為一個(gè)新的字段counts。然后外面再套一層select 過濾出counts >=500宋列。

這種查詢方式就叫嵌套子查詢重荠,使用場景比較廣泛,where 后面也能跟子查詢虚茶。

很多時(shí)候戈鲁,數(shù)據(jù)是凌亂的,我們希望結(jié)果能夠呈現(xiàn)一定的順序嘹叫,這時(shí)候就用到order by語句婆殿。

select city,count(distinct positionId) as counts from DataAnalyst
group by city
order by counts
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市罩扇,隨后出現(xiàn)的幾起案子婆芦,更是在濱河造成了極大的恐慌,老刑警劉巖喂饥,帶你破解...
    沈念sama閱讀 217,277評論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件消约,死亡現(xiàn)場離奇詭異,居然都是意外死亡员帮,警方通過查閱死者的電腦和手機(jī)或粮,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,689評論 3 393
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來捞高,“玉大人氯材,你說我怎么就攤上這事∠醺冢” “怎么了氢哮?”我有些...
    開封第一講書人閱讀 163,624評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長型檀。 經(jīng)常有香客問我冗尤,道長,這世上最難降的妖魔是什么胀溺? 我笑而不...
    開封第一講書人閱讀 58,356評論 1 293
  • 正文 為了忘掉前任裂七,我火速辦了婚禮,結(jié)果婚禮上月幌,老公的妹妹穿的比我還像新娘碍讯。我一直安慰自己,他們只是感情好扯躺,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,402評論 6 392
  • 文/花漫 我一把揭開白布捉兴。 她就那樣靜靜地躺著,像睡著了一般录语。 火紅的嫁衣襯著肌膚如雪倍啥。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,292評論 1 301
  • 那天澎埠,我揣著相機(jī)與錄音虽缕,去河邊找鬼。 笑死蒲稳,一個(gè)胖子當(dāng)著我的面吹牛氮趋,可吹牛的內(nèi)容都是我干的伍派。 我是一名探鬼主播,決...
    沈念sama閱讀 40,135評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了席楚?” 一聲冷哼從身側(cè)響起茬祷,我...
    開封第一講書人閱讀 38,992評論 0 275
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,429評論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡灼擂,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,636評論 3 334
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了觉至。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片剔应。...
    茶點(diǎn)故事閱讀 39,785評論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖康谆,靈堂內(nèi)的尸體忽然破棺而出领斥,到底是詐尸還是另有隱情,我是刑警寧澤沃暗,帶...
    沈念sama閱讀 35,492評論 5 345
  • 正文 年R本政府宣布月洛,位于F島的核電站,受9級特大地震影響孽锥,放射性物質(zhì)發(fā)生泄漏嚼黔。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,092評論 3 328
  • 文/蒙蒙 一惜辑、第九天 我趴在偏房一處隱蔽的房頂上張望唬涧。 院中可真熱鬧,春花似錦盛撑、人聲如沸碎节。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,723評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽狮荔。三九已至,卻和暖如春介粘,著一層夾襖步出監(jiān)牢的瞬間殖氏,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,858評論 1 269
  • 我被黑心中介騙來泰國打工姻采, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留雅采,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,891評論 2 370
  • 正文 我出身青樓,卻偏偏與公主長得像婚瓜,于是被迫代替她去往敵國和親宝鼓。 傳聞我的和親對象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,713評論 2 354