全棧 - 6 數(shù)據(jù) 解讀數(shù)據(jù)結(jié)構(gòu)和類(lèi)型

這是全棧數(shù)據(jù)工程師養(yǎng)成攻略系列教程的第六期:6 數(shù)據(jù) 解讀數(shù)據(jù)結(jié)構(gòu)和類(lèi)型。

數(shù)據(jù)的結(jié)構(gòu)

在DT時(shí)代党觅,我們的生活中隨處都會(huì)接觸到各種各樣的數(shù)據(jù)雌澄。以地鐵數(shù)據(jù)為例,可以分為靜態(tài)數(shù)據(jù)和動(dòng)態(tài)數(shù)據(jù)兩大類(lèi)杯瞻。

  • 靜態(tài)數(shù)據(jù):包括線路信息和站點(diǎn)信息等镐牺,例如一共有多少條線路,每條線路包含哪些站點(diǎn)魁莉,各個(gè)站點(diǎn)的名稱(chēng)睬涧、首末班車(chē)時(shí)間等信息。這類(lèi)數(shù)據(jù)一般不包含時(shí)間戳旗唁,更新頻率較低宙地,數(shù)據(jù)量整體較少;
  • 動(dòng)態(tài)數(shù)據(jù):主要是地鐵的刷卡記錄逆皮,乘客在進(jìn)站和出站時(shí)的刷卡操作都會(huì)產(chǎn)生一條刷卡記錄宅粥。這類(lèi)數(shù)據(jù)一般包含時(shí)間戳,用于說(shuō)明數(shù)據(jù)產(chǎn)生的時(shí)間电谣,并且是不斷產(chǎn)生的秽梅。

時(shí)間戳是指從1970年1月1日0時(shí)0分0秒到某一時(shí)刻所經(jīng)歷的秒數(shù)。對(duì)于同一個(gè)時(shí)刻剿牺,不同的人會(huì)有不同的表述方式企垦,即不同格式的時(shí)間文本。通過(guò)時(shí)間戳晒来,我們可以用整數(shù)或浮點(diǎn)數(shù)來(lái)表示任意一個(gè)時(shí)刻钞诡,從而便于代碼表示和計(jì)算。

大多數(shù)數(shù)據(jù)是以行和列的結(jié)構(gòu)表示的。每一行表示一條記錄荧降,或者稱(chēng)為一條觀測(cè)接箫,例如在地鐵線路數(shù)據(jù)里,每一行就表示一條線路的信息朵诫。每一列表示一個(gè)字段辛友,或者稱(chēng)為一項(xiàng)屬性,例如在地鐵線路數(shù)據(jù)里剪返,可能包含“線路名稱(chēng)”废累、“運(yùn)營(yíng)時(shí)間”、“線路顏色”等列脱盲。

因此可以用二維數(shù)組或二維表的概念來(lái)表示大多數(shù)數(shù)據(jù)邑滨,就像Excel中的表格,以及關(guān)系型數(shù)據(jù)庫(kù)中的數(shù)據(jù)表等钱反。

數(shù)據(jù)的類(lèi)型

TXT 是最常見(jiàn)的文本數(shù)據(jù)掖看,里面存放的是純文本,可以記錄任意內(nèi)容诈铛,每行的長(zhǎng)度是可變的乙各,文件的總行數(shù)也是任意的,因此非常自由幢竹。

CSV 是Comma Seperated Value耳峦,即逗號(hào)分隔值』篮粒可以將CSV理解為一種文本形式表示的二維表蹲坷,每一行代表一條記錄,每條記錄的字段數(shù)量是一致的邑飒,字段之間以逗號(hào)分隔循签。CSV可以包含一行表頭,用于說(shuō)明每個(gè)字段的名稱(chēng)疙咸,因此CSV和Excel中的表格县匠、關(guān)系型數(shù)據(jù)庫(kù)中的數(shù)據(jù)表都是類(lèi)似的,以下就是一個(gè)簡(jiǎn)單的例子撒轮。

id,name,gender,age
1,Honlan,male,24
2,Baby,female,22

JSON 是一種非常通用的數(shù)據(jù)類(lèi)型乞旦,本質(zhì)上是一種鍵值對(duì)字符串,在前端题山、后端等多種場(chǎng)景多門(mén)語(yǔ)言中都可以加載使用兰粉。如果將CSV理解為Python中的二維數(shù)組即嵌套的列表,那么就可以將JSON理解為Python中的字典顶瞳,以下就是一個(gè)簡(jiǎn)單的例子玖姑。

{"id": 1, "name": "Honlan", "gender": "male", "age": 24}

總的來(lái)說(shuō)愕秫,TXT、CSV和JSON里存的都是文本焰络,不同的只是文本的組織結(jié)構(gòu)戴甩,以及文件命名時(shí)分別使用 .txt.csv.json 作為后綴名舔琅。

SQL 是關(guān)系型數(shù)據(jù)庫(kù)文件等恐,以最常用的 MySQL 數(shù)據(jù)庫(kù)為例洲劣,MySQL中的數(shù)據(jù)庫(kù)和數(shù)據(jù)表都可以導(dǎo)出為 .sql 文件用于數(shù)據(jù)備份备蚓,而 .sql 文件也可以導(dǎo)入已有的數(shù)據(jù)庫(kù)和數(shù)據(jù)表中用于數(shù)據(jù)恢復(fù)。

后續(xù)章節(jié)中會(huì)介紹如何使用MAMP和WAMP在個(gè)人電腦上搭建Web環(huán)境囱稽,并詳細(xì)講解和MySQL數(shù)據(jù)庫(kù)相關(guān)的內(nèi)容郊尝。

視頻鏈接:解讀數(shù)據(jù)結(jié)構(gòu)和類(lèi)型

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市战惊,隨后出現(xiàn)的幾起案子流昏,更是在濱河造成了極大的恐慌,老刑警劉巖吞获,帶你破解...
    沈念sama閱讀 211,194評(píng)論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件况凉,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡各拷,警方通過(guò)查閱死者的電腦和手機(jī)刁绒,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,058評(píng)論 2 385
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)烤黍,“玉大人知市,你說(shuō)我怎么就攤上這事∷偃铮” “怎么了嫂丙?”我有些...
    開(kāi)封第一講書(shū)人閱讀 156,780評(píng)論 0 346
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)规哲。 經(jīng)常有香客問(wèn)我跟啤,道長(zhǎng),這世上最難降的妖魔是什么唉锌? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 56,388評(píng)論 1 283
  • 正文 為了忘掉前任隅肥,我火速辦了婚禮,結(jié)果婚禮上糊秆,老公的妹妹穿的比我還像新娘武福。我一直安慰自己,他們只是感情好痘番,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,430評(píng)論 5 384
  • 文/花漫 我一把揭開(kāi)白布捉片。 她就那樣靜靜地躺著平痰,像睡著了一般。 火紅的嫁衣襯著肌膚如雪伍纫。 梳的紋絲不亂的頭發(fā)上宗雇,一...
    開(kāi)封第一講書(shū)人閱讀 49,764評(píng)論 1 290
  • 那天,我揣著相機(jī)與錄音莹规,去河邊找鬼赔蒲。 笑死,一個(gè)胖子當(dāng)著我的面吹牛良漱,可吹牛的內(nèi)容都是我干的舞虱。 我是一名探鬼主播,決...
    沈念sama閱讀 38,907評(píng)論 3 406
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼母市,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼矾兜!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起患久,我...
    開(kāi)封第一講書(shū)人閱讀 37,679評(píng)論 0 266
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤椅寺,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后蒋失,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體躁锁,經(jīng)...
    沈念sama閱讀 44,122評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡亏推,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,459評(píng)論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片颠通。...
    茶點(diǎn)故事閱讀 38,605評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡馒索,死狀恐怖倘零,靈堂內(nèi)的尸體忽然破棺而出谎仲,到底是詐尸還是另有隱情,我是刑警寧澤算行,帶...
    沈念sama閱讀 34,270評(píng)論 4 329
  • 正文 年R本政府宣布梧油,位于F島的核電站,受9級(jí)特大地震影響州邢,放射性物質(zhì)發(fā)生泄漏儡陨。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,867評(píng)論 3 312
  • 文/蒙蒙 一量淌、第九天 我趴在偏房一處隱蔽的房頂上張望骗村。 院中可真熱鬧,春花似錦呀枢、人聲如沸胚股。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,734評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)琅拌。三九已至缨伊,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間进宝,已是汗流浹背刻坊。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,961評(píng)論 1 265
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留党晋,地道東北人谭胚。 一個(gè)月前我還...
    沈念sama閱讀 46,297評(píng)論 2 360
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像未玻,于是被迫代替她去往敵國(guó)和親灾而。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,472評(píng)論 2 348

推薦閱讀更多精彩內(nèi)容