數(shù)據(jù)分析案例--USDA食品數(shù)據(jù)庫(kù)

本章節(jié)以及后續(xù)章節(jié)的源碼,當(dāng)然也可以從我的github下載昆咽,在源碼中我自己加了一些中文注釋驾凶。

美國(guó)農(nóng)業(yè)部(USDA)制作了一份有關(guān)食物營(yíng)養(yǎng)信息的數(shù)據(jù)庫(kù)牙甫。JSON版如下:

????????每種食物都帶有若干標(biāo)識(shí)性屬性以及兩個(gè)有關(guān)營(yíng)養(yǎng)成分和分量的列表。這種形式的數(shù)據(jù)不是很適合分析工作调违,因此我們需要做一些規(guī)整化以使其具有更好用的形式:

????????db中的每個(gè)條目都是一個(gè)含有某種食物全部數(shù)據(jù)的字典窟哺。nutrients字段是一個(gè)字典列表,其中的每個(gè)字典對(duì)應(yīng)一種營(yíng)養(yǎng)成分:

????????在將字典列表轉(zhuǎn)換為DataFrame時(shí)翰萨,可以只抽取其中的一部分字段脏答。這里糕殉,我們將取出食物的名稱亩鬼、分類、編號(hào)以及制造商等信息:

通過(guò)value_counts阿蝶,可以查看食物類別的分布情況:

????????為了對(duì)全部營(yíng)養(yǎng)數(shù)據(jù)做一些分析雳锋,最簡(jiǎn)單的辦法是將所有食物的營(yíng)養(yǎng)成分整合到一個(gè)大表中。我們分幾個(gè)步驟來(lái)實(shí)現(xiàn)該目的羡洁。首先玷过,將各食物的營(yíng)養(yǎng)成分列表轉(zhuǎn)換為一個(gè)DataFrame,并添加一個(gè)表示編號(hào)的列筑煮,然后將該DataFrame添加到一個(gè)列表中辛蚊。最后通過(guò)concat將這些東西連接起來(lái)就可以了:

這個(gè)DataFrame中無(wú)論如何都會(huì)有一些重復(fù)項(xiàng),所以直接丟棄就可以了:

由于兩個(gè)DataFrame對(duì)象中(info 和 nutrients)都有"group"和"description"真仲,所以為了明確到底誰(shuí)是誰(shuí)袋马,需要對(duì)它們進(jìn)行重命名:

將info跟nutrients合并起來(lái):

根據(jù)食物分類和營(yíng)養(yǎng)類型畫出一張中位值圖:

根據(jù)營(yíng)養(yǎng)分類得出的鋅中位值

各營(yíng)養(yǎng)成分最為豐富的食物是什么,這里只給出"Amino Acids"營(yíng)養(yǎng)分組:

快速學(xué)習(xí):

第一節(jié) NumPy基礎(chǔ)(一)

第二節(jié) NumPy基礎(chǔ)(二)

第三節(jié) Pandas入門基礎(chǔ)

第四節(jié) 數(shù)據(jù)加載秸应、存儲(chǔ)

第五節(jié) 數(shù)據(jù)清洗

第六節(jié) 數(shù)據(jù)合并虑凛、重塑

第七節(jié) 數(shù)據(jù)聚合與分組運(yùn)算

第八節(jié) 數(shù)據(jù)可視化

第九節(jié) pandas高級(jí)應(yīng)用

第十節(jié) 時(shí)間序列

第十一節(jié) Python建模庫(kù)

數(shù)據(jù)分析案例--1880-2010年間全美嬰兒姓名的處理

數(shù)據(jù)分析案例--MovieLens 1M數(shù)據(jù)集

數(shù)據(jù)分析案例--USA.gov數(shù)據(jù)

數(shù)據(jù)分析案例--2012聯(lián)邦選舉委員會(huì)數(shù)據(jù)庫(kù)

數(shù)據(jù)分析案例--USDA食品數(shù)據(jù)庫(kù)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市软啼,隨后出現(xiàn)的幾起案子桑谍,更是在濱河造成了極大的恐慌,老刑警劉巖祸挪,帶你破解...
    沈念sama閱讀 221,406評(píng)論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件锣披,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡贿条,警方通過(guò)查閱死者的電腦和手機(jī)雹仿,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,395評(píng)論 3 398
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)闪唆,“玉大人盅粪,你說(shuō)我怎么就攤上這事∏睦伲” “怎么了票顾?”我有些...
    開封第一講書人閱讀 167,815評(píng)論 0 360
  • 文/不壞的土叔 我叫張陵础浮,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我奠骄,道長(zhǎng)豆同,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,537評(píng)論 1 296
  • 正文 為了忘掉前任含鳞,我火速辦了婚禮影锈,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘蝉绷。我一直安慰自己鸭廷,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,536評(píng)論 6 397
  • 文/花漫 我一把揭開白布熔吗。 她就那樣靜靜地躺著辆床,像睡著了一般。 火紅的嫁衣襯著肌膚如雪桅狠。 梳的紋絲不亂的頭發(fā)上讼载,一...
    開封第一講書人閱讀 52,184評(píng)論 1 308
  • 那天,我揣著相機(jī)與錄音中跌,去河邊找鬼咨堤。 笑死,一個(gè)胖子當(dāng)著我的面吹牛漩符,可吹牛的內(nèi)容都是我干的一喘。 我是一名探鬼主播,決...
    沈念sama閱讀 40,776評(píng)論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼陨仅,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼津滞!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起灼伤,我...
    開封第一講書人閱讀 39,668評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤触徐,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后狐赡,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體撞鹉,經(jīng)...
    沈念sama閱讀 46,212評(píng)論 1 319
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,299評(píng)論 3 340
  • 正文 我和宋清朗相戀三年颖侄,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了鸟雏。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,438評(píng)論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡览祖,死狀恐怖孝鹊,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情展蒂,我是刑警寧澤又活,帶...
    沈念sama閱讀 36,128評(píng)論 5 349
  • 正文 年R本政府宣布苔咪,位于F島的核電站,受9級(jí)特大地震影響柳骄,放射性物質(zhì)發(fā)生泄漏团赏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,807評(píng)論 3 333
  • 文/蒙蒙 一耐薯、第九天 我趴在偏房一處隱蔽的房頂上張望舔清。 院中可真熱鬧,春花似錦曲初、人聲如沸体谒。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,279評(píng)論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)营密。三九已至,卻和暖如春目锭,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背纷捞。 一陣腳步聲響...
    開封第一講書人閱讀 33,395評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工痢虹, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人主儡。 一個(gè)月前我還...
    沈念sama閱讀 48,827評(píng)論 3 376
  • 正文 我出身青樓奖唯,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親糜值。 傳聞我的和親對(duì)象是個(gè)殘疾皇子丰捷,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,446評(píng)論 2 359

推薦閱讀更多精彩內(nèi)容