如何將億行數(shù)據(jù)的Excel文件導(dǎo)入Mysql數(shù)據(jù)庫

最近有位老鐵输瓜，他手頭上有四百多個(gè)Excel文件，每個(gè)文件的記錄數(shù)都達(dá)到百萬行左右猿规，他很苦惱衷快，因?yàn)橄氚堰@些文件都合并到一起，但Excel最大的記錄數(shù)是1048576姨俩，他沒有辦法烦磁，所以咨詢我，看有什么方法可以做到把這些記錄都合并到一起哼勇。

我給他推薦的方案是，使用Python + Mysql, 實(shí)現(xiàn)Excel數(shù)據(jù)的自動(dòng)讀取和數(shù)據(jù)導(dǎo)入呕乎。

平均200M的Excel文件公有474個(gè)

為了方便使用Python积担，安裝了Anaconda,做Python的環(huán)境管理；安裝了MySQL的社區(qū)版和Workbench猬仁，方便對數(shù)據(jù)的操作帝璧。

Anaconda可以直接到官網(wǎng)上下載，下載后安裝到電腦上就可以湿刽，安裝過程就不細(xì)說的烁；MySQL也可以到官網(wǎng)上下載，下載后安裝到電腦上诈闺，這里需要注意的是渴庆，安裝開發(fā)者版本，里面包含了數(shù)據(jù)庫實(shí)例和Workbench等工具雅镊。

我重點(diǎn)說下Python代碼襟雷，如何使用Pandas庫讀取Excel,批量寫入Mysql數(shù)據(jù)庫。

首先打開Anaconda Navigator, 然后再打開Jupyter notebook,檢查環(huán)境里是否包括了如下Python庫：

1）Pandas仁烹；

2）sqlalchemy耸弄；

3）openpyxl.

-Panda 庫用是用來處理Excel的;

-Sqlalchemy用來管理Mysql,

-Openpyxl用來讀取xlsx后綴的大數(shù)據(jù)量Excel文件。

如果某個(gè)庫不存在的話卓缰，可以通過Anaconda prompt來安裝计呈，舉例砰诵，命令行輸入pip install openpyxl。

如果所有庫都準(zhǔn)備好后捌显，新建一個(gè)Python 3腳本文件茁彭，輸入如下代碼

#引入之前安裝好的python庫

import pandas as pd

import os

from sqlalchemy import create_engine

import datetime

#遍歷存放Excel文件的目錄，獲取Excel文件的絕對路徑

path = r'D:/data/2'

files = os.listdir(path)

for i in files:

path1 = path + '/' + i

print(path1)

#因?yàn)槲募喜⒑笫怯邢群蟠涡虻奈辏陨厦娴拇a會(huì)把文件的名字打印出來尉间，可以

#檢查文件名的排序是否正確

#檢查完文件名排序正確后，創(chuàng)建MySQL連接器

engine = create_engine('mysql+pymysql://root:~1Qaz2Wsx@localhost/fang?charset=utf8MB4')

conn = engine.connect()

#為了記錄已經(jīng)導(dǎo)入Excel文件的個(gè)數(shù)击罪，先定義一個(gè)文件數(shù)的變量

file_number = 0

#通過遍歷所有的Excel文件哲嘲，把Excel里的數(shù)據(jù)都導(dǎo)入到MySQL數(shù)據(jù)庫里

for i in files:

path1 = path + '/'+I #i是文件名

print(path1)

starttime = datetime.datetime.now() #記錄開始時(shí)間

print(starttime)

data = pd.read_excel(path1,engine = 'openpyxl',header =

3,usecols='A:AR')

#header指從第4行開始，并以第4行作為列頭媳禁，usecols指只讀取從A列到AR列的數(shù)據(jù)眠副，其他列的數(shù)據(jù)都不要，openpyxl指使用大數(shù)#據(jù)量的引擎竣稽，

把數(shù)據(jù)從Excel里讀入內(nèi)存里的Pandas Dataframe

data.to_sql(name='mdg',con=conn,index=False,if_exists='append') #然后再把數(shù)據(jù)從data frame導(dǎo)入到mysql

endtime = datetime.datetime.now() #完成后囱怕，打印完成時(shí)間

print(endtime)

duration = endtime - starttime #計(jì)算單個(gè)文件導(dǎo)入消耗時(shí)間（秒）

print(duration.seconds)

代碼執(zhí)行過程會(huì)產(chǎn)生日志

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個(gè)濱河市毫别，隨后出現(xiàn)的幾起案子娃弓，更是在濱河造成了極大的恐慌，老刑警劉巖岛宦，帶你破解...
沈念sama閱讀 221,820評論 6贊 515
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件台丛，死亡現(xiàn)場離奇詭異件已，居然都是意外死亡个绍，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 94,648評論 3贊 399
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門所意，熙熙樓的掌柜王于貴愁眉苦臉地迎上來变汪，“玉大人侠坎，你說我怎么就攤上這事∪苟埽” “怎么了实胸？”我有些...
開封第一講書人閱讀 168,324評論 0贊 360
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長番官。經(jīng)常有香客問我童芹，道長，這世上最難降的妖魔是什么鲤拿？我笑而不...
開封第一講書人閱讀 59,714評論 1贊 297
?港島之戀（遺憾婚禮）
正文為了忘掉前任假褪，我火速辦了婚禮，結(jié)果婚禮上近顷，老公的妹妹穿的比我還像新娘生音。我一直安慰自己宁否，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 68,724評論 6贊 397
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布缀遍。她就那樣靜靜地躺著慕匠，像睡著了一般。火紅的嫁衣襯著肌膚如雪域醇。梳的紋絲不亂的頭發(fā)上台谊，一...
開封第一講書人閱讀 52,328評論 1贊 310
城市分裂傳說
那天，我揣著相機(jī)與錄音譬挚，去河邊找鬼锅铅。笑死，一個(gè)胖子當(dāng)著我的面吹牛减宣，可吹牛的內(nèi)容都是我干的盐须。我是一名探鬼主播，決...
沈念sama閱讀 40,897評論 3贊 421
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼漆腌，長吁一口氣：“原來是場噩夢啊……” “哼贼邓！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起闷尿，我...
開封第一講書人閱讀 39,804評論 0贊 276
萬榮殺人案實(shí)錄
序言：老撾萬榮一對情侶失蹤塑径，失蹤者是張志新（化名）和其女友劉穎，沒想到半個(gè)月后填具，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體晓勇，經(jīng)...
沈念sama閱讀 46,345評論 1贊 318
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 38,431評論 3贊 340
?白月光啟示錄
正文我和宋清朗相戀三年灌旧，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片绰筛。...
茶點(diǎn)故事閱讀 40,561評論 1贊 352
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡枢泰，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出铝噩，到底是詐尸還是另有隱情衡蚂，我是刑警寧澤，帶...
沈念sama閱讀 36,238評論 5贊 350
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布骏庸，位于F島的核電站毛甲，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏具被。R本人自食惡果不足惜玻募，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,928評論 3贊 334
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望一姿。院中可真熱鬧七咧，春花似錦跃惫、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,417評論 0贊 24
一樁弒父案爆存，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至蝗砾，卻和暖如春先较，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背悼粮。一陣腳步聲響...
開封第一講書人閱讀 33,528評論 1贊 272
情欲美人皮
我被黑心中介騙來泰國打工闲勺，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人矮锈。一個(gè)月前我還...
沈念sama閱讀 48,983評論 3贊 376
代替公主和親
正文我出身青樓霉翔，卻偏偏與公主長得像，于是被迫代替她去往敵國和親苞笨。傳聞我的和親對象是個(gè)殘疾皇子债朵，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 45,573評論 2贊 359

如何將億行數(shù)據(jù)的Excel文件導(dǎo)入Mysql數(shù)據(jù)庫

推薦閱讀更多精彩內(nèi)容