PDF轉(zhuǎn)換為TXT

手上有一批pdf的文件大約6萬份需要轉(zhuǎn)成txt惕澎，嘗試了很多方法。列出來供參考：

1. 利用付費(fèi)軟件轉(zhuǎn)換

使用了迅捷PDF轉(zhuǎn)換器，買了永久會(huì)員，該轉(zhuǎn)換方法的好處是操作簡(jiǎn)單婚被，缺點(diǎn)在于免費(fèi)一次只能轉(zhuǎn)5頁(yè)，買了會(huì)員之后也一次只能轉(zhuǎn)換200個(gè)文件，小批量文件比較適合。

2. 利用python進(jìn)行轉(zhuǎn)換

python轉(zhuǎn)換主要利用了王樹義老師提供的方法PDF批量轉(zhuǎn)換碴犬，該方法基于python3中的pdfminer.six包進(jìn)行提取，可以做到批量轉(zhuǎn)換梆暮。但是由于我的PDF文件可能有點(diǎn)問題總是報(bào)錯(cuò)說文件格式不是PDF服协。也查了一些其他的轉(zhuǎn)換包，好像對(duì)中文支持都不好啦粹，沒有進(jìn)一步嘗試偿荷。

anaconda在裝上pdfminer.six包之后按照王樹義老師給出的代碼導(dǎo)入包時(shí)出現(xiàn)ModuleNotFoundError，檢查后發(fā)現(xiàn)以前裝了pdfminer3k的包唠椭，其實(shí)兩個(gè)包代碼功能都差不多跳纳，但是個(gè)別模塊名字有差異。如果一直出現(xiàn)ModuleNotFoundError泪蔫，可以嘗試卸載兩個(gè)包后再重新按照棒旗。

3. 在linux系統(tǒng)中轉(zhuǎn)換

實(shí)在走投無路之后，偶然在知乎上看到一個(gè)方法撩荣，并利用這種方法成功轉(zhuǎn)換铣揉。

由于我使用的是windows10系統(tǒng)，因此首先安裝了vmware以及ubuntu的虛擬機(jī)餐曹，之后在終端執(zhí)行以下命令即可：

```

for f in `ls *.pdf`

do pdftotext "$f"

done?

```

以上為嘗試的三種比較方便的轉(zhuǎn)換方法逛拱，當(dāng)然如果只是轉(zhuǎn)單個(gè)文件直接右擊PDF文件利用word2016以上版本打開，即可轉(zhuǎn)換台猴。

最后編輯于：2020.02.06 11:56:22

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末朽合，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子饱狂，更是在濱河造成了極大的恐慌曹步，老刑警劉巖，帶你破解...
沈念sama閱讀 218,036評(píng)論 6贊 506
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件休讳，死亡現(xiàn)場(chǎng)離奇詭異讲婚，居然都是意外死亡，警方通過查閱死者的電腦和手機(jī)俊柔，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,046評(píng)論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門筹麸，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人雏婶，你說我怎么就攤上這事物赶。” “怎么了留晚？”我有些...
開封第一講書人閱讀 164,411評(píng)論 0贊 354
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵酵紫，是天一觀的道長(zhǎng)。經(jīng)常有香客問我，道長(zhǎng)奖地，這世上最難降的妖魔是什么状蜗？我笑而不...
開封第一講書人閱讀 58,622評(píng)論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮鹉动，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘宏邮。我一直安慰自己泽示，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 67,661評(píng)論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布蜜氨。她就那樣靜靜地躺著械筛，像睡著了一般。火紅的嫁衣襯著肌膚如雪飒炎。梳的紋絲不亂的頭發(fā)上埋哟，一...
開封第一講書人閱讀 51,521評(píng)論 1贊 304
城市分裂傳說
那天，我揣著相機(jī)與錄音郎汪，去河邊找鬼赤赊。笑死，一個(gè)胖子當(dāng)著我的面吹牛煞赢，可吹牛的內(nèi)容都是我干的抛计。我是一名探鬼主播，決...
沈念sama閱讀 40,288評(píng)論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼照筑，長(zhǎng)吁一口氣：“原來是場(chǎng)噩夢(mèng)啊……” “哼吹截！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起凝危，我...
開封第一講書人閱讀 39,200評(píng)論 0贊 276
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤波俄，失蹤者是張志新（化名）和其女友劉穎，沒想到半個(gè)月后蛾默，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體懦铺，經(jīng)...
沈念sama閱讀 45,644評(píng)論 1贊 314
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,837評(píng)論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年趴生，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了阀趴。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 39,953評(píng)論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡苍匆，死狀恐怖刘急，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情浸踩，我是刑警寧澤叔汁，帶...
沈念sama閱讀 35,673評(píng)論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站，受9級(jí)特大地震影響据块，放射性物質(zhì)發(fā)生泄漏码邻。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,281評(píng)論 3贊 329
男人毒藥：我在死后第九天來索命
文/蒙蒙一另假、第九天我趴在偏房一處隱蔽的房頂上張望像屋。院中可真熱鬧，春花似錦边篮、人聲如沸己莺。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,889評(píng)論 0贊 22
一樁弒父案戈轿，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)凌受。三九已至，卻和暖如春思杯，著一層夾襖步出監(jiān)牢的瞬間胜蛉，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 33,011評(píng)論 1贊 269
情欲美人皮
我被黑心中介騙來泰國(guó)打工色乾，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留誊册，地道東北人。一個(gè)月前我還...
沈念sama閱讀 48,119評(píng)論 3贊 370
代替公主和親
正文我出身青樓杈湾，卻偏偏與公主長(zhǎng)得像解虱，于是被迫代替她去往敵國(guó)和親。傳聞我的和親對(duì)象是個(gè)殘疾皇子漆撞，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,901評(píng)論 2贊 355

PDF轉(zhuǎn)換為TXT

1. 利用付費(fèi)軟件轉(zhuǎn)換

2. 利用python進(jìn)行轉(zhuǎn)換

3. 在linux系統(tǒng)中轉(zhuǎn)換

推薦閱讀更多精彩內(nèi)容