這兩天利用業(yè)余時間終于是把自己手頭所有的文章(QQ空間)做了一個大致的備份暂刘。
過程曲折復雜,想了許多招數(shù)終于有了一個初步的結果捂刺。 事情剛剛完成谣拣,完成之后只有感慨,真是不容易那族展。
簡單敘述一下整個過程森缠,免得以后要做第二次備份,又忘記了怎么做仪缸。
首先打開自己的空間頁面贵涵,切換到日志一頁,就遇到了第一個難題恰画。如圖宾茂,我現(xiàn)在的總數(shù)是175頁,而每頁顯示15篇日志拴还,也就是說總日志數(shù)可以計算得到是2625篇跨晴,和實際值2616篇相差不多。這2616篇如果采用手動復制...片林,實在是一個太過恐怖的過程端盆。即使你一個小時能夠完成30篇,2616篇/30篇=87.2小時拇厢,光是復制下來的工作量就是整整四天爱谁,這還不帶休息的,也不能避免出錯孝偎。那么也就是說必須想出來一個辦法访敌,能夠非常好的解決復制問題。怎么辦呢衣盾?
好在右鍵點擊每篇文章的標題后寺旺,會右鍵出現(xiàn)一個“復制鏈接地址”的選項爷抓,點擊復制最終會復制下來這么一串鏈接“http://user.qzone.qq.com/xxxxxxxx/blog/1547974001”,其中blog前邊的那串號碼xxxxxx就是本人的qq號阻塑,而blog后邊的這串數(shù)字則是為這篇文章分配的一個id號蓝撇,如果你右鍵使用Chrome瀏覽器的“審查元素”功能,就會發(fā)現(xiàn)這串號碼實際上叫做bolgid陈莽,很明顯就是日志的id號了渤昌。但是你去點擊相鄰的兩個標題,發(fā)現(xiàn)它們的號碼實際上并不連著走搁,也就是說1547004001前并非是1547004000的號碼独柑,這個是怎么回事呢?我們留到后邊再說私植。
有了這個思路忌栅,應該怎么做呢?手動復制所有的日志id號曲稼?
不索绪,2600多個id號也夠你受的,只能想別的方法了贫悄,首先想到的是使用迅雷的“下載所有鏈接功能”瑞驱,然而下載迅雷后網頁上點擊并非此選項。最后只能用自己平常玩兒游戲作弊用的一個工具——按鍵精靈來實現(xiàn)半自動化操作了清女。具體方法就是首先錄制一個自己操作復制的過程钱烟,然后設置熱鍵,讓其不斷重復嫡丙,直至把所有的id都保存到一個文本文件中拴袭。但這其中也有些小的問題,比如在鼠標點擊的時候鼠標的位置不能太靠標題左邊也不能太靠標題右邊曙博。這是因為當初寫日志的時候拥刻,有的文章名字長,有的文章名字短父泳。因此得掌握位置般哼。如果當時寫文章時,統(tǒng)一用的是非常規(guī)范的標題惠窄,比如”隨筆(111)——xxx“蒸眠,這樣在后續(xù)操作的時候會方便非常多,因此以后也得記住這個竅門杆融,不胡亂給文章取名了楞卡。這一步可能用三四個小時就能夠完成,最終得到的就是如下的一個文本文件:
“http://user.qzone.qq.com/xxxxxxxx/blog/1547974361
“http://user.qzone.qq.com/xxxxxxxx/blog/1547974361
“http://user.qzone.qq.com/xxxxxxxx/blog/1547974361
“http://user.qzone.qq.com/xxxxxxxx/blog/1547974361”
這個文件的行數(shù)理論上應該等于你的文章總數(shù)量,但是由于操作的時候難免有失誤蒋腮,因此有可能出現(xiàn)數(shù)量不一致的情況淘捡,比如我這次復制完畢了,使用excel進行了一次去重池摧,最終驚訝的發(fā)現(xiàn)總數(shù)應該是2600多焦除,但實際上我復制完畢的文本文件只有2400多篇,這是使用這種半自動化工具的一個弊端作彤,或者說是我們不太熟悉這些工具所以發(fā)生的情況膘魄,如果有更加快捷的方法直接讀取什么接口之類,大約會迅速的多宦棺,而且不會有失誤瓣距。
總之黔帕,獲取完畢文本文件后就可以進行下一步操作了代咸。這步需要使用到bat批處理文件。里邊的命令如下:
@echo off
pause
pause
pause
start chrome.exehttp://user.qzone.qq.com/xxxxxxx/blog/1328000004
start chrome.exehttp://user.qzone.qq.com/xxxxxxx/blog/1370000001”
“
一眼就能夠看出成黄,這個的主要目的是讓Chrome瀏覽器一次打開多個標簽頁呐芥,我測試發(fā)現(xiàn),一次打開100個是可以的奋岁。打開之后就又要使用到按鍵精靈了思瘟,更準確來說,是使用按鍵精靈來操作Chrome的另存為pdf功能闻伶。
使用按鍵精靈依次操作”復制blogid“滨攻、”保存“、”將blogid“粘貼在對話框中作為文件名等操作蓝翰。這樣就完成了一次保存操作光绕,而后再關閉當前標簽頁,繼續(xù)操作下一個標簽頁畜份,以此類推诞帐。
最終就會存儲完畢所有的單篇pdf文件。如下圖所示:
繼續(xù)下一步爆雹,單篇算是存下來了停蕉,但如果你要在kindle上閱讀,這樣放進去钙态,就會出現(xiàn)2600篇單獨的文章慧起,沒法弄,得繼續(xù)操作册倒。使用”福昕PDF編輯器
“中的文件合并功能蚓挤,將若干個文件合成一個pdf。我一般是150篇合為一篇,這樣下來屈尼,就是下邊的這個樣子:
然后把每個合集文件命名册着,2600篇就成了總共17個文件。再把日期信息加入到標題中脾歧,方便以后進行一些編輯操作甲捏。這個已經就可以當作存檔備份保存了,主要目的是防丟失鞭执。要哪天遇到個特殊情況司顿,騰訊關閉了qq空間,里邊的東西全部丟失兄纺,這個情景大溜,我真是想都不敢想。這簡直就像大唐在風雨飄搖中不斷丟失各處領土一般估脆,多恐怖痛心哪钦奋?
再下一步,要是要閱讀自己的大作疙赠,用電腦肯定是不方便付材。所以得轉換格式,把東西放到Kindle里邊圃阳,這就要用到一個叫做calibre的軟件厌衔,如下所示:
使用這個軟件操作后,上邊顯示的16個合集文件就轉換成為mobi格式捍岳,可以在Kindle當中閱讀了富寿。當然,顯示效果相比網絡上那些好的電子書還是需要進一步提升的锣夹。kindle閱讀效果如下所示:
以上就是全部將QQ空間日志轉移到Kindle當中閱讀的方法页徐。以后還需要進一步改進采盒。