通過 node 進行簡書內(nèi)容的遷移

簡書文章導出

在簡書的設置下面搅轿，就有一鍵導出的按鈕脊奋，可以將 markdown 全部下載到本地熬北。

413f0aa7-b164-43e9-91ae-5988eda3e4c4.jpeg

雖然下載了 markdown，但是在簡書導出內(nèi)容的時候诚隙，圖片并沒有一并導出讶隐，還是簡書內(nèi)部的圖片 URL。所以需要一些手段來進行爬取久又。

創(chuàng)建一個 node 項目

我們將下載下來的文件放到 docs 目錄下巫延，再創(chuàng)建一個 imgs 目錄來存放圖片效五。

|- jianshu
  |- docs
    |- 開發(fā)日志
      |- 01.md
      |- 02.md
  |- imgs
    |- 1.webp
    |- 2.webp
    |- 3.webp
    |- 5.webp
  |- index.js
  |- package.json

由于用到了 request 來發(fā)起請求，所以需要進行安裝炉峰。

> cd jianshu
> npm init
> yarn add request

使用 node.js 來進行圖片的爬取

下面是完整的爬取代碼畏妖。

let request = require("request");
const fs = require("fs");

// 拿到所有 md 文件路徑
const paths = recursiveQueryFile("./docs");

const allFilePaths = [];
function getFilePaths(arr) {
  arr.forEach((item) => {
    if (item.children) {
      getFilePaths(item.children);
    }
    if (item.isFile) {
      allFilePaths.push(item.path);
    }
  });
}
getFilePaths(paths.children);

// 拿到所有圖片 URL 路徑
const imgList = [];
allFilePaths.forEach((path) => {
  const data = fs.readFileSync(path, "utf-8");
  const matchResults = data.match(/!\[\S+\]\(\S+\)/g);
  if (matchResults) {
    matchResults.forEach((str) => {
      let url = str.replace(/!\[\S+\]\(/, "");
      url = url.replace(")", "");

      imgList.push(url);
    });
  }
});
console.log("imgList", imgList);

// 逐個請求 URL，并將圖片下載到本地
const map = {};
async function queryAll() {
  let i = 1;

  for (const url of imgList) {
    const imgName = `/imgs/${i}.webp`;
    map[url] = imgName;
    await request({ url }).pipe(
      fs.createWriteStream("." + imgName).on("close", (err) => {
        if (err) {
          console.log("寫入失敗", err);
        } else {
          console.log(imgName + " 寫入成功");
        }
      })
    );
    i++;
    await waitForTimeout(100);
  }
  console.log("map", map);
  await waitForTimeout(100);
  replaceUrl();
}
queryAll();

// 遍歷所有 markdown 文件疼阔，替換圖片 URL
function replaceUrl() {
  allFilePaths.forEach((path) => {
    let data = fs.readFileSync(path, "utf-8");
    if (data.match(/!\[\S+\]\(\S+\)/g)) {
      Object.keys(map).forEach((key) => {
        data = data.replace(key, map[key]);
      });
      fs.writeFileSync(path, data);
      console.log(path + " 保存完畢!");
    }
  });
}

function waitForTimeout(time) {
  return new Promise((resolve, reject) => setTimeout(resolve, time));
}

function recursiveQueryFile(path) {
  const children = fs.readdirSync(path);
  return {
    path,
    children: children.map((child) => {
      const childPath = path + "/" + child;
      const stat = fs.statSync(childPath);
      if (stat.isDirectory()) {
        return recursiveQueryFile(path + "/" + child);
      } else {
        return {
          path: childPath,
          isFile: true,
        };
      }
    }),
  };
}

實現(xiàn)步驟

遞歸讀取 docs 目錄下所有的文件名稱（非目錄）
讀取所有文件內(nèi)容戒劫，通過正則收集 markdown 的圖片鏈接寫法 [name](url) 來奶到圖片 URL
使用 request 請求圖片，并保存到 imgs 目錄下婆廊。并且為這些圖片另外去一個名稱迅细。
記錄下圖片 URL 和圖片名稱的對應關系 map。
通過對應關系 map 將所有 markdown 文件中的圖片 URL淘邻。

最后

一開始選擇簡書是因為它簡潔清爽的界面疯攒、好用的 markdown 編輯器、快速上傳圖片這三個功能列荔。后來又用上了日更的功能敬尺，堅持日更的確讓我收獲頗豐。
但是贴浙，現(xiàn)在的簡書無論是網(wǎng)頁端還是 APP 都充斥著廣告砂吞，讓人很不爽。而且再簡書上傳的圖片無法直接在其他網(wǎng)站使用崎溃，導致我往往需要上傳兩遍圖片蜻直，也是很惡心人的一點。
最近突然有了自己搞個類似簡書的網(wǎng)站的想法袁串，來避開簡書的這些惡心人的事情概而。所以選擇導出文章搬家~

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市囱修，隨后出現(xiàn)的幾起案子赎瑰，更是在濱河造成了極大的恐慌，老刑警劉巖破镰，帶你破解...
沈念sama閱讀 206,214評論 6贊 481
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件餐曼，死亡現(xiàn)場離奇詭異，居然都是意外死亡鲜漩，警方通過查閱死者的電腦和手機源譬，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 88,307評論 2贊 382
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來孕似，“玉大人踩娘，你說我怎么就攤上這事『砑溃” “怎么了养渴？”我有些...
開封第一講書人閱讀 152,543評論 0贊 341
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵雷绢，是天一觀的道長。經(jīng)常有香客問我厚脉，道長习寸，這世上最難降的妖魔是什么胶惰？我笑而不...
開封第一講書人閱讀 55,221評論 1贊 279
?港島之戀（遺憾婚禮）
正文為了忘掉前任傻工，我火速辦了婚禮，結(jié)果婚禮上孵滞，老公的妹妹穿的比我還像新娘中捆。我一直安慰自己，他們只是感情好坊饶，可當我...
茶點故事閱讀 64,224評論 5贊 371
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布泄伪。她就那樣靜靜地躺著，像睡著了一般匿级。火紅的嫁衣襯著肌膚如雪蟋滴。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 49,007評論 1贊 284
城市分裂傳說
那天痘绎，我揣著相機與錄音津函，去河邊找鬼。笑死孤页，一個胖子當著我的面吹牛尔苦，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播行施，決...
沈念sama閱讀 38,313評論 3贊 399
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼允坚，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了蛾号？” 一聲冷哼從身側(cè)響起稠项，我...
開封第一講書人閱讀 36,956評論 0贊 259
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎鲜结，沒想到半個月后皿渗，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 43,441評論 1贊 300
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡轻腺，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 35,925評論 2贊 323
?白月光啟示錄
正文我和宋清朗相戀三年乐疆，在試婚紗的時候發(fā)現(xiàn)自己被綠了。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片贬养。...
茶點故事閱讀 38,018評論 1贊 333
活死人
序言：一個原本活蹦亂跳的男人離奇死亡挤土，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出误算，到底是詐尸還是另有隱情仰美，我是刑警寧澤迷殿，帶...
沈念sama閱讀 33,685評論 4贊 322
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站咖杂，受9級特大地震影響庆寺，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜诉字，卻給世界環(huán)境...
茶點故事閱讀 39,234評論 3贊 307
男人毒藥：我在死后第九天來索命
文/蒙蒙一懦尝、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧壤圃，春花似錦陵霉、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,240評論 0贊 19
一樁弒父案踊挠，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至冲杀，卻和暖如春效床，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背权谁。一陣腳步聲響...
開封第一講書人閱讀 31,464評論 1贊 261
情欲美人皮
我被黑心中介騙來泰國打工剩檀，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人闯传。一個月前我還...
沈念sama閱讀 45,467評論 2贊 352
代替公主和親
正文我出身青樓谨朝，卻偏偏與公主長得像，于是被迫代替她去往敵國和親甥绿。傳聞我的和親對象是個殘疾皇子字币，可洞房花燭夜當晚...
茶點故事閱讀 42,762評論 2贊 345

通過 node 進行簡書內(nèi)容的遷移

簡書文章導出

創(chuàng)建一個 node 項目

使用 node.js 來進行圖片的爬取

最后

推薦閱讀更多精彩內(nèi)容