everyday:linux wget

everyday:linux wget

功能說明

  • wget是一個下載文件的工具,它用于命令行下。可以通過它咕娄,下載一些軟件或從遠程服務器恢復備份到本地服務器。
  • wget支持HTTP珊擂,HTTPS和FTP協(xié)議圣勒,可以使用HTTP代理。
  • 所謂的自動下載是指摧扇,wget可以在用戶退出系統(tǒng)的之后在后臺執(zhí)行灾而。
  • wget 可以跟蹤HTML頁面上的鏈接依次下載來創(chuàng)建遠程服務器的本地版本,完全重建原始站點的目錄結構扳剿。這又常被稱作”遞歸下載”旁趟。在遞歸下載的時候,wget 遵循Robot Exclusion標準(/robots.txt). wget可以在下載的同時庇绽,將鏈接轉換成指向本地文件锡搜,以方便離線瀏覽。
  • wget 非常穩(wěn)定瞧掺,它在帶寬很窄的情況下和不穩(wěn)定網(wǎng)絡中有很強的適應性.如果是由于網(wǎng)絡的原因下載失敗耕餐,wget會不斷的嘗試,直到整個文件下載完畢辟狈。如果是服務器打斷下載過程肠缔,它會再次聯(lián)到服務器上從停止的地方繼續(xù)下載。這對從那些限定了鏈接時間的服務器上下載大文件非常有用哼转。

命令詳解

  1. 命令格式
    wget [參數(shù)] [URL地址]
  2. 命令功能
    用于從網(wǎng)絡上下載資源明未,沒有指定目錄,下載資源會默認為當前目錄壹蔓。wget雖然功能強大趟妥,但是使用起來還是比較簡單:
  3. 支持斷點下載功能;
  4. 同時支持FTP和HTTP下載方式佣蓉;盡管現(xiàn)在大部分軟件披摄,可以使用HTTP方式下載亲雪,但是,有些時候疚膊,仍然需要使用FTP方式下載軟件义辕;
  5. 支持代理服務器;對安全強度很高的系統(tǒng)而言寓盗,一般不會將自己的系統(tǒng)直接暴露在互聯(lián)網(wǎng)上终息,所以,支持代理是下載軟件必須有的功能贞让;
  6. 設置方便簡單周崭;命令行在設置上其實有更多的優(yōu)點,最少喳张,鼠標可以少點很多次续镇,也不要擔心是否錯點鼠標;
  7. 程序小销部,完全免費摸航。
  8. 命令參數(shù)
    • 啟動
    -V, –version 顯示wget的版本后退出
    -h, –help 打印語法幫助
    -b, –background 啟動后轉入后臺執(zhí)行
    -e, –execute=COMMAND 執(zhí)行`.wgetrc’格式的命令,wgetrc格式參見/etc/wgetrc或~/.wgetrc
- **記錄和輸入文件**
    -o, –output-file=FILE 把記錄寫到FILE文件中
  -a, –append-output=FILE 把記錄追加到FILE文件中
  -d, –debug 打印調試輸出
  -q, –quiet 安靜模式(沒有輸出)
  -v, –verbose 冗長模式(這是缺省設置)
  -nv, –non-verbose 關掉冗長模式舅桩,但不是安靜模式
  -i, –input-file=FILE 下載在FILE文件中出現(xiàn)的URLs
  -F, –force-html 把輸入文件當作HTML格式文件對待
  -B, –base=URL 將URL作為在-F -i參數(shù)指定的文件中出現(xiàn)的相對鏈接的前綴
  –sslcertfile=FILE 可選客戶端證書
  –sslcertkey=KEYFILE 可選客戶端證書的KEYFILE
  –egd-file=FILE 指定EGD socket的文件名
- **下載**
    –bind-address=ADDRESS 指定本地使用地址(主機名或IP酱虎,當本地有多個IP或名字時使用)
  -t, –tries=NUMBER 設定最大嘗試鏈接次數(shù)(0 表示無限制).
  -O –output-document=FILE 把文檔寫到FILE文件中
  -nc, –no-clobber 不要覆蓋存在的文件或使用.#前綴
  -c, –continue 接著下載沒下載完的文件
  –progress=TYPE 設定進程條標記
  -N, –timestamping 不要重新下載文件除非比本地文件新
  -S, –server-response 打印服務器的回應
  –spider 不下載任何東西
  -T, –timeout=SECONDS 設定響應超時的秒數(shù)
  -w, –wait=SECONDS 兩次嘗試之間間隔SECONDS秒
  –waitretry=SECONDS 在重新鏈接之間等待1…SECONDS秒
  –random-wait 在下載之間等待0…2*WAIT秒
  -Y, –proxy=on/off 打開或關閉代理
  -Q, –quota=NUMBER 設置下載的容量限制
  –limit-rate=RATE 限定下載輸率
- **目錄**
    -nd –no-directories 不創(chuàng)建目錄
  -x, –force-directories 強制創(chuàng)建目錄
  -nH, –no-host-directories 不創(chuàng)建主機目錄
  -P, –directory-prefix=PREFIX 將文件保存到目錄 PREFIX/…
  –cut-dirs=NUMBER 忽略 NUMBER層遠程目錄
- **HTTP選項**
    –http-user=USER 設定HTTP用戶名為 USER.
  –http-passwd=PASS 設定http密碼為 PASS
  -C, –cache=on/off 允許/不允許服務器端的數(shù)據(jù)緩存 (一般情況下允許)
  -E, –html-extension 將所有text/html文檔以.html擴展名保存
  –ignore-length 忽略 `Content-Length’頭域
  –header=STRING 在headers中插入字符串 STRING
  –proxy-user=USER 設定代理的用戶名為 USER
  –proxy-passwd=PASS 設定代理的密碼為 PASS
  –referer=URL 在HTTP請求中包含 `Referer: URL’頭
  -s, –save-headers 保存HTTP頭到文件
  -U, –user-agent=AGENT 設定代理的名稱為 AGENT而不是 Wget/VERSION
  –no-http-keep-alive 關閉 HTTP活動鏈接 (永遠鏈接)
  –cookies=off 不使用 cookies
  –load-cookies=FILE 在開始會話前從文件 FILE中加載cookie
  –save-cookies=FILE 在會話結束后將 cookies保存到 FILE文件中
- **FTP選項**
    -nr, –dont-remove-listing 不移走 `.listing’文件
  -g, –glob=on/off 打開或關閉文件名的 globbing機制
  –passive-ftp 使用被動傳輸模式 (缺省值).
  –active-ftp 使用主動傳輸模式
  –retr-symlinks 在遞歸的時候,將鏈接指向文件(而不是目錄)
- **遞歸下載**
    -r, –recursive 遞歸下載--慎用!
  -l, –level=NUMBER 最大遞歸深度 (inf 或 0 代表無窮)
  –delete-after 在現(xiàn)在完畢后局部刪除文件
  -k, –convert-links 轉換非相對鏈接為相對鏈接
  -K, –backup-converted 在轉換文件X之前擂涛,將之備份為 X.orig
  -m, –mirror 等價于 -r -N -l inf -nr
  -p, –page-requisites 下載顯示HTML文件的所有圖片
- **遞歸下載中的包含和不包含(accept/reject)**
    -A, –accept=LIST 分號分隔的被接受擴展名的列表
  -R, –reject=LIST 分號分隔的不被接受的擴展名的列表
  -D, –domains=LIST 分號分隔的被接受域的列表
  –exclude-domains=LIST 分號分隔的不被接受的域的列表
  –follow-ftp 跟蹤HTML文檔中的FTP鏈接
  –follow-tags=LIST 分號分隔的被跟蹤的HTML標簽的列表
  -G, –ignore-tags=LIST 分號分隔的被忽略的HTML標簽的列表
  -H, –span-hosts 當遞歸時轉到外部主機
  -L, –relative 僅僅跟蹤相對鏈接
  -I, –include-directories=LIST 允許目錄的列表
  -X, –exclude-directories=LIST 不被包含目錄的列表
  -np, –no-parent 不要追溯到父目錄
  wget -S –spider url 不下載只顯示過程
  1. 舉例
    • eg1 使用wget下載單個文件
        // 從網(wǎng)絡下載一個文件并保存在當前目錄读串,在下載的過程中會顯示進度條,包含(下載完成百分比撒妈,已經(jīng)下載的字節(jié)恢暖,當前下載速度,剩余下載時間)狰右。
    wget http://image.beekka.com/blog/201109/bg2011091201.jpg
+ eg2 使用wget -O下載并以不同的文件名保存
        // wget默認會以最后一個符合”/”的后面的字符來命令杰捂,對于動態(tài)鏈接的下載通常文件名會不正確。
    // 為了解決這個問題棋蚌,可以使用參數(shù)-O來指定一個文件名
    wget -O bg2011091201.jpg http://image.beekka.com/blog/201109?id=89
+ eg3 使用wget --limit-rate限速下載
        // 執(zhí)行wget的時候嫁佳,它默認會占用全部可能的寬帶下載。
    // 當準備下載一個大文件谷暮,而還需要下載其它文件時蒿往,就有必要進行限速了。
    wget --limit-rate=300k http://image.beekka.com/blog/201109/bg2011091201.jpg
+ eg4 使用wget -c斷點續(xù)傳
        // 使用wget -c重新啟動下載中斷的文件坷备,對于下載大文件時熄浓,突然由于網(wǎng)絡等原因中斷,是非常有幫助省撑,可以斷續(xù)接著下載而不是重新下載一個文件赌蔑。
    // 需要繼續(xù)中斷的下載時可以使用-c參數(shù)。
    wget -c http://image.beekka.com/blog/201109/bg2011091201.jpg
+ eg5 使用wget -b后臺下載
    // 對于下載非常大的文件的時候竟秫,可以使用參數(shù)-b進行后臺下載娃惯。
    wget -b http://image.beekka.com/blog/201109/bg2011091201.jpg
    Continuing in background, pid 1840.
    Output will be written to `wget-log'.

    // 以使用以下命令來察看下載進度:
    tail -f wget-log
+ eg6 偽裝代理名稱下載
    // 有些網(wǎng)站能通過根據(jù)判斷代理名稱不是瀏覽器而拒絕下載請求。不過可以通過–user-agent參數(shù)偽裝代理名稱肥败。
    wget --user-agent="Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US) AppleWebKit/534.16 (KHTML, like Gecko) Chrome/10.0.648.204 Safari/534.16" http://image.beekka.com/blog/201109/bg2011091201.jpg
+ eg7 使用wget --spider測試下載鏈接
      // 當打算進行定時下載時趾浅,應該在預定時間測試下載鏈接是否有效÷裕可以增加–spider參數(shù)進行檢查皿哨。
    wget --spider url

    # 可以在以下幾種情況下使用spider參數(shù):
       1. 定時下載之前進行檢查
       2. 間隔檢測網(wǎng)站是否可用
       3. 檢查網(wǎng)站頁面的死鏈接
+ eg8 使用wget --tries增加重試次數(shù)
    // 網(wǎng)絡有問題或下載一個大文件時,有可能會失敗纽谒。
    // wget默認重試20次連接下載文件证膨。
    // 如果需要,可以使用–tries增加重試次數(shù)鼓黔。
    wget --tries=40 url
+ eg9 使用wget -i下載多個文件
    // 保存一份下載鏈接文件
    cat > filelist.txt
    url1
    url2
    url3
    url4
    // 使用這個文件和參數(shù)-i下載多個文件
    wget -i filelist.txt
+ eg10 使用wget --mirror鏡像網(wǎng)站
    wget --mirror -p --convert-links -P ./LOCAL url
    mem:
    --mirror 開啟鏡像下載
    -p 下載所有為了html頁面顯示正常的文件
    --convert-links 下載后央勒,轉換成本地的鏈接
    P ./LOCAL 保存所有文件和目錄到本地指定目錄
+ eg11 使用wget --reject過濾指定格式下載
    // 下載一個網(wǎng)站,但是不希望下載圖片澳化,可以使用以下命令崔步。
    wget --reject=gif url
+ eg12 使用wget -o把下載信息存入日志文件
    // 不希望下載信息直接顯示在終端而是存入一個日志文件
    wget -o download.log url
+ eg13 使用wget -Q限制總下載文件大小
    // 保存一份下載鏈接文件
    cat > filelist.txt
    url1
    url2
    url3
    url4
    // 當要下載的文件超過5M,而退出下載缎谷。注意:這個參數(shù)對單個文件下載不起作用井濒,只能遞歸下載時才有效。
    wget -Q5m -i filelist.txt
+ eg14 使用wget -r -A下載指定格式文件
      # 以下情況使用該功能:
      1. 下載一個網(wǎng)站的所有圖片
      2. 下載一個網(wǎng)站的所有視頻
      3. 下載一個網(wǎng)站的所有PDF文件
      wget -r -A .pdf url
+ eg15 使用wget FTP下載
    // 使用wget用戶名和密碼認證的ftp下載
    wget --ftp-user=USERNAME --ftp-password=PASSWORD url
    // 使用wget匿名ftp下載
    wget ftp-url
  1. 編譯安裝
    tar zxvf wget-1.9.1.tar.gz 
    cd wget-1.9.1
    ./configure
    sudo make
    sudo make install
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末列林,一起剝皮案震驚了整個濱河市眼虱,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌席纽,老刑警劉巖捏悬,帶你破解...
    沈念sama閱讀 218,284評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異润梯,居然都是意外死亡过牙,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,115評論 3 395
  • 文/潘曉璐 我一進店門纺铭,熙熙樓的掌柜王于貴愁眉苦臉地迎上來寇钉,“玉大人,你說我怎么就攤上這事舶赔∩ǔ” “怎么了?”我有些...
    開封第一講書人閱讀 164,614評論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長撵溃。 經(jīng)常有香客問我疚鲤,道長,這世上最難降的妖魔是什么缘挑? 我笑而不...
    開封第一講書人閱讀 58,671評論 1 293
  • 正文 為了忘掉前任集歇,我火速辦了婚禮,結果婚禮上语淘,老公的妹妹穿的比我還像新娘诲宇。我一直安慰自己,他們只是感情好惶翻,可當我...
    茶點故事閱讀 67,699評論 6 392
  • 文/花漫 我一把揭開白布姑蓝。 她就那樣靜靜地躺著,像睡著了一般吕粗。 火紅的嫁衣襯著肌膚如雪纺荧。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,562評論 1 305
  • 那天溯泣,我揣著相機與錄音虐秋,去河邊找鬼。 笑死垃沦,一個胖子當著我的面吹牛客给,可吹牛的內容都是我干的。 我是一名探鬼主播肢簿,決...
    沈念sama閱讀 40,309評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼靶剑,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了池充?” 一聲冷哼從身側響起桩引,我...
    開封第一講書人閱讀 39,223評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎收夸,沒想到半個月后坑匠,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,668評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡卧惜,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 37,859評論 3 336
  • 正文 我和宋清朗相戀三年厘灼,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片咽瓷。...
    茶點故事閱讀 39,981評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡设凹,死狀恐怖,靈堂內的尸體忽然破棺而出茅姜,到底是詐尸還是另有隱情闪朱,我是刑警寧澤,帶...
    沈念sama閱讀 35,705評論 5 347
  • 正文 年R本政府宣布,位于F島的核電站奋姿,受9級特大地震影響锄开,放射性物質發(fā)生泄漏。R本人自食惡果不足惜胀蛮,卻給世界環(huán)境...
    茶點故事閱讀 41,310評論 3 330
  • 文/蒙蒙 一院刁、第九天 我趴在偏房一處隱蔽的房頂上張望糯钙。 院中可真熱鬧粪狼,春花似錦、人聲如沸任岸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,904評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽享潜。三九已至困鸥,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間剑按,已是汗流浹背疾就。 一陣腳步聲響...
    開封第一講書人閱讀 33,023評論 1 270
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留艺蝴,地道東北人猬腰。 一個月前我還...
    沈念sama閱讀 48,146評論 3 370
  • 正文 我出身青樓,卻偏偏與公主長得像猜敢,于是被迫代替她去往敵國和親姑荷。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 44,933評論 2 355

推薦閱讀更多精彩內容

  • Spring Cloud為開發(fā)人員提供了快速構建分布式系統(tǒng)中一些常見模式的工具(例如配置管理缩擂,服務發(fā)現(xiàn)鼠冕,斷路器,智...
    卡卡羅2017閱讀 134,657評論 18 139
  • FTP服務概述 簡單FTP構建及訪問 VSFTP服務基礎 用戶禁錮胯盯、黑白名單 FTP并發(fā)及帶寬限制 一懈费、FTP服務...
    紫_軒閱讀 7,609評論 3 25
  • Ubuntu的發(fā)音 Ubuntu趋厉,源于非洲祖魯人和科薩人的語言寨闹,發(fā)作 oo-boon-too 的音。了解發(fā)音是有意...
    螢火蟲de夢閱讀 99,271評論 9 467
  • 發(fā)現(xiàn) 關注 消息 iOS 第三方庫君账、插件繁堡、知名博客總結 作者大灰狼的小綿羊哥哥關注 2017.06.26 09:4...
    肇東周閱讀 12,103評論 4 62
  • 低頭緊鎖眉,思緒萬千。 抬頭張四目椭蹄,陌生人前闻牡。 回首來時路,憤憤不堪绳矩。 何以解憂楚罩润,唯在指間。
    南秀北雄閱讀 168評論 0 0