高通量數(shù)據(jù)分析過程中涉及的中間文件低斋,在存儲量允許的前提下,可以將其暫存?zhèn)洳榉朔病Mǔ膊畴?梢詫⑦@些文件歸檔或壓縮后保存,并打上日期標(biāo)簽病游,長時間未使用的非重要數(shù)據(jù)可考慮刪除以騰出存儲空間唇跨。在此總結(jié)Linux系統(tǒng)常用的歸檔與壓縮指令稠通。
-
數(shù)據(jù)歸檔
歸檔即將多個文件(目錄)打包為一個文件,但并不對文件進(jìn)行壓縮买猖。
- 命令:tar
# 歸檔data1和data2兩個文件
tar -cvf data.tar data1.txt data2.txt
# 歸檔data目錄
tar -cvf data.tar data/
# 解包到data_new目錄
tar -xvf data.tar -C data_new
# -c 創(chuàng)建打包文件改橘,一般與-f選項一起連用
# -x 從備份文件中還原文件
# -v 顯示指令執(zhí)行過程
# -f 指定備份文件,在參數(shù)的最后
# -C 指定解包目錄
從歸檔文件中提取指定文件
# 得到所需文件的絕對路徑
tar -tvf data.tar.gz | grep LOC_05g
# 提取指定文件
tar -xvf data.tar.gz data/LOC_05g01010.xls
# -t 列出備份文件的內(nèi)容
-
數(shù)據(jù)壓縮
- 命令: tar
將歸檔后的文件進(jìn)行壓縮玉控,可指定壓縮比例飞主。
# 歸檔與壓縮data1和data2兩個文件
tar -cvzf data.tar.gz data1.txt data2.txt
# 歸檔與壓縮data目錄
tar -cvzf data.tar.gz data/
# 解壓縮到data_new目錄
tar -xvzf data.tar.gz -C data_new
# -c 創(chuàng)建打包文件,一般與-f選項一起連用
# -x 從備份文件中還原文件
# -z 通過gzip指令處理備份文件
# -v 顯示指令執(zhí)行過程
# -f 指定備份文件高诺,在參數(shù)的最后
# -C 指定解包目錄
從壓縮文件中提取指定文件
# 得到所需文件的絕對路徑
tar -tvzf data.tar.gz | grep LOC_05g
# 提取指定文件
tar -xvzf data.tar.gz data/LOC_05g01010.xls
# -t 列出備份文件的內(nèi)容