所有類linux的操作系統(tǒng)都非常依賴于被用于幾種數(shù)據(jù)類型存儲(chǔ)的文本文件李丰。很多人會(huì)使用純文本格式來(lái)編寫文檔,雖然很容易看到一個(gè)小的文本文件對(duì)于保存簡(jiǎn)單的筆記會(huì)很有幫助竖慧,但是也有可能用文本格式來(lái)編寫大的文檔嫌套,一種比較流行的方式就是先用文本格式來(lái)編寫一個(gè)大的文檔,然后用一種標(biāo)記語(yǔ)言的方式來(lái)描述已完成文檔的格式圾旨。而linux的文本處理系統(tǒng)位于該項(xiàng)技術(shù)的前列。
目前魏蔗,最流行的電子文檔類型可能就是網(wǎng)頁(yè)了砍的,網(wǎng)頁(yè)是文本文檔,它們使用HTML(超文本標(biāo)記語(yǔ)言)或者是XML(可擴(kuò)展的標(biāo)記語(yǔ)言)作為標(biāo)記語(yǔ)言來(lái)描述文檔的可視格式莺治。另外廓鞠,email是一個(gè)基于文本的媒介,為了傳輸谣旁,甚至非文本的附件也會(huì)被轉(zhuǎn)換成文本表示形式床佳。通過(guò)下載一個(gè)email信息,然后用less瀏覽它榄审,我們可以看到這條信息始于一個(gè)標(biāo)題砌们,其描述了信息的來(lái)源以及在傳輸過(guò)程中它接受到的處理,然后是信息的正文內(nèi)容。輸出時(shí)浪感,會(huì)以純文本的格式發(fā)送到打印機(jī)昔头。或者頁(yè)面包含圖形影兽,其會(huì)被轉(zhuǎn)換成一種文本格式的頁(yè)面描述語(yǔ)言揭斧,以PostScript著稱,然后再發(fā)送給一款能生成圖形點(diǎn)陣的程序峻堰,最后被打印出來(lái)讹开。
有好多命令的選項(xiàng)可以用來(lái)幫助更好的可視化文本內(nèi)容。sort程序?qū)?biāo)準(zhǔn)輸入的內(nèi)容捐名,或命令行中指定的一個(gè)或多個(gè)文件進(jìn)行排序旦万,然后把排序結(jié)果發(fā)送到標(biāo)準(zhǔn)輸出。uniq程序執(zhí)行一個(gè)看似瑣碎的行為桐筏,當(dāng)給定一個(gè)排序好的文件(包括標(biāo)準(zhǔn)輸出)纸型,uniq會(huì)刪除任意重復(fù)行,并且把結(jié)果發(fā)送到標(biāo)準(zhǔn)輸出梅忌。uniq常常和sort程序一塊使用狰腌,來(lái)清理重復(fù)的輸出。cut程序被用來(lái)從文本文件中抽取文本牧氮,并將其輸出到標(biāo)準(zhǔn)輸出琼腔,它能夠接受多個(gè)文件參數(shù)或者標(biāo)準(zhǔn)輸入。paste的功能與cut恰恰相反踱葛,它會(huì)添加一個(gè)或多個(gè)文本列到文件中丹莲,而不是從文件中抽取文本列。
通常比較文本文件的版本是很有幫助的尸诽,對(duì)于系統(tǒng)管理員和軟件卡法這來(lái)說(shuō)甥材,這個(gè)尤為重要。