當(dāng)我們使用java io系統(tǒng)進(jìn)行外部數(shù)據(jù)讀取窘游,如網(wǎng)絡(luò)涌献、文件等內(nèi)容讀取很容易被復(fù)雜的類庫搞的頭昏腦脹,歲雖然要理解java的io系統(tǒng)以及復(fù)雜的類層次結(jié)構(gòu)是一項艱難的任務(wù)杯缺,所以對于通過類庫滿足我們的需求通常是千遍一律的,比如如何讀取到互聯(lián)網(wǎng)上一張網(wǎng)頁的內(nèi)容匿醒、如何讀取磁盤上一個文件的內(nèi)容场航,這種需求的職責(zé)很單一、功能很明確廉羔,解決方案網(wǎng)上一搜一大把溉痢,而且大多數(shù)需要用到j(luò)ava io系統(tǒng)的需求也就是這些需求,因此即使我們不能完整的理解java io系統(tǒng)的細(xì)節(jié)憋他,也不妨礙我們使用它孩饼,我們只需要從互聯(lián)網(wǎng)上把代碼復(fù)制到自己的程序中調(diào)用就可以了。
然而只知其然不知其所以然總歸不是一件舒服的事情竹挡,而要理解整個io系統(tǒng)的細(xì)節(jié)又如此艱難镀娶,因此我們可以做一個折中,去理解那些覆蓋面廣且常用但又不那么艱深的內(nèi)容此迅,這樣是最大化投入產(chǎn)出比一種方案汽畴。
接下來我們談?wù)勗诖蠖鄶?shù)情況下使用java io系統(tǒng)讀取內(nèi)容的一種規(guī)律,我們來看一個代碼片段耸序,這個代碼片段應(yīng)該能代表相當(dāng)一部分通過java讀取外部內(nèi)容的情況了
URL url = new URL("https://www.jd.com/");
URLConnection urlConnection = url.openConnection();
InputStream inputStream = urlConnection.getInputStream();
InputStreamReader inputStreamReader = new InputStreamReader(inputStream,"utf8");
BufferedReader bufferedReader = new BufferedReader(inputStreamReader);
StringBuilder content = new StringBuilder();
String line = bufferedReader.readLine();
while(line != null){
content.append(line);
content.append("\n");
line = bufferedReader.readLine();
}
System.out.println(content.toString());
bufferedReader.close();
我們抓取互聯(lián)網(wǎng)上一張網(wǎng)內(nèi)的內(nèi)容到程序中并轉(zhuǎn)換成字符串輸出忍些, 可以將整個過程分解成一下步驟
1、獲得一個表示網(wǎng)頁內(nèi)容的InputStream
URL url = new URL("https://www.jd.com/");
URLConnection urlConnection = url.openConnection();
InputStream inputStream = urlConnection.getInputStream();
InputStream非常常見坎怪,我們在很多場景下能見到他罢坝,很多系統(tǒng)類庫訪問外部資源返回的都是InputStream或者它的派生類,比如說文件內(nèi)容讀取搅窿、網(wǎng)路內(nèi)容讀取嘁酿,甚至System.in等都會用到InputStream
FileInputStream fileInputStream = new FileInputStream("C:\\Users\\Desktop\\新建文本文檔.txt");
可以使用FileInputStream讀取磁盤文件,F(xiàn)ileInputStream 是 InputStream 的一個派生類男应。
因此對于使用java io讀取在許多情況下就是使用InputStream
2闹司、將InputStream轉(zhuǎn)換成InputStreamReader
從數(shù)據(jù)類型的角度講,java io系統(tǒng)類庫有兩種實現(xiàn)沐飘,一種是面向字節(jié)的InputStream/OutputStream游桩,另一種是面向字符的Reader和Writer,字節(jié)相對與字符更加貼近系統(tǒng)耐朴,而字符相對于字節(jié)更加接近于用戶借卧,因為當(dāng)我們需要輸出用戶可見的內(nèi)容時更適合使用Reader/Writer系列的類庫。當(dāng)然我們也可以自己處理InputStream的字節(jié)內(nèi)容并轉(zhuǎn)換成字符使用筛峭,可這明顯不是明智的做法铐刘,因為Reader/Writer已經(jīng)幫我們完成任務(wù)。
Java提供了InputStreamReader類型來將InputStream轉(zhuǎn)換成Reader類型
InputStreamReader inputStreamReader = new InputStreamReader(inputStream,"utf8");
InputStreamReader還有一個絕無僅有的強(qiáng)大功能影晓,它可以指定讀取內(nèi)容的編碼镰吵,這時其它Reader系列的類庫不具備的檩禾,比如FileReader。
使用InputStreamReader可以將InputStream的內(nèi)容讀取成字符串捡遍,然而它卻并不高效锌订。我們每調(diào)用一次InputStreamReader的read方法讀取一次內(nèi)容,InputStreamReader就需要根據(jù)傳入的參數(shù)從磁盤上的文件中獲取相應(yīng)的內(nèi)容画株,那么read的相應(yīng)調(diào)用次數(shù)就等于訪問磁盤文件的次數(shù),這是低效的行為啦辐。
3谓传、使用BufferedReader引入緩沖機(jī)制
BufferedReader是具備緩沖功能的一種Reader,它會預(yù)先把一部分內(nèi)容從磁盤加載至內(nèi)容芹关,然而當(dāng)我們讀取內(nèi)容時续挟,BufferedReader會從已經(jīng)存在內(nèi)存中緩沖數(shù)據(jù)中讀取內(nèi)容,而不是直接訪問磁盤侥衬,當(dāng)當(dāng)前部分內(nèi)容讀取完畢時诗祸,BufferedReader會從磁盤中加載新的內(nèi)容至內(nèi)存緩沖區(qū),如此便能減少磁盤的訪問次數(shù)提升運行效率
BufferedReader bufferedReader = new BufferedReader(inputStreamReader);
BufferedReader一裝飾者的身份對Reader增加緩沖區(qū)功能
4轴总、讀取內(nèi)容并輸出
StringBuilder content = new StringBuilder();
String line = bufferedReader.readLine();
while(line != null){
content.append(line);
content.append("\n");
line = bufferedReader.readLine();
}
System.out.println(content.toString());
這一步非常簡單直颅,它從bufferedReader中讀取字符串行并追加到一個StringBuilder中,最后輸出到控制臺怀樟。
總的來說的話功偿,如果碰到要讀取外部設(shè)備內(nèi)容的需求,那么我們只要能獲得代表內(nèi)容的InputStream往堡,之后的處理大致上是相同而且簡單的械荷,所以通過java io處理輸入內(nèi)容,大致過成不外乎
- 獲得一個inputStream
- 將inputStream轉(zhuǎn)換成InputStreamReader
- 使用BufferedReader裝飾 InputStreamReader 來讀取具體內(nèi)容