我們常說的標準IO操作,包含了本篇所述的文件IO苟蹈。我們知道糊渊,IO無非是輸入輸出,數據在動的時候以流形式存在(Byte or Bit 為單位)慧脱,而在靜的時候則以文件形式存在(因為我們知道文件就是若干Byte等單位的數據或數據集合)渺绒。
前言:關于文件的編碼
- 在windows 下,eclipse等IDE的默認項目編碼是
GBK
,GBK
編碼:中文占用2byte宗兼,英文占用1byte躏鱼。 -
utf-8
編碼中:中文占用3byte,英文占用1byte殷绍。 - 如何把單個字節(jié)轉換為int以16進制的方式顯示:
String ch = "A";
byte[] bytes = ch.getBytes();
System.out.println(Integer.toHexString(bytes[0] & 0xff));///為了將變成int類型后(8bit->32bit)的值染苛,除去前30位的值,只留下最低2位主到。
- Java是雙字節(jié)編碼(utf-16be)茶行,
utf-16be
編碼:中文和英文都占用2byte。 - Java中字符串與字節(jié)序列之間的轉換示例:
String str = "你好1234";
byte[] bytes = str.getBytes("utf-16be");
String str2 = new String(bytes, "utf-16be");
- 文本文件(
.txt
)就是字節(jié)序列(可以是任意編碼的字節(jié)序列) - 中文機器上(比如我們的PC)直接創(chuàng)建文本文件镰烧,那么該文件只認識
ansi
編碼 - 創(chuàng)建的Java項目設定是
utf-8
編碼,那么楞陷, 它創(chuàng)建的文本文件編碼格式就是utf-8
編碼怔鳖。將此文本文件拷貝到其他不是utf-8
編碼的項目目錄下,就會亂碼固蛾。但是將此文本文件拷貝到我們PC的任何其他目錄下结执,都不會有亂碼。(注意是拷貝艾凯,不是新建献幔,這是由于:文本文件本身就是識別任意編碼格式的字節(jié)序列)
Java IO示例與注意點
(一)File類
- 創(chuàng)建/獲取文件對象,使用
File.separator
分隔符:
File file = new File("E:\\test");///一般windows下用(雙斜杠)
//File file0 = new File("e:\\", "diary.txt");
File file2 = new File("E:/test");///一般linux和macos下用(反斜杠)
File file3 = new File("E:" + File.separator +"test");///系統(tǒng)間通用
- 創(chuàng)建的文件對象是一個多級目錄時趾诗,需要
File.mkdirs()
而不是File.mkdir()
:
if(!file.exists())
file.mkdirs();
- 打印File.toString()蜡感,默認打印文件的目錄:
System.out.println(file);/// output: e://test
(二)文件讀寫IO
-
關于RandomAccessFile:RandomAccessFile類支持隨機訪問文件并可以訪問文件的任意位置:
read()
和write()
就是這個類的其他方法的基礎原理。
RandomAccessFile raf = new RandomAccessFile(file, "rw");//兩個模式:rw表示讀寫恃泪,r表示只讀郑兴。
raf.write(int);//只寫一個字節(jié)(后8位),同時指針后移一個位置贝乎,準備再次寫入情连。
int b = raf.read();//讀一個字節(jié)
int max = 0x7ffffff;
raf.write(max>>>24);//最高8位
raf.write(max>>>16);//8位
raf.write(max>>>8);//8位
raf.write(max);///最低8位
- IO流基礎
- 分為:字節(jié)流、字符流
- EOF = End:-1表示讀到結尾
-
字節(jié)流:InputStream览效、OutputStream(抽象類)【具體方法可以查看它的API文檔】
- 輸入流最重要方法:
int b = in.read();///讀取一個字節(jié)無符號填充到int低8位却舀。-1表示EOF in.read(byte[] buf);///讀取內容到buf字節(jié)數組中 in.read(byte[] buf , int start, int size);//讀取內容的一小段,到buf
- 輸出流最重要方法:
out.write(int b);///寫出一個字節(jié)到流锤灿,b的低8位挽拔。 out.write(byte[] buf);//將buf字節(jié)數組寫入到流 out.write(byte[] buf, int start, int size);///將將buf[start]開始的size長度內容寫入。
- 各種字節(jié)流實現類:
- 【基本文件操作】
FileInputStream/FileOutputStream
:具體實現了在文件上存取byte數據的方法但校。 - 【更多封裝方法】
DataInputStream/DataOutputStream
:對“流”進行了擴展篱昔,可以更方面地讀取int、long、字符等類型數據【相當于比FileInputStream等多了些封裝方法(裝飾模式)】
DataOutputStream dos = new DataOutputStream(new FileOutputStream(file)); dos.writeUTF("中國");//采用utf-8編碼寫出 dos.writeChars("中國");//采用utf-16be編碼寫出
- 【更高效率】
BufferedInputStream/BufferedOutputStream
:為流IO提供了帶緩沖區(qū)的操作州刽,一般打開文件進行IO操作時空执,都會用到,這種流模式提高IO性能穗椅。
- 【基本文件操作】
- 輸入流最重要方法:
-
字符流:
- 注意編碼問題
- 文本與文本文件的區(qū)別:
- Java的文本(char)是16位無符號整數(unsigned 16bit int),是字符的unicode編碼(雙字節(jié)編碼)辨绊。
- 文本文件是文本(char)序列按照某種方案(如:utf-8、utf-16be匹表、gbk等)序列化為byte的存儲結果门坷。
- 【基本實現】
InputStreamReader/OutputStreamWriter
:完成byte-->char的按編碼解析/char-->byte的按編碼處理
InputStreamReader isr = new InputStreamReader(new FileInputStream(file));///默認使用項目的編碼格式(非utf-16be) char[] chs = new char[1024]; int len; while((len=isr.read(chs,0,chs.length))!=-1){ String s = new String(chs,0,len); System.out.println(s); }
-
FileReader/FileWriter
:可直接對文本文件進行字符流讀寫。在copy文件時袍镀,可覆蓋或追加文件內容默蚌。不用byte轉char,但是編碼問題不能解決苇羡。 -
BufferedReader/BufferedWriter
:帶緩沖绸吸,(String line = br.readLine())!=null
方法可以一次讀一行,高效率设江,但不能識別換行锦茁。
BufferedReader br = new BufferedReader(new InputStreamReader( newFileInputStream(file)));//讀 BufferedWriter bw = new BufferedWriter(new OutputStreamWriter( newFileOutputStream(newFilePath)));//寫 String line; while((line = br.readLine())!=null){ ///輸出并寫入新文件 bw.write(line); bw.newLine();///單獨寫出換行操作!2娲妗码俩! bw.flush; } br.close(); bw.close();
-
PrintWriter
:簡單化構造一個寫入流,換行操作很方面:println(str);
(三)對象讀寫 與 序列化
- 序列化:Object轉byte序列的過程歼捏。
- 序列化流:
ObjectOutputStream/ObjectInputStream
稿存,對于方法:writeObject()、readObject()
- JVM在對象內部調用的默認序列化方法:
///成員方法writeObject()
public void writeObject(ObjectOutputStream s) throws IOException{
s.defaultWriteObject();
}
- 如果想要自己做某個元素的序列化操作:
public void writeObject(ObjectOutputStream s) throws IOException{
s.defaultWriteObject();
s.writeInt(age);///如這個age變量瞳秽,就被我們自行序列化寫入了
}
-
Serializable
接口是一個標準挠铲,是序列化的前提。 -
transient
關鍵字:被標注的成員不會被jvm進行默認序列化寂诱》髌唬【有時可以提高性能】 -
ArrayList
內部維護著Object[]類型的數組對象,這個對象是被transient
修飾的痰洒,但是ArrayList
并不是不想進行序列化操作瓢棒,而是想自己去實現序列化的方式而不去給JVM默認進行序列化,這樣一來即可提高效率丘喻。 - 序列化時:一個類實現了
Serializable
接口脯宿,其子類都能夠被需序列化。 - 反序列化時:對子類對象進行反序列化泉粉,如果其父類沒有實現
Serializable
接口连霉,則其父類的構造方法會被調用榴芳。