個人筆記-java解析文本并轉(zhuǎn)換生成Excel文件


本篇要點:
1、文件讀寫的基本操作
2、字符串分割
3、POI生成Excel文件(.xlsx)

需求:
將csv格式的數(shù)據(jù)文件的內(nèi)容導(dǎo)入到表格中吞彤,生成xlsx格式的文件。
(這是個很簡單的任務(wù)叹放,這里記錄一下饰恕,以便以后復(fù)用代碼。)
轉(zhuǎn)換前:

csv格式文件樣例

轉(zhuǎn)換后:

轉(zhuǎn)換后的xlsx文件

起因:

思路:

整體思路

1井仰、按行讀取文件數(shù)據(jù)埋嵌,過濾掉不必要的行。
2俱恶、有效行進行數(shù)據(jù)分割雹嗦。
3范舀、分割好的數(shù)據(jù)存入表格的單元格。
4俐银、輸出生成xlsx文件尿背。

用記事本打開csv文件分析一下,發(fā)現(xiàn)需要解決的問題主要有:

1捶惜、開頭有多余代碼


開頭多余代碼

2田藐、有重復(fù)的標題行,每行末尾有無效數(shù)據(jù)(,,,,)

無效數(shù)據(jù)

讀取行的詳細思路

1吱七、正則匹配“+”開頭的行(稱為“+”行)并計數(shù)汽久,只有讀取“+”行計數(shù)為1時,置布爾值title_read為true踊餐,表示下一行可以讀取為標題行景醇。
2、當“+”行計數(shù)>=1時吝岭,讀取的非“+”行才是有效行三痰,這樣就可以忽略開頭代碼。
3窜管、當“+”行計數(shù)散劫!=1時,置title_read為false幕帆,表示之后不再讀取標題行获搏。無效標題行的判斷條件為title_read為false時“+”行計數(shù)為基數(shù)(因為每個標題行前后都有一行“+”行)。這樣就可以忽略掉多余標題行失乾。
4常熙、進行字符串切割后,不輸出第一個(第一個“|”前是空字符串)和最后一個切割數(shù)據(jù)(“,,,,,”無效數(shù)據(jù))碱茁。

完整代碼

因為這是個人筆記裸卫,就不細講每一步的實現(xiàn)了,代碼比較簡單纽竣,細節(jié)見注釋彼城。

package excelOP;

import java.io.BufferedReader;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStreamReader;

import org.apache.poi.xssf.streaming.SXSSFRow;
import org.apache.poi.xssf.streaming.SXSSFSheet;
import org.apache.poi.xssf.streaming.SXSSFWorkbook;

public class ExcelOp {
    
    public void trans(String file_in,String file_out//參數(shù)file_in,file_out分別為輸入文件路徑和輸出文件路徑
            ){
        /*實例化輸入、輸出流*/
        File f_in=new File(file_in);//輸入文件
        FileInputStream ips=null;
        InputStreamReader ipsr=null;
        
        File f_out=new File(file_out);//輸出文件
        FileOutputStream ops=null;
        try {
            ips=new FileInputStream(f_in);
            ipsr=new InputStreamReader(ips);
            
            ops=new FileOutputStream(f_out);
        } catch (FileNotFoundException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }
        
        /*創(chuàng)建excel表格文件并輸出*/
        //創(chuàng)建工作薄
        SXSSFWorkbook wb = new SXSSFWorkbook();
        try {
            //創(chuàng)建新的一頁
            SXSSFSheet sheet = wb.createSheet("new sheet");
            
            BufferedReader br=new BufferedReader(ipsr);
            int count_title_framelines=0;
            boolean title_read=false;
            String valueString = null;
            
            int count_line=0;//表格的有效行計數(shù)
            
            while ((valueString=br.readLine())!=null){//循環(huán)處理每一行
                if(valueString.matches("\\+.+")){//正則匹配標題前后行“+”開頭的行
                    count_title_framelines++;
                    if(count_title_framelines==1)title_read=true;
                    else title_read=false;
                }
                else{//非“+”開頭的行
                    if(!(title_read==false&&count_title_framelines%2==1)//忽略重復(fù)標題行
                            &&count_title_framelines>=1){//忽略開頭代碼
                        
                        //分解每一行有效行
                        String[] strs_cell=valueString.split("\\|");//用“|”切割每一行作為一個單元格數(shù)據(jù)
                        SXSSFRow row = sheet.createRow((short)count_line);
                        for(int i=1;i<strs_cell.length-1;++i){//循環(huán)每個切割得到的數(shù)據(jù)退个,除了最后一個(,,,)和第一個(空)
                            //創(chuàng)建要顯示的內(nèi)容,創(chuàng)建一個單元格募壕,第一個參數(shù)為列坐標,第二個參數(shù)為行坐標语盈,第三個參數(shù)為內(nèi)容
                            row.createCell((short)i-1).setCellValue(strs_cell[i]);
                            System.out.println("正在導(dǎo)入第"+count_line+"行……");
                        }
                        count_line++;
                    }
                }
            }
            //把創(chuàng)建的表格寫入到輸出流中舱馅,并關(guān)閉輸出流
            wb.write(ops);
        }catch (IOException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }finally {
            if(wb!=null){
                try {
                    wb.close();
                    System.out.println("寫入表格完畢!");
                } catch (IOException e) {
                    // TODO Auto-generated catch block
                    e.printStackTrace();
                }
            }
            if(ips!=null){
                try {
                    ips.close();
                } catch (IOException e) {
                    // TODO Auto-generated catch block
                    e.printStackTrace();
                }
            }
            if(ops!=null){
                try {
                    ops.close();
                } catch (IOException e) {
                    // TODO Auto-generated catch block
                    e.printStackTrace();
                }
            }
        }
        
    }
    public static void main(String[] args) {
        // TODO Auto-generated method stub
        ExcelOp exop=new ExcelOp();
        exop.trans("Ngap.csv", "test.xlsx");
    }

}

參考:

POI操作Excel常用方法總結(jié)
注:這篇主要講的是用HSSF生成xls格式的文件(Excel2003版之前用的格式)刀荒,生成xlsx用的是SXSSF代嗤,如上個部分的代碼棘钞。不過相應(yīng)的操作大同小異,把所有的“HSSF”改成“SXSSF”即可干毅,相應(yīng)的包可以到Apache官網(wǎng)下載宜猜,給個鏈接:Apache POI - Download Release Artifacts

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市硝逢,隨后出現(xiàn)的幾起案子姨拥,更是在濱河造成了極大的恐慌,老刑警劉巖渠鸽,帶你破解...
    沈念sama閱讀 217,509評論 6 504
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件叫乌,死亡現(xiàn)場離奇詭異,居然都是意外死亡徽缚,警方通過查閱死者的電腦和手機憨奸,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,806評論 3 394
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來凿试,“玉大人排宰,你說我怎么就攤上這事∧峭瘢” “怎么了额各?”我有些...
    開封第一講書人閱讀 163,875評論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長吧恃。 經(jīng)常有香客問我,道長麻诀,這世上最難降的妖魔是什么痕寓? 我笑而不...
    開封第一講書人閱讀 58,441評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮蝇闭,結(jié)果婚禮上呻率,老公的妹妹穿的比我還像新娘。我一直安慰自己呻引,他們只是感情好礼仗,可當我...
    茶點故事閱讀 67,488評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著逻悠,像睡著了一般元践。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上童谒,一...
    開封第一講書人閱讀 51,365評論 1 302
  • 那天单旁,我揣著相機與錄音,去河邊找鬼饥伊。 笑死象浑,一個胖子當著我的面吹牛蔫饰,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播愉豺,決...
    沈念sama閱讀 40,190評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼篓吁,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了蚪拦?” 一聲冷哼從身側(cè)響起杖剪,我...
    開封第一講書人閱讀 39,062評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎外盯,沒想到半個月后摘盆,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,500評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡饱苟,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,706評論 3 335
  • 正文 我和宋清朗相戀三年孩擂,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片箱熬。...
    茶點故事閱讀 39,834評論 1 347
  • 序言:一個原本活蹦亂跳的男人離奇死亡类垦,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出城须,到底是詐尸還是另有隱情蚤认,我是刑警寧澤,帶...
    沈念sama閱讀 35,559評論 5 345
  • 正文 年R本政府宣布糕伐,位于F島的核電站砰琢,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏良瞧。R本人自食惡果不足惜陪汽,卻給世界環(huán)境...
    茶點故事閱讀 41,167評論 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望褥蚯。 院中可真熱鬧挚冤,春花似錦、人聲如沸赞庶。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,779評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽歧强。三九已至澜薄,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間摊册,已是汗流浹背表悬。 一陣腳步聲響...
    開封第一講書人閱讀 32,912評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留丧靡,地道東北人蟆沫。 一個月前我還...
    沈念sama閱讀 47,958評論 2 370
  • 正文 我出身青樓籽暇,卻偏偏與公主長得像,于是被迫代替她去往敵國和親饭庞。 傳聞我的和親對象是個殘疾皇子戒悠,可洞房花燭夜當晚...
    茶點故事閱讀 44,779評論 2 354

推薦閱讀更多精彩內(nèi)容

  • 使用首先需要了解他的工作原理 1.POI結(jié)構(gòu)與常用類 (1)創(chuàng)建Workbook和Sheet (2)創(chuàng)建單元格 (...
    長城ol閱讀 8,425評論 2 25
  • Spring Cloud為開發(fā)人員提供了快速構(gòu)建分布式系統(tǒng)中一些常見模式的工具(例如配置管理,服務(wù)發(fā)現(xiàn)舟山,斷路器绸狐,智...
    卡卡羅2017閱讀 134,654評論 18 139
  • 我父母是一對特別愛玩的人寒矿,灑脫,自由若债,我八歲的時候就帶我騎車去中俄邊境線符相,來回騎了一個月,曬的比當?shù)胤叛虻膬?nèi)蒙古人...
    綠山墻的Echo閱讀 1,521評論 6 8
  • 陽光高照霜消失蓝牲,零度涼爽穿厚衣 還是熟人在練功,我還堅持來跑步 一點出發(fā)練單杠泰讽,兩點和朋友去歌廳 今天空氣好例衍,中午...
    榮蘭_a5f9閱讀 178評論 0 0
  • 大城市人口多,發(fā)展的機遇相對大一點已卸,提供的機會多一點佛玄,相對于小城市來說這三點是必備的。 最近都在選實習的地方咬最,也傾...
    雨晴T閱讀 264評論 2 0