iText中PdfStream對象map為空原因分析

一段代碼装黑,是為了遍歷每一頁中的圖片

            PdfDictionary resources = pageDict.GetAsDictionary(PdfName.Resources);
            PdfDictionary xObjects = resources.GetAsDictionary(PdfName.XObject);

            if (xObjects == null)
                return;

            var keySet = xObjects.KeySet();

            foreach (var pdfName in keySet.ToList())
            {
                PdfStream stream = xObjects.GetAsStream(pdfName);
                PdfObject subtype = stream.Get(PdfName.Subtype);

結(jié)果對某個pdf進(jìn)行處理的時候双吆,在第三頁出現(xiàn)了運(yùn)行時的報錯。原因是stream.Get的時候缸托,stream對象的內(nèi)部成員map是null跷叉,因此 map.Get(key) 必然不可運(yùn)行逸雹!但是為什么會出現(xiàn)這種情況呢?先跟蹤一下 xObjects.GetAsStream(pdfName) 是怎么處理的

        public virtual PdfObject Get(PdfName key, bool asDirect) {
            if (!asDirect) {
                return map.Get(key);
            }
            else {
                PdfObject obj = map.Get(key);
                if (obj != null && obj.GetObjectType() == INDIRECT_REFERENCE) {
                    return ((PdfIndirectReference)obj).GetRefersTo(true);
                }
                else {
                    return obj;
                }
            }
        }

每一頁的xobject都是Indirect的object云挟,因此還需要從整個pdf文檔中找到這個object的真正定義梆砸,通過 PdfIndirectReference::GetRefersTo

        public virtual PdfObject GetRefersTo(bool recursively) {
            if (!recursively) {
                if (refersTo == null && !CheckState(FLUSHED) && !CheckState(MODIFIED) && !CheckState(FREE) && GetReader() 
                    != null) {
                    refersTo = GetReader().ReadObject(this);
                }
                return refersTo;
            }
            else {
                PdfObject currentRefersTo = GetRefersTo(false);
                for (int i = 0; i < LENGTH_OF_INDIRECTS_CHAIN; i++) {
                    if (currentRefersTo is iText.Kernel.Pdf.PdfIndirectReference) {
                        currentRefersTo = ((iText.Kernel.Pdf.PdfIndirectReference)currentRefersTo).GetRefersTo(false);
                    }
                    else {
                        break;
                    }
                }
                return currentRefersTo;
            }
        }

一般每一頁的新對象,其 refersTo == null园欣,需要通過 GetReader().ReadObject(this) 從整個文檔中找到真正定義帖世。但是在出錯的一頁,refersTo 已經(jīng)不為空沸枯,指向一個 {10 0 R Flushed;}日矫。我們再跟蹤一下,對第一頁的對象绑榴,GetReader().ReadObject(this) 是怎么處理的
PdfReader::ReadObject

        private PdfObject ReadObject(PdfIndirectReference reference, bool fixXref) {
            if (reference == null) {
                return null;
            }
            if (reference.refersTo != null) {
                return reference.refersTo;
            }
            try {
                currentIndirectReference = reference;
                if (reference.GetObjStreamNumber() > 0) {
                    PdfStream objectStream = (PdfStream)pdfDocument.GetXref().Get(reference.GetObjStreamNumber()).GetRefersTo(
                        false);
                    ReadObjectStream(objectStream);
                    return reference.refersTo;
                }
                else {
                    if (reference.GetOffset() > 0) {
                        PdfObject @object;
                        try {
                            tokens.Seek(reference.GetOffset());
                            tokens.NextValidToken();
                            if (tokens.GetTokenType() != PdfTokenizer.TokenType.Obj || tokens.GetObjNr() != reference.GetObjNumber() ||
                                 tokens.GetGenNr() != reference.GetGenNumber()) {
                                tokens.ThrowError(KernelExceptionMessageConstant.INVALID_OFFSET_FOR_THIS_OBJECT, reference.ToString());
                            }
                            @object = ReadObject(false);
                        }

會根據(jù)對象的offset哪轿,從原始文檔中讀出對象。正好第一頁中要讀的一個對象就是10翔怎,它讀出來的狀態(tài)是{10 0 R}窃诉,是沒有Flushed在后面的!那什么時候變成flushed的呢赤套?繼續(xù)跟蹤程序飘痛,發(fā)現(xiàn)是在每一頁處理結(jié)束后,程序都會調(diào)用一次 page.Flush(true);容握,對象10就變成了 {10 0 R Flushed;}宣脉。而 Flush 函數(shù)的說明是
Flushes page dictionary, its content streams, annotations and thumb image. If <c>flushResourcesContentStreams</c> is true, all content streams that are rendered on this page (like FormXObjects, annotation appearance streams, patterns) and also all images associated with this page will also be flushed.

這說明了,由于這個圖片同時被第1頁和第3頁使用了唯沮,而因為調(diào)用Flush的時候脖旱,后面的參數(shù)加了true,因此處理完第一頁的時候被寫出去了介蛉。繼續(xù)跟蹤一下,為什么Flush之后溶褪,stream對象的map變空了

PdfPage類
        private void FlushResourcesContentStreams(PdfDictionary resources) {
            if (resources != null && !resources.IsFlushed()) {
                FlushWithResources(resources.GetAsDictionary(PdfName.XObject));
                FlushWithResources(resources.GetAsDictionary(PdfName.Pattern));
                FlushWithResources(resources.GetAsDictionary(PdfName.Shading));
            }
        }

        private void FlushWithResources(PdfDictionary objsCollection) {
            if (objsCollection == null || objsCollection.IsFlushed()) {
                return;
            }
            foreach (PdfObject obj in objsCollection.Values()) {
                if (obj.IsFlushed()) {
                    continue;
                }
                FlushResourcesContentStreams(((PdfDictionary)obj).GetAsDictionary(PdfName.Resources));
                FlushMustBeIndirectObject(obj);
            }
        }

        private void FlushMustBeIndirectObject(PdfObject obj) {
            // TODO DEVSIX-744
            obj.MakeIndirect(GetDocument()).Flush();
        }

PdfObject類
       public void Flush(bool canBeInObjStm) {
            try {
                PdfDocument document = GetIndirectReference().GetDocument();
                if (document != null) {
                    if (document.IsAppendMode() && !IsModified()) {
                        ILogger logger = ITextLogManager.GetLogger(typeof(PdfObject));
                        logger.LogInformation(iText.IO.Logs.IoLogMessageConstant.PDF_OBJECT_FLUSHING_NOT_PERFORMED);
                        return;
                    }
                    document.CheckIsoConformance(this, IsoKey.PDF_OBJECT);
                    document.FlushObject(this, canBeInObjStm && GetObjectType() != STREAM && GetObjectType() != INDIRECT_REFERENCE
                         && GetIndirectReference().GetGenNumber() == 0);
                }
            }


PdfWriter類
        protected internal virtual void FlushObject(PdfObject pdfObject, bool canBeInObjStm) {
            switch (pdfObject.GetObjectType()) {
                case PdfObject.STREAM:
                case PdfObject.DICTIONARY: {
                    PdfDictionary dictionary = ((PdfDictionary)pdfObject);
                    MarkDictionaryContentToFlush(dictionary);
                    dictionary.ReleaseContent();
                    break;
                }

PdfDictionary類
        protected internal virtual void ReleaseContent() {
            map = null;
        }

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末币旧,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子猿妈,更是在濱河造成了極大的恐慌吹菱,老刑警劉巖巍虫,帶你破解...
    沈念sama閱讀 212,718評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異鳍刷,居然都是意外死亡占遥,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,683評論 3 385
  • 文/潘曉璐 我一進(jìn)店門输瓜,熙熙樓的掌柜王于貴愁眉苦臉地迎上來瓦胎,“玉大人,你說我怎么就攤上這事尤揣∩Π。” “怎么了?”我有些...
    開封第一講書人閱讀 158,207評論 0 348
  • 文/不壞的土叔 我叫張陵北戏,是天一觀的道長负芋。 經(jīng)常有香客問我,道長嗜愈,這世上最難降的妖魔是什么旧蛾? 我笑而不...
    開封第一講書人閱讀 56,755評論 1 284
  • 正文 為了忘掉前任,我火速辦了婚禮蠕嫁,結(jié)果婚禮上蚜点,老公的妹妹穿的比我還像新娘。我一直安慰自己拌阴,他們只是感情好绍绘,可當(dāng)我...
    茶點故事閱讀 65,862評論 6 386
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著迟赃,像睡著了一般陪拘。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上纤壁,一...
    開封第一講書人閱讀 50,050評論 1 291
  • 那天左刽,我揣著相機(jī)與錄音,去河邊找鬼酌媒。 笑死欠痴,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的秒咨。 我是一名探鬼主播喇辽,決...
    沈念sama閱讀 39,136評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼雨席!你這毒婦竟也來了菩咨?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,882評論 0 268
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎抽米,沒想到半個月后特占,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,330評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡云茸,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,651評論 2 327
  • 正文 我和宋清朗相戀三年是目,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片标捺。...
    茶點故事閱讀 38,789評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡懊纳,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出宜岛,到底是詐尸還是另有隱情长踊,我是刑警寧澤,帶...
    沈念sama閱讀 34,477評論 4 333
  • 正文 年R本政府宣布萍倡,位于F島的核電站身弊,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏列敲。R本人自食惡果不足惜阱佛,卻給世界環(huán)境...
    茶點故事閱讀 40,135評論 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望戴而。 院中可真熱鬧凑术,春花似錦、人聲如沸所意。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,864評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽扶踊。三九已至泄鹏,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間秧耗,已是汗流浹背备籽。 一陣腳步聲響...
    開封第一講書人閱讀 32,099評論 1 267
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留分井,地道東北人车猬。 一個月前我還...
    沈念sama閱讀 46,598評論 2 362
  • 正文 我出身青樓,卻偏偏與公主長得像尺锚,于是被迫代替她去往敵國和親珠闰。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,697評論 2 351

推薦閱讀更多精彩內(nèi)容