頁面亂碼
1.問題介紹
頁面亂碼是用戶在瀏覽網(wǎng)頁時較大可能遇到得問題仗扬,這一類問題原因可能有很多。
首先我們可以分析到底有哪些可以指定本文本的具體編碼
1.文本前的BOM頭
2.http頭中得charset字段
3.用戶選擇編碼
4.html得meta標簽中可以攜帶charset
5.自動檢測(ICU)
6.父frame編碼
如果前六項都沒有檢查出來將使用默認編碼
2.分析問題過程
由于知道檢查編碼順序蕾额,我們就可以一一梳理查看是哪里出現(xiàn)問題
通常情況下我們可以優(yōu)先查看這三個
1.查看cap包中http頭是否有填寫charset。服務器搭建者可能指定錯了charset彼城,也有可能在偶然情況下http服務器抽風發(fā)送錯誤charset或者沒有發(fā)charset
2.html頭部是不是丟了meta標簽
3.進入了自動檢查流程诅蝶,但是對于中文ICU檢查一般都不正常
前兩步驟都沒什么難度,主要是查看cap log中是否有正常的設置募壕,以及和正常情況對比是否有差異调炬。
如果前兩點都沒有問題,那么在
chromium_dev/chromium/src/third_party/WebKit/Source/core/html/parser/TextResourceDecoder.cpp得decode方法中
對最后得autodetect部分以及最后得result添加log舱馅,查看是否為自動檢查的問題
3.相關調(diào)試技巧
本問題相關調(diào)試技巧主要涉及查看cap log
4.解決方法
如果是外部原因?qū)е络峙荩鏷ttp服務器本該設置charset卻沒有設置等原因?qū)е拢瑒t沒有太好的辦法可以解決代嗤。
如果是自動檢查出現(xiàn)異常棘钞,則可能需要強制給與m_hintEncoding讓自動檢查編碼模塊能夠優(yōu)先考慮該編碼。