問?(.*?)在python中和java中表現(xiàn)不一樣蔬顾?
最近在學(xué)習(xí)爬蟲宴偿,對html
字符串用python
的re
解析后湘捎,發(fā)現(xiàn)結(jié)果和預(yù)期不太一樣,代碼和結(jié)果如下
python代碼
然后用java
對同一段html字符串進(jìn)行測試窄刘,發(fā)現(xiàn)結(jié)果符合預(yù)期窥妇。
java代碼
結(jié)論:如果正則表達(dá)式包含(xxx)
,re
會對結(jié)果進(jìn)行了優(yōu)化娩践,自動去除非(xxx)
以外的內(nèi)容(注:xxx
為具體的正則表達(dá)式)