最近,我在翻閱兩本比較新的 Python 書籍時风宁,發(fā)現(xiàn)它們都犯了一個嚴重的低級錯誤洁墙!
這兩本書分別是《Python編程:從入門到實踐》和《父與子的編程之旅》,它們都是暢銷書戒财,都在 2020 年 10 月出了新版本热监,都使用 Python3.7+ 版本的語法。
然而饮寞,在關于變量的命名規(guī)則部分孝扛,它們犯下了一樣的錯誤,即還在使用 Python2 時代的那套說辭幽崩,誤以為命名僅僅支持“字母苦始、數(shù)字和下劃線”的組合。
事實上慌申,Python3.x 已經(jīng)支持全面 Unicode 編碼陌选,比如支持使用中文作為變量名。
>>> 姓名 ="Python貓"
>>> print(f"我是{姓名},歡迎關注咨油!")
我是Python貓您炉,歡迎關注!
**由于我手頭上沒有其它樣本役电,所以赚爵,我不確定有多少新版的書籍還在使用老的規(guī)則。但是法瑟,翻譯類的書籍大概率都會有這樣的問題冀膝,另外,有些不嚴謹?shù)膰鴥?nèi)書籍瓢谢,也可能因為借鑒了過時的材料而犯錯畸写。
如此一來,恐怕有些新接觸 Python 的同學氓扛,就會形成錯誤的認識枯芬。雖然這可能不會造成嚴重的問題,但是它終歸是一個應該避免而且很容易就能避免的問題采郎。
因此千所,我覺得這個話題值得聊一聊。
在編程語言中有一個很常見的概念蒜埋,即標識符(identifier)淫痰,通常又會稱之為名字(name),用于標識出變量整份、常量待错、函數(shù)、類烈评、符號等實體的名字火俄。
在定義標識符時,有一些必須要考慮的基本規(guī)則:
- 它可以由哪些字符組成讲冠?
- 它是否區(qū)分大小寫瓜客?(即大小寫敏感)
- 它是否允許出現(xiàn)某些特殊的單詞?(即關鍵字/保留字)
對于第一個問題竿开,大多數(shù)的編程語言在早期版本都遵循這條規(guī)則:標識符由字母谱仪、數(shù)字和下劃線組成,并且不能以數(shù)字為開頭否彩。 少數(shù)的編程語言有例外疯攒,還支持使用$、@列荔、%等特殊符號(例如PHP卸例、Ruby称杨、Perl等等)。
Python 的早期版本筷转,確切地說是 3.0 之前的版本姑原,就遵循以上的命名規(guī)則。下面是官方文檔中的描述:
identifier ::= (letter|"_") (letter | digit | "_")*
letter ::= lowercase | uppercase
lowercase ::= "a"..."z"
uppercase ::= "A"..."Z"
digit ::= "0"..."9"
但是呜舒,這條規(guī)則從 3.0 版本起锭汛,就被打破了。最新的官方文檔已經(jīng)變成了這樣:
隨著互聯(lián)網(wǎng)的普及袭蝗,各國語言進入了國際化的語境中唤殴,編程語言也與時俱進地增長了對國際化的訴求。
Unicode(譯作統(tǒng)一碼到腥、萬國碼)編碼標準在 1994 年發(fā)布朵逝,隨后逐步被主流的編程語言所接納。到目前為止乡范,至少有 73 種編程語言支持 Unicode 變量名(數(shù)據(jù)依據(jù):https://rosettacode.org/wiki/Unicode_variable_names)配名。
2007 年,當 Python 正在設計劃時代的 3.0 版本時晋辆,官方也考慮了對 Unicode 編碼的支持渠脉,于是,誕生了重要的《PEP 3131 – Supporting Non-ASCII Identifiers》瓶佳。
出處:https://www.python.org/dev/peps/pep-3131
事實上芋膘,除了我們最關心的中文,Unicode 字符集還包含非常非常多的內(nèi)容霸饲。
在對變量命名時为朋,下面這些用法都是可行的(謹慎使用,如若被打厚脉,本貓概不負責……):
>>> ψ = 1
>>> Δ = 1
>>> ?_? = "hello"
綜上所述习寸,某些 Python 書籍中關于變量命名規(guī)則的內(nèi)容已經(jīng)過時了,不應該被其所誤導器仗!
Python 3 作為一門面向現(xiàn)代化/國際化的語言融涣,對于 Unicode 編碼有很好的支持童番。至于該不該在項目中使用中文給標識符命名精钮,那就是另外的問題啦……