標識符
LLVM的標識符有兩類:全局標識符和局部標識符纪他。全局標識符以符號@開頭申尤,局部標識符由符號%開頭。此外拒名,標識符還有三種格式:
- 命名的值由前綴(@或者%)加字符串表示噩咪,比如%foo等顾彰。識別變量的正則表達式為[%@][-a-zA-Z$._][-a-zA-Z$._0-9]*。
- 未命名的值由簽注加無符號數(shù)字表示胃碾,比如%2等涨享。
- 常量
標識符由前綴開頭有兩個方面的原因:一是編譯器不用擔心其與保留字沖突;二是編譯器可以方便的給未命名的值設(shè)置臨時變量而不需要考慮符號表沖突仆百。
LLVM的其他特點:
- 注釋以;開始厕隧,持續(xù)被該行的結(jié)束
- 當計算結(jié)果沒有分配給指定值時,就會創(chuàng)建未命名的臨時變量俄周。
- 未命名的臨時文件是按順序編號的吁讨,從0開始。
模塊
LLVM程序有模塊組成栈源,每個輸入程序都對應一個模塊挡爵。模塊包括函數(shù)竖般、全局變量和符號表甚垦。多個模塊可以被LLVM 鏈接器(linker)組合在一起。
鏈接類型
全局的值(全局變量和函數(shù))都由指向某個特定位置的指針表示涣雕,并且有一個鏈接類型:
private艰亮。private類型的全局變量只能被當前模塊內(nèi)的對象直接訪問。而且挣郭,當將代碼鏈接到一個包含private類型值的模塊的時候迄埃,這個private值可能被重命名以避免沖突。由于這個值是模塊私有的兑障,所以所有的引用都可以直接更新侄非。private的值不會出現(xiàn)在目標代碼的符號表中。
internal流译。與private類似逞怨,不過它的值會作為局部變量出現(xiàn)在目標文件中。類似C語言中static的概念福澡。
available_externally叠赦。該類型的變量不會被輸出到對應模塊的目標文件中。對于鏈接者來說革砸,該類型相當于一個外部聲明除秀。這種類型只允許在定義時使用糯累,而不能在聲明時使用。
linkonce册踩。鏈接時泳姐,這種類型的變量會和其他同名變量merge。該類型的變量如果沒被使用則可以被丟棄暂吉。這種類型的函數(shù)不允許優(yōu)化器將其內(nèi)聯(lián)到調(diào)用者的函數(shù)體中仗岸,這個它有可能被重寫。如果想允許內(nèi)聯(lián)或者其他優(yōu)化借笙,請使用“l(fā)inkonce_odr”類型
weak扒怖。與linkonce類似,但即使不被使用业稼,也不能丟棄盗痒。類似C語言中的“weak”類型的變量(多個變量擁有相同的名字不會造成沖突,只要其中一個是weak類型的低散。鏈接時俯邓,weak類型的定義被忽略而使用正常的定義,如果沒有正常的定義熔号,則使用weak的定義)稽鞭。
common。與weak類似引镊,用于C語言中的臨時定義朦蕴,比如全局作用域中的“int x;”。函數(shù)和別名沒有common類型
appending弟头。只用于數(shù)組類型的指針吩抓。兩個這種類型的變量鏈接時,對應的全局數(shù)組被連接在一起赴恨。
extern_weak疹娶。這種類型在鏈接之前是weak的,如果不被鏈接伦连,這個變量是null而不是undefined reference雨饺。
linkonce_odr, weak_odr。ODR(one definition rule)惑淳,只有等效的變量才能被merge额港。這個鏈接類型就表示只能跟等效的變量合并。
external汛聚。如果沒有指定上面的任意類型锹安,那么就是external的。
函數(shù)聲明只能使用external或者extern_weak。
調(diào)用約定
LLVM支持的調(diào)用約定如下:
- "ccc"叹哭,C調(diào)用約定忍宋。如果沒有指定其他類型,那么就默認是這種類型风罩。這個類型支持可變參數(shù)的函數(shù)調(diào)用并且允許聲明的原型和函數(shù)聲明的實現(xiàn)之間有一些不匹配糠排。
- "fastcc",快速調(diào)用約定超升。使生成的目標代碼盡可能快入宦,可以使用任意tricks。不支持可變參數(shù)室琢,并且原型和實現(xiàn)要嚴格匹配乾闰。
- "coldcc"坯钦,冷調(diào)用孽亲。假定這種調(diào)用不經(jīng)常發(fā)生。不支持可變參數(shù)沟优,并且原型和實現(xiàn)要嚴格匹配巢钓。
- “cc 10”病苗,GHC調(diào)用。 Glasgow Haskell Compiler 專用症汹。支持尾調(diào)用優(yōu)化硫朦,但是要求caller和callee都是它。
- “cc 11”背镇,HiPE調(diào)用約定咬展。
- "webkit_jscc", webkit的js調(diào)用約定。
- “anyregcc” 芽世,代碼補丁的動態(tài)調(diào)用挚赊。
- “preserve_mostcc”,PreserveMost調(diào)用約定济瓢。目前是實驗性的,未來會被objectiveC使用妹卿。
- “preserve_allcc”旺矾。也是實驗性的。
- “cxx_fast_tlscc”夺克。Clang生成訪問函數(shù)去訪問C++風格的TLS箕宙。訪問函數(shù)包括入口塊、出口塊和初始化塊铺纽,入口和出口塊可以訪問一些TLS IR變量柬帕。這個調(diào)用約定就是通過保留盡可能多的寄存器變量來降低這種訪問的開銷。
- “swiftcc”,Swift語言的調(diào)用約定陷寝。
- “cc <n>”锅很,從64開始。
可見性
所有的全局變量和函數(shù)都有一種可見性樣式:
- “default”凤跑,默認樣式爆安。對于使用ELF(Executable and Linking Format)格式的目標文件,這種可見性樣式意味著聲明對其他模塊可見仔引;在共享庫中扔仓,意味著聲明的實體可以被重寫;在Darwin咖耘,聲明對其他模塊可見翘簇。
- “hidden”,具有這種可見性樣式的聲明引用相同的對象儿倒,如果它們在相同的共享對象中的話缘揪。通常,具有這種可見性樣式的符號不會出現(xiàn)在動態(tài)符號表中义桂,所有其他模塊不能直接引用它找筝。
- “pretected”,對于ELF慷吊,這種樣式表明符號會放置在動態(tài)符號表中袖裕,但是在定義這個符號的模塊中的引用會綁定到局部變量,也就是說這個符號不能被其他模塊重寫溉瓶。
用于internal或者private鏈接類型的符號必須是default類型的急鳄。
以前一直使用rose,最近要轉(zhuǎn)到LLVM了堰酿。本文是官方LLVM IR文檔的翻譯疾宏,本人能力有限,如有錯漏触创,歡迎批評指正坎藐。