原文標(biāo)題:FAQ - Line Breaking
原文來源:
問:什么是“斷行"(自動換行)
答:斷行就是計算機(jī)讓一長串文字自動的換行,最后形成一個真實可見的段落您朽。計算機(jī)通過算法來確定每一行的每一個字符是否可以斷行拍柒。一個簡單的例子就是纲岭。每當(dāng)你調(diào)整瀏覽器的窗口寬度時,經(jīng)過斷行處理后塞栅,原先段落里的字符都會發(fā)生了變動卡啰,或者被擠到下一行開頭她君,或者變成了上一行的末尾脚作,最后形成一個新的段落,而這個段落的每一行寬度都沒有超過段落的可見范圍缔刹。
問:Unicode 是否有關(guān)于斷行的標(biāo)準(zhǔn) 球涛?
答:有。《Unicode Standard Annex #14, Unicode 斷行算法》 規(guī)定了使用于所有 Unicode 字符的斷行算法校镐。相關(guān)文件介紹了 Unicode 字符對應(yīng)的斷行屬性亿扁。
問:為了使用 Unicode,是不是就必須完全遵循 UAX #14 標(biāo)準(zhǔn) 鸟廓?
答: 不一定从祝, UAX#14 算法是經(jīng)過仔細(xì)設(shè)計的,它可以適用于各種環(huán)境引谜,但是更復(fù)雜的樣例就不行了牍陌。比如給長單詞自動添加連字符然后斷行,就超出了這個算法的功能员咽。所以不直接使用空格斷行的東南亞字符集就必須通過字典模塊逐個字符匹配毒涧,才能識別出當(dāng)前字符是否是可以斷行的。也就是說贝室,用戶是被允許調(diào)整斷行算法契讲,來達(dá)到某種需要的排版風(fēng)格仿吞。
問:那我可以隨意修改斷行規(guī)則么?
答:不能捡偏。因為有些字符的出現(xiàn)就是為了表示這個地方可以斷行的唤冈。它們的行為必須和 Unicode 規(guī)定的一致。這一部分不能根據(jù)用戶需求修改的斷行規(guī)則银伟, 具體可以看 Section 4 of UAX #14