聲筆簡碼

一、概述

聲筆簡碼建立在聲筆碼基礎之上盔沫,基本上克服了聲筆碼的兩個不足之處:碼長不定和調(diào)頭取筆医咨。如果說聲筆碼是頂功的開山之作,那么聲筆簡碼就是頂功的成熟之品架诞,是總結聲筆碼拟淮、聲筆飛碼等頂功輸入法的使用經(jīng)驗,并反復實驗谴忧、改造的結晶很泊,這個過程經(jīng)歷了漫長的十多年角虫。在這十多年中,頂功輸入法得到了蓬勃的發(fā)展撑蚌,數(shù)十種頂功輸入法應運而生上遥。但是,它們都或多或少地面臨類似的問題争涌。聲筆簡碼的成功經(jīng)驗粉楚,也可以用于克服聲筆飛碼等頂功輸入法的不足,而且很容易用來簡化傳統(tǒng)輸入法的規(guī)則并提高傳統(tǒng)輸入法的效率亮垫。

聲筆簡碼引領的是頂功輸入法向傳統(tǒng)的一種回歸模软,但又不是簡單的回歸,而是革命性的回歸饮潦,是螺旋式的上升燃异。它使得頂功輸入法更接近傳統(tǒng)輸入法,但又不失頂功的效率继蜡,是傳統(tǒng)與現(xiàn)代的完美結合回俐。可以預計稀并,它將再一次對輸入法的發(fā)展方向產(chǎn)生深遠的影響仅颇。

本文除了講解聲筆簡碼外,還將在章末介紹聲筆簡整碘举。聲筆簡整是基于聲筆簡碼的整句方案忘瓦,在使用上比聲筆簡碼還簡單得多。理解了聲筆簡碼就很容易理解它引颈,所以僅僅花費少量篇幅介紹就行了耕皮。

有關軟件的安裝與卸載、翻頁方法蝙场、標點凌停、符號、詞庫同步售滤、自定義詞典罚拟、中英文混合輸入、手機操作等聲筆系列碼共有的內(nèi)容趴泌,請閱讀《總體介紹》中的相關部分舟舒,這里就不再贅述。

二嗜憔、優(yōu)勢

聲筆簡碼的優(yōu)勢可以總結為:簡單性秃励、高效性和知識性。它比拼音更簡單吉捶,比五筆更高效夺鲜,還有利于人們鞏固語文知識皆尔。

1. 比拼音更簡單

聲筆簡碼非常簡單,具有易學币励、易用的優(yōu)點慷蠕,只需要知道用 v 表示零聲母,用 aeuio 分別表示折食呻、橫流炕、撇、豎仅胞、捺五種筆畫每辟,便可以上手使用了。與搜狗拼音干旧、百度拼音等拼音輸入法相比渠欺,它不用區(qū)分平、翹舌椎眯,不需要知道韻母挠将,沒有區(qū)分前、后鼻音等的煩惱编整。

根據(jù)王力德《漢字編碼的普及目標體系與編碼實例》的研究舔稀,在各種漢字屬性中,聲母和筆順在必修系數(shù)闹击、規(guī)范系數(shù)镶蹋、簡單系數(shù)和記憶系數(shù)四大方面得分都是最高的成艘,如下表所示赏半。

漢字屬性必修系數(shù)規(guī)范系數(shù)簡單系數(shù)記憶系數(shù)合計

表中,必修系數(shù)為某漢字屬性對 “中小學語文課所必修” 的隸屬度淆两,必修者為 1断箫,非必修者為 0。規(guī)范系數(shù)為某漢字屬性對規(guī)范性的隸屬度秋冰;完全明確且有公認的統(tǒng)一標準仲义,不產(chǎn)生歧義者為 1;基本有公認標準剑勾,但使用時存在比較大的模糊性為 0.5埃撵;沒有公認標準,無論范圍或分類全部都是各家任意規(guī)定虽另,模糊性相當嚴重者為 0暂刘。簡單系數(shù)為某漢字屬性對簡單性的隸屬度;簡單捂刺、直觀谣拣、易掌握者為 1募寨,有一定難度者為 0.5,難學者為 0森缠。記憶系數(shù)為某漢字屬性對記憶性的隸屬度拔鹰;某屬性種類少,記憶量少贵涵,無須強制記憶列肢,回生率低則為 1;反之為 0宾茂;介于兩者間的為 0.5例书。

聲筆簡碼僅僅使用了不分平翹舌的聲母和按書寫順序的筆畫,所以它在必修系數(shù)刻炒、規(guī)范系數(shù)决采、簡單系數(shù)和記憶系數(shù)四個方面都是最好的。不僅如此坟奥,漢字的筆畫信息還十分豐富树瞭,給編碼帶來了巨大的靈活性,可以做到伸縮自如爱谁。

2. 比五筆更高效

聲筆簡碼具有靜態(tài)編碼的 126 個簡碼字和 441 個簡碼二字詞晒喷,還有 105 個兩鍵數(shù)選簡詞和大量三鍵數(shù)選簡詞,對其它字詞的碼長還可以進行動態(tài)調(diào)整访敌,并且可以自動造詞凉敲、自動淘汰罕見詞組,使其能不斷地適應輸入者的需要寺旺,逐步成為專門為用戶量身定做的輸入法爷抓,比以速度見長的五筆字型輸入法的平均碼長還短得多。

根據(jù)北京語言文化大學的大型字頻率統(tǒng)計資料阻塑,抽取其中的 GB2312 漢字對幾個輸入法的單字輸入效率所作的統(tǒng)計分析蓝撇,在字均用鍵上進行比較的結果為:聲筆簡碼(3.1678)< 五筆字型(3.2658)< 自然碼(3.3061),均未計算標點符號陈莽。也就是說渤昌,聲筆簡碼的單字輸入效率比五筆字型提高了 3.09%,比自然碼提高了 4.37%走搁。對于大字符集(如 GBK 字符集和 GB18030 字符集)独柑,由于增加的都是不常見的漢字,所以對該統(tǒng)計結果基本上不會產(chǎn)生什么影響私植。不過忌栅,需要注意的是,統(tǒng)計是針對典型的漢字文本得出的兵琳,是在統(tǒng)計平均意義上的結果狂秘,并不排除有的文本會產(chǎn)生不同甚至相反的結果骇径。

上面討論的是完全用單字輸入漢字且不進行動態(tài)碼長調(diào)整的情況,而實際輸過程中往往是字詞混合輸入的者春,而且碼長是動態(tài)變化的破衔。由于詞組的數(shù)量非常龐大,而且不同的輸入法所收的詞組的數(shù)量和種類都不大一樣钱烟,因此要根據(jù)詞頻表來統(tǒng)計字詞混合輸入時各種輸入法的效率是非常困難的晰筛。不過,詞組輸入是聲筆簡碼的強項拴袭,字詞混輸加動態(tài)碼長調(diào)整時读第,聲筆簡碼的字均碼長僅為 1.6 左右,大大優(yōu)于五筆字型拥刻,因為五筆字型的字均碼長為 2.1 左右怜瞒。聲筆簡碼的動態(tài)碼長,從信息論的角度來講般哼,相當于利用通用數(shù)據(jù)壓縮算法對漢字信源進行了壓縮吴汪。數(shù)據(jù)壓縮技術的應用十分普遍,WinRar 和 WinZip 等常規(guī)數(shù)據(jù)壓縮軟件已經(jīng)成為現(xiàn)在人們使用的必備軟件了蒸眠。聲筆簡碼縮短碼長的原理與它們是類似的漾橙。

有人可能會馬上反駁說,聲筆簡碼的只有 126 個簡碼字楞卡、441 個簡碼詞和一些數(shù)選簡詞能夠盲打霜运,其它字詞的碼長會發(fā)生變化,打字時需要觀察提示行蒋腮,所以不能像全靜態(tài)的五筆或者小鶴音形那樣完全盲打淘捡,所以打不快。這種說法有一定道理徽惋,但并不完全正確案淋。動態(tài)碼長的字詞不能盲打座韵,這一點是對的险绘。但是,打不快就不一定對了誉碴。盲打固然能提高擊鍵速度(鍵速)宦棺,然而打字的速度不僅僅取決于鍵速,它還取決于平均碼長黔帕,因為打字速度 = 鍵速 / 碼長代咸。聲筆簡碼通過縮短碼長補償了鍵速的損失,從而同樣能實現(xiàn)高速打字成黄,取得中文錄入的高效率呐芥。更為主要的是逻杖,絕大多數(shù)人在絕大多數(shù)場合,其打字的使用場景都是有限的思瘟,而且其輸入的文本都是比較簡單的連續(xù)文本荸百,比如聊天、寫公文等滨攻,而且一般人的鍵速都不會很快够话,所以使用聲筆簡碼打字反而比使用五筆之類的輸入法來「盲打」更高效。

3. 便于鞏固中文

聲筆簡碼還是幫助人們鞏固語文知識的絕佳手段光绕。為什么呢女嘲?

現(xiàn)在絕大多數(shù)人使用的拼音輸入法完全沒有字形的信息,長期使用拼音輸入法以后诞帐,往往會產(chǎn)生「提筆忘字」的現(xiàn)象欣尼,有意無意地采用同音替代,如「突破」誤為「圖破」停蕉、「重點」誤為「終點」等媒至;而長期使用五筆字型之類純形碼,則常常會產(chǎn)生「見字失讀」的現(xiàn)象谷徙,打字時可能出現(xiàn)形似替代拒啰,如「緊」誤為「紫」、「租賃」誤為「租憑」等完慧。音形結合的輸入法谋旦,如自然碼和小鶴音形,則有利于克服這種窘境屈尼,但是需要同時掌握雙拼和拆分的雙形册着,學習難度相當大,雖然可能比學習五筆字型的門檻要低點脾歧。

聲筆簡碼也是一種音形結合的輸入法甲捏,但是用的是音里面最簡單的聲母(而且不分平翹舌)和形里面最簡單的筆畫(而且按筆順取)鞭执,所以學習難度非常低司顿。人們「提筆忘字」和「見字失讀」基本上都只是缺少聯(lián)想線索而導致想不起來了,而不是忘得一干二凈兄纺。只要稍加提示大溜,比如提示聲母或者首筆,就會「哦」的一下回憶起來估脆。故而钦奋,聲筆簡碼就以最小的代價,幫助人們鞏固了語文知識 —— 漢字的讀音和字形,而且筆畫和筆順是遵從國家標準的付材,不是五筆字型和其他音形碼那種非標準的拆分朦拖。不規(guī)范的部件和拆分僅僅是為了滿足漢字輸入的需要,不但不具備知識性厌衔,而且還會有誤導的作用贞谓。五筆在這方面比較突出,成為五筆被許多人詬病的原因之一葵诈。

實際上裸弦,純音碼輸入法和純形碼輸入法都是不完備的中文輸入法。純音碼輸入法遇到不知道讀音的字就無法輸入作喘,所以拼音輸入法提供了 U 模式理疙,用筆畫或部件來反查拼音。純形碼輸入法遇到想不起字形或者不會拆分的字也無法輸入泞坦,所以就會「卡殼」窖贤,需要通過拼音來反查字形,比如有的五筆用戶就干脆用「五筆拼音」混打模式贰锁,以便快速反查赃梧。

三、快速入門

聲筆簡碼極其簡單豌熄,沒有什么學習門坎授嘀。需要了解的基本內(nèi)容是:用 v 表示零聲母,用?aeuio?分別表示折锣险、橫蹄皱、撇、豎芯肤、點五種筆畫巷折。用一句話概括聲筆簡碼的話,可以說成是「簡拼加筆畫」崖咨。

雖然聲筆簡碼已經(jīng)非常簡單了锻拘,但是為了進一步減輕初學者的記憶負擔,在手機上提供了助記皮膚击蹲,可以長按?N?鍵打開或者關閉助記署拟。在打開時,給出了筆畫和零聲母用鍵(aeuio?和?v)的提示际邻,如下圖所示芯丧。如果是在電腦上,則可以把該圖放在電腦桌面上世曾,在打字的時候幫助記憶,一般幾分鐘就記住了。

聲筆簡碼的編碼規(guī)則和示例如下轮听。其中骗露,s 表示聲母(大寫的 S 則表示要用大寫字母,手機上大寫字母通過上滑對應字母鍵來輸入)血巍,不區(qū)分平翹舌萧锉,b 表示筆畫。b 為?aeuio述寡,s 為 b 之外的 21 個英文字母柿隙,數(shù)字表示第幾字(其中 0 表示末字),|?表示或者鲫凶。注意禀崖,在您輸入時,三碼及以上的字詞可能有變化螟炫,這是因為動態(tài)碼長調(diào)整的緣故(后面在動態(tài)碼長一節(jié)會專門講這一點)波附。

單字:sbbb,即聲母加前三個筆畫昼钻。一碼字的例子有就j_ 我w_ 沒m_(用_表示空格)掸屡,二碼字的例子有從cu 此ci 起qe 來le,三碼字的例子有接jei 威weu 凝noe 關gou然评,四碼字的例子有教jeie 錢quee 貌muoo 源yooe仅财。

二字詞:s1s2b2b2,即各字的聲母加第二字的前兩個筆畫碗淌。二碼二字詞的例子有關系gx 參加cj 東西dx 還有hy满着,三碼二字詞的例子有高興gxo 睡覺sjo 模范mfe 決定jdo,四碼二字詞的例子有答應dyoe 畫像hxui 估計gjoa 理想lxei贯莺。

三字詞:s1s2s3b3风喇,即各字的聲母加第三字的首筆。三碼三字詞的例子有計算機jsj 輸入法srf 想不到xbd缕探,四碼三字詞的例子有教師節(jié)jsje 殺人犯srfu 憲兵隊xbda魂莫。

多字詞:s1s2s3b0|S0,即前三字的聲母加末字的首筆或者聲母爹耗。三碼多字詞的例子有愛因斯坦vys 有限公司yxg 人民共和國rmg耙考,四碼三字詞的例子有聲東擊西sdje|sdjX 穿針引線czya|czyX 供銷合作社gxho|gxhS。

我們再來看一個綜合的例子:我們wm_ 大家dj_ 都dei 喜歡xh_ 研究yjo 中文zwo 輸入法srf潭兽。從這個例子可以看出倦始,聲筆簡碼的常用單字和詞組輸入效率非常高。

當一個字有多種不同的讀音且聲母不同時山卦,則可以用多種方法輸入該字鞋邑。例如,「盛」對應的拼音有?cheng?和?sheng,對應了 c 和 s 兩個不同的聲母枚碗,因而它在聲筆簡碼中也會有兩個編碼逾一,分別是?ceua?和?seua。

對于非成字偏旁部首肮雨,一般取其名稱首字的聲母作為它的聲母進行編碼遵堵。例如,「亻」的名稱為單人旁怨规,取「單」字的聲母 d 作為「亻」的聲母陌宿,可以用?duii?輸入「亻」。不知道非成字偏旁部首的名稱也沒有關系波丰,因始終可以用純筆畫的方式輸入壳坪。比如,「亻」可以用?uiiii?輸入呀舔。

有個別漢字和偏旁部首的筆順容易弄錯弥虐,在《總體介紹》的附錄二中羅列了出來,建議對不熟習筆畫的人專門練習一下媚赖。熟練掌握正確的漢字筆畫霜瘪,是用好聲筆簡碼的前提條件,也是用聲筆系列碼其它輸入法的前提條件惧磺,必須高度重視颖对。因為筆畫和筆順是一種語文知識拙徽,所以系統(tǒng)沒有為其提供容錯碼悔橄,即用戶必須使用正確的筆畫和筆順才能輸入。

在學習簡碼之初自娩,往往會遇到不會打的字番捂。怎么辦呢个唧?系統(tǒng)提供了用筆畫或拼音來反查編碼的手段。在不知道讀音的時候直接用?aeuio?按順序輸入筆畫進行反查设预,在不知道筆畫時用 a 引導拼音反查(注意零聲母要用 v)徙歼。以下是幾個反查的例子。

另外鳖枕,通過 i 引導的拼音還支持用字海兩分法來進行反查魄梯, 支持查找八萬多漢字,一般用于難讀而易于兩分的字進行反查或者 GBK 以外字的輸入宾符。GBK 以外的字酿秸,簡碼不提供正常編碼,不能按正常方式輸入魏烫,只能在兩分查找到后選擇輸入辣苏。下面是字海兩分法查找的例子肝箱。

四、連續(xù)頂屏

在傳統(tǒng)字詞型輸入法如五筆字型中考润,當字詞的碼長不足四時狭园,需要用空格上屏读处,只有碼長為四時的首選字詞才能省略空格糊治。在聲筆簡碼中,除了一碼字和二碼詞外罚舱,所有的字詞在后續(xù)非筆畫編碼字符時都可以被頂上屏幕井辜,無論是否達到最大碼長都可以。所以說管闷,聲筆簡碼具有「頂功」粥脚,可以大大地節(jié)約用鍵,提高輸入效率包个。

例如刷允,五筆字型的二碼字吧kc 給xw?和三碼字華wxf 動fcl?都是需要空格上屏的。聲筆簡碼中的二碼字碧囊,如從cu 此ci?和三碼字接jei 威weu树灶,在連續(xù)的輸入過程中一般都是不需要空格的。另外糯而,聲筆簡碼中的三碼詞天通,如高興gxo 計算機jsj,也是不需要空格的熄驼。

再如像寒,同樣是用純單字輸入中國人民站起來了。這句話瓜贾。用五筆字型輸入時的用鍵為?k_l_w_n_uh_fhn_go_b.诺祸,共使用了 20 鍵。用聲筆簡碼輸入時的用鍵為?zigir_mazoeqelel.祭芦,共使用了 17 鍵筷笨,其中「站」字也有可能是用 4、5 鍵实束,因為大于二碼的字輸入碼不是固定的奥秆。用搜狗拼音輸入時,則完全沒有固定的輸入方法咸灿,它所有字的編碼默認都是動態(tài)變化的构订,所以它的用鍵會在 17 到數(shù)十鍵不等。

正是由于連續(xù)頂屏的優(yōu)勢避矢,使得聲筆簡碼的純單字輸入平均碼長在沒有動態(tài)碼長調(diào)整的情況下也只有 3.1678悼瘾,低于五筆字型的 3.2658囊榜。這是一個讓人吃驚的結果,因為聲筆簡碼的單字輸入是其弱項亥宿,居然比歷史上以快速著稱的五筆字型單字碼長還短卸勺。

五、字詞分流

在傳統(tǒng)輸入法如五筆字型中烫扼,四碼的字曙求、詞是混合編碼的,它們共享同一個編碼空間映企。在發(fā)生重碼時悟狱,究竟把單字排在前面,還是把詞組排在前面堰氓,面臨艱難的決策挤渐。當收錄的單字和詞組數(shù)量增大時,這個問題會變得更加突出双絮。

在聲筆簡碼中浴麻,單字和詞組各自有不同的編碼格式,甚至不同類型的詞組也有不同的格式囤攀,它們享有不同的編碼空間软免,不會發(fā)生沖突,不存在單字和詞組那個優(yōu)先的問題抚岗。單字肯定是用?sbbb?格式或杠,二字詞肯定是用?s1s2b2b2?格式,三字詞肯定是用?s1s2s3b3?格式宣蔚,多字詞肯定是用?s1s2s3b0|S0?格式向抢。只有多字詞的?s1s2s3b0?格式與三字詞共享一個編碼空間,其它編碼空間都是獨立的胚委,互不干擾挟鸠。

例如,四碼字教jeie 錢quee 貌muoo 源yooe亩冬,四碼二字詞答應dyoe 畫像hxui 估計gjoa 理想lxei艘希,四碼三字詞和多字詞教師節(jié)jsje 殺人犯srfu 聲東擊西sdje 供銷合作社gxho,它們之間是絕對不會重碼的硅急。

六覆享、字母選重

傳統(tǒng)輸入法通常都是用數(shù)字鍵來選擇重碼字詞。由于擊打數(shù)字鍵需要跨行進行营袜,容易產(chǎn)生誤擊撒顿,一般人都無法盲打,所以會嚴重影響輸入速度荚板。搜狗拼音雖然可以設置用字母選擇重碼字詞凤壁,但是必須先用空格鍵引導吩屹,效果大打折扣。

拼音用戶對數(shù)字鍵的依賴程度比五筆用戶高得多拧抖,熟練的五筆用戶只在輸入四碼后出現(xiàn)重碼時煤搜,才會使用數(shù)字鍵選擇,有的甚至通過左右 Shift 鍵選擇 1唧席、2 重碼來避免使用數(shù)字鍵擦盾,以便提高擊鍵率,降低誤擊率袱吆。搜狗拼音的重碼很多厌衙,前后翻頁的操作很頻繁距淫,所以它把逗號和句號鍵作為默認的前后翻頁鍵绞绒,以便快速、準確地翻頁榕暇。但是蓬衡,這樣做又使得在輸入逗號和句號這兩個常見標點符號時無法進行頂屏而實現(xiàn)快速輸入。

在聲筆簡碼中彤枢,當輸入的編碼達到四碼時狰晚,如果有重碼字詞,那么就用?aeuio?兼做重碼選擇鍵缴啡。這時壁晒,重碼字前的?aeuio?并不代表筆畫,僅僅表示出現(xiàn)的順序业栅,和傳統(tǒng)輸入法的數(shù)字選擇鍵作用完全一樣秒咐。不過,用戶在擊打?aeuio?時要比擊打數(shù)字鍵方便碘裕、快速得多携取。

例如,搜狗拼音輸入?jiao?時帮孔,會出現(xiàn)很多同音字供用數(shù)字鍵選擇雷滋,可能的選項如下,因動態(tài)調(diào)頻的原因文兢,結果會有出入晤斩。

聲筆簡碼則不一樣,在輸入?juau?時姆坚,出現(xiàn)的重碼字則是用?aeuio?選擇澳泵,可能的選項也會因動態(tài)碼長調(diào)整而發(fā)生變化。

再如旷偿,搜狗拼音輸入?shij?時烹俗,會出現(xiàn)很多同音詞爆侣,需要用數(shù)字鍵選擇,可能的選項如下幢妄,因動態(tài)調(diào)頻的原因兔仰,您的結果可能會有出入,如下所示:

而在聲筆簡碼中蕉鸳,輸入 sjoo 后乎赴,可能的結果如下。

此時潮尝,如果要輸入「視覺」一詞榕吼,則用?e?進行選擇;如果要輸入「圣潔」一詞勉失,則用?o?進行選擇羹蚣。

七、擴展編碼

聲筆簡碼的四碼空間很小乱凿,單字的?sbbb?四碼空間只有?21×5×5×5 = 2,625?個碼位顽素,二字詞的?ssbb?四碼空間只有?21×21×5×5 = 11,025,三字詞和多字詞的?sssb?四碼空間也不大徒蟆,為?21×21×21×5 = 46,305?個碼位胁出。多字詞的?sssS?四碼空間比較大,為?21×21×21×21 = 194,481?個碼位段审,但它只是一種備用的輸入方式全蝶。

與上述四碼空間形成鮮明對照的是,聲筆簡碼收錄了?GBK?字集超過兩萬的漢字寺枉,收錄的詞組數(shù)量有 48 萬多抑淫,其中二字詞有近 20 萬。所以型凳,無論是單字還是詞組丈冬,四碼時的重碼現(xiàn)象都很嚴重。即使比較常用的字詞甘畅,都有可能需要翻頁埂蕊,甚至數(shù)次翻頁來輸入。翻頁查找屬于強交互的操作疏唾,每頁都需要用眼睛掃瞄六個選項蓄氧,是非常耗費時間的,會大大降低輸入效率槐脏,而且容易看花眼而出錯喉童。

聲筆簡碼首創(chuàng)了擴展編碼,利用編碼的頂功特性顿天,通過追加兩個筆畫就能迅速擴大 25 倍的編碼空間堂氯,可以快速篩選出所需的重碼字詞蔑担。結合后述動態(tài)碼長的使用,完美地兼顧了編碼空間與輸入效率咽白,既能享有巨大的編碼空間啤握,又能具有很短的平均碼長,兩全其美晶框。

比如排抬,「揪」字在第一次輸入時,在輸入?jeie?后需要按三次翻頁鍵授段,然后再用?a?選擇蹲蒲,如下圖所示。每翻一頁侵贵,都需要用眼睛掃視 6 個選項届搁,人機交互頻繁,既費眼又累心模燥,效率很低咖祭。

然而,如果再追加兩個筆畫的話蔫骂,「揪」字就成了第一選項,如下圖所示牺汤。

可見辽旋,在輸入罕見字時,通過追加兩個筆畫檐迟,會大大地提高輸入效率补胚。聲筆簡碼將四碼選重和擴展編碼有機結合,是一大創(chuàng)新追迟,既能照顧初學者的傳統(tǒng)輸入習慣溶其,又能讓高級用戶采用更快速的輸入方法,做到在日常的輸入過程中幾乎不進行翻頁操作敦间。

搜狗拼音在輸入罕見字時瓶逃,也可以追加筆畫或者部件編碼來減少重碼,但是需要用 TAB 鍵手動觸發(fā)加碼模式廓块,同時需要空格或者數(shù)字鍵上屏厢绝,顯得非常笨拙。例如带猴,輸入「揪」字時昔汉,要用?jiuTABpz2。TAB?鍵和數(shù)字鍵比?aeoiu?難操作得多拴清。

再如靶病,「轉正」一詞在第一次輸入時会通,在輸入?zzei?后需要按七次翻頁鍵,即出現(xiàn)在第八頁上娄周,然后再用?a?選擇渴语,如下圖所示。每一頁昆咽,都需要用眼睛掃視 6 個選項驾凶,人機交互頻繁,效率很低掷酗。

然而调违,如果再追加第一字前兩個筆畫的話,「轉正」就出現(xiàn)在第一頁上泻轰,只需用?e?選擇上屏就可以了技肩,如下圖所示。

可見浮声,在輸入重碼太多的二字詞時虚婿,通過追加首字頭兩個筆畫,會大大地提高輸入效率泳挥。

三字詞和多字詞也可以類似地使用擴展編碼然痊。比如,「舊石器」一詞在第一次輸入時屉符,在輸入?jsqi?后需要按多次翻頁鍵剧浸,然后再進行選擇,效率比較低矗钟,但是在追加首字的前兩筆?ii?后它就出現(xiàn)在第一頁上了唆香。再如,「今生今世」在第一次輸入時吨艇,輸入?jsje?后需要按多次翻頁鍵才能找到躬它,而在加上首字的前兩筆?uo?后就出現(xiàn)在第一頁上了。

八东涡、動態(tài)碼長

在聲筆簡碼中冯吓,當某個字詞在輸入時若碼長大于三,它的碼長可能會被自動縮短软啼,下次輸入該字詞時就可以少用按鍵了桑谍,其它的字詞輸入碼則依次向后推移。這就是所謂的動態(tài)碼長調(diào)整祸挪。

例如锣披,在第一次輸入「狡」字時,如果是用?juau?后選擇?a?上屏的,那么下次輸入可能就只需要?juau?了雹仿,再下次輸入就只要?jua?了增热。可見胧辽,自動碼長可以大大地縮短碼長峻仇,有效地提高輸入速度。

搜狗拼音的調(diào)頻與自動碼長有些類似邑商,而五筆字型則沒有動態(tài)調(diào)整功能摄咆。搜狗拼音在輸入?jiao?后需要翻頁 7 次再用數(shù)字鍵選擇才能將「狡」字上屏,然后再輸入?j?時人断,「狡」字就出現(xiàn)在第一頁上了吭从,但是仍然要用數(shù)字選擇上屏。五筆字型在輸入「狡」字時恶迈,始終使用?qtu?加空格涩金。

再如,在第一次輸入「視覺」一詞時暇仲,如果是用?sjoo?后選擇?e?上屏的步做,那么下次輸入可能就只需要?sjo?就可以了,節(jié)約了兩鍵奈附,如下所示全度。

如果第一次輸入某個字詞時需要多次翻頁,那么節(jié)約的用鍵就更多了桅狠。動態(tài)碼長調(diào)整對用擴展編碼輸入的字詞也是有效的讼载。比如, 「揪」 字中跌,在用?jeieue?輸入后,下次輸入時可能就只需要用?jei?就可以了菇篡。當然漩符,如果此后?jei?又因自動碼長調(diào)整被別的單字所用的話,「揪」字就會被向后推到?jeie?上去驱还。

九嗜暴、自動詞組

聲筆簡碼具有自動詞組功能。也就是說议蟆,它能夠利用用戶之前輸入的字詞來自動創(chuàng)造新的詞組闷沥,同時也能夠將用戶幾乎不使用的新造詞組自動清除。對于少量暫時還未被清理的廢詞咐容,用戶不必理會舆逃,到時限后就會被自動刪除。在必要的時候,如用戶錯誤地確認了臨時詞組路狮,系統(tǒng)也提供了手動刪除的手段虫啥,方法是先將光標移動到該詞上面,再按?Control + Delete?鍵來刪除奄妨。注意涂籽,如果是非臨時詞組,需要刪除兩次才能刪除砸抛。第一次刪除時只是把它變成了臨時詞組评雌。在安卓手機上的刪除方法是,用左右滑動空格定位詞組直焙,再用刪詞鍵來刪除景东。

例如,如果要造「聲筆」一詞箕般,可以先按單字方式輸入聲和筆耐薯。然后,按詞組方式輸入?sbue丝里,由于系統(tǒng)詞的重碼已經(jīng)超過一頁曲初,需要翻頁找到聲筆一詞,或者追加「聲」的前兩筆?ei?來快速過濾重碼杯聚,快速找到造好的詞組臼婆,或者用?TAB?快速定位到重碼詞的末尾。在選擇輸入一次新造的「聲筆」后幌绍,它的碼長就會動態(tài)地縮短颁褂,下次輸入的時候可能就只需要?sbu?或者?sbue?了。

再如傀广,要造「聲筆碼」的話颁独,若前面已經(jīng)造好了「聲筆」,所以可以拆成「聲筆」和「碼」來輸入伪冰。然后誓酒,按三字詞方式輸入?sbme,按?TAB?快速定位新詞贮聂,可見臨時詞組「聲筆碼」已經(jīng)造好了靠柑。選擇上屏一次后,「聲筆碼」就會成為正常的詞組吓懈,而且它的輸入碼長可能縮短歼冰。

最后,如果要造「聲筆簡碼」一詞耻警,可以先輸入「聲筆」和「簡碼」隔嫡。下次多字詞方式輸入?sbje?或者?sbjM?時就有「聲筆簡碼」 一詞了甸怕。

當然,在用戶不知道系統(tǒng)中有某個詞組的時候畔勤,如果按照詞組的方式來輸入蕾各,就可能因為系統(tǒng)沒有該詞而找不到想要的詞組,即發(fā)生所謂打空的情況庆揪。此時式曲,建議用?ESC?鍵一次清楚編碼,拆開打一次就能夠自動造出想要的詞組缸榛,供下次使用吝羞。

需要注意的是,為了避免發(fā)生組合爆炸内颗,產(chǎn)生太多的垃圾詞組钧排,系統(tǒng)默認限制了自動造詞的最大長度為 5,且不能有非漢字字符均澳。另外恨溜,在進行枚舉式自動造詞的時候,是以編碼對應的字找前、詞為單位來進行組合的糟袁,并不是以單字為單位的。例如躺盛,在輸入聲筆sbu 系列xleu 碼meu?后项戴,生成的詞組為「聲筆系列碼」「聲筆系列」「系列碼」,而不會生成「聲筆系」「筆系列」「列碼」等槽惫。另外周叮,如果造詞之后馬上使用了退格鍵,系統(tǒng)就會自動刪除所造的詞組界斜;中間夾雜有非漢字的話仿耽,也會中斷造詞。

十各薇、數(shù)選簡詞

聲筆簡碼的二字詞空間非常有限氓仲,造成四碼時的選重頻繁或者常用字詞的碼長較長。為了緩解這種情況得糜,特提供了 105 個 sn 型數(shù)選簡詞,其中 n 為用數(shù)字表示的筆畫晰洒,即?23789?分別對應?aeuio朝抖,表示折橫撇豎捺。在編碼格式上谍珊,sn 型的數(shù)選簡詞為首字的聲母加第二字的首筆治宣。在輸入的時候,對這些數(shù)選簡詞進行了提示,以方便用戶使用侮邀,避免死記硬背坏怪,下圖是幾個例子。

值得注意的是绊茧,數(shù)選字詞的使用不是強制性的铝宵,用戶可以根據(jù)自己的情況或多或少的使用。不過华畏,建議用戶將牢記 105 個 sn 型簡詞鹏秋,可以顯著提高輸入效率。

十一亡笑、設置選項

(1) 詞組過濾

對聲筆簡碼來說侣夷,在默認情況下,多字詞有?s1s2s3b0?和?s1s2s3S0?兩種輸入方式仑乌,其中?s1s2s3b0?與三字詞的編碼空間是重疊的百拓,有時重碼現(xiàn)象比較嚴重。如果希望多字詞只用?s1s2s3S0?方式輸入晰甚,那么就可以將 Translator 下的 enable_filtering 選項設置為 true衙传,以過濾掉?s1s2s3b0?上的多字詞,如下圖所示压汪。這樣粪牲,三字詞和多字詞之間就實現(xiàn)了編碼空間的分離。

(2) 小寫模式

對聲筆簡碼來說止剖,在默認情況下腺阳,多字詞的第四碼可以用大寫字母來輸入,而傳統(tǒng)上是用小寫字母來輸入的穿香。如果希望第四碼用小寫字母亭引,那么可以將 lower_case 選項設置為 true。不過皮获,這樣的話焙蚓,三字詞就不能三碼起頂屏了,三碼時需要空格才能上屏洒宝。一般會配合詞組過濾選項使用购公,實現(xiàn)三字詞和多字詞獨立享用不同的編碼空間,主要用于多字詞的使用比三字詞更加頻繁的時候雁歌。

十二宏浩、聲筆簡整

聲筆簡整是聲筆簡碼的整句模式。它不需要考慮單字靠瞎、二字詞比庄、三字詞和多字詞的不同編碼規(guī)則求妹,只需要知道單字的編碼就可以進行中文輸入了,比已經(jīng)非常簡單的聲筆簡碼還要簡單佳窑。但是制恍,它的缺點是用鍵較多,在輸入發(fā)生錯誤后回改的成本高神凑,離散程度高的文本尤其如此净神。所以,聲筆簡整僅適合錄入簡單的連續(xù)文本耙厚,或者供聲筆簡碼的初學者使用强挫。

聲筆簡整固定了 21 個最常用的一簡字,只需要一碼薛躬,其它字可以采用二至六碼俯渤。既可以使用詞組,也可以使用短語來輸入型宝,但是盡量不要使用長句八匠。這樣,編碼空間得到了有效的利用趴酣,重碼也得到了有效的離散梨树,還能減少回改的概率。

問題是岖寞,在什么時候用兩碼抡四,什么時候用三碼,什么時候又用四仗谆、五指巡、六碼呢?什么時候用詞組隶垮,什么時候又用短語呢藻雪?一般來說,越常用的字詞狸吞,碼長可以用得越短勉耀;越不常見的字詞,碼長應當越長蹋偏。容易發(fā)生歧義的地方便斥,就應該常用詞組及時上屏行瑞,以避免已經(jīng)輸入的正確內(nèi)容被篡改伞广。如何把握火候邢享,就需要經(jīng)驗的積累了鸳劳。

聲筆簡整還提供了快速定位的手段,可以利用數(shù)字?1234?將光標一次性地定位到待定的第 1 至 4 個音節(jié)之前尘执,用?5?將光標定位到最后礼搁,而 TAB 可以快速從當前位置向前逐個音節(jié)移動瀑构。

下面舉例說明一下聲筆簡整的輸入方法葫掉。注意您的輸入結果很可能是不一樣的些举,因為用戶數(shù)積累的用戶詞匯和字詞調(diào)頻會影響轉換的結果。

例 1:我們大家都喜歡研究輸入法

輸入:我們wm_ 大家dj_ 都喜歡deixhao_ 研究yjo_ 輸入法srf_

在上例中俭厚,我們户魏、大家和輸入法都使用了簡拼,都喜歡和研究的采用了簡拼和聲筆的混合編碼挪挤。當然叼丑,以上的輸入方式不是唯一的。

例 2:聲筆系列碼的頂功特色

在例 2 中扛门,由于聲筆系列碼和頂功這兩個短語和詞組在系統(tǒng)詞庫中是不存在的鸠信,可以先按每字聲母加兩個筆畫的方式輸入,用?12345?進行快速定位回改论寨,待系統(tǒng)造好短語和詞組后星立,再用更簡便的方式來輸入。這個例子一次輸入了十個字葬凳,雖然每個字都用了三碼绰垂,回改的地方還是比較多,回改成本是比較高的火焰,不是推薦的方法劲装,應采用詞組或短語為單位來輸入,就可以增加確定性昌简,減少回改量占业。

附錄:聲筆簡碼的編碼格式

為了便于用戶總結和記憶聲筆簡碼的基本內(nèi)容,現(xiàn)將其字詞的編碼格式以濃縮的表達式方式總結如下江场。

單字:sb^b'b(bb)x纺酸,即聲母加前三個筆畫,可選地加第四址否、五筆餐蔬,然后選擇重碼。

二字詞:s1s2b2^'b2(b1b1)x佑附,即兩字的聲母加第二字的前兩個筆畫樊诺,可選地加首字的第一、二筆音同,然后選擇重碼词爬。

三字詞:s1s2s3^'b3(b1b1)x,即三字的聲母加第三字的首筆权均,可選地加首字的第一顿膨、二筆锅锨,然后選擇重碼。

多字詞:s1s2s3^'b0|S0(b1b1)x恋沃,即前三字的聲母加末字的聲母或者首筆必搞,可選地加首字的第一、二筆囊咏,然后選擇重碼恕洲。

其中,s 表示聲母(大寫的 S 則表示要用大寫字母)梅割,不區(qū)分平翹舌霜第,b 表示筆畫,x 表示選擇重碼户辞。b 和 x 用元音?aeuio泌类,s 用剩余的 21 個英文字母,數(shù)字表示第幾字(其中 0 表示末字)咆课,^ 表示起始頂屏碼位末誓,’表示起始碼長調(diào)整位。

最后編輯于
?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末书蚪,一起剝皮案震驚了整個濱河市喇澡,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌殊校,老刑警劉巖晴玖,帶你破解...
    沈念sama閱讀 223,126評論 6 520
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異为流,居然都是意外死亡呕屎,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,421評論 3 400
  • 文/潘曉璐 我一進店門敬察,熙熙樓的掌柜王于貴愁眉苦臉地迎上來秀睛,“玉大人,你說我怎么就攤上這事莲祸□灏玻” “怎么了?”我有些...
    開封第一講書人閱讀 169,941評論 0 366
  • 文/不壞的土叔 我叫張陵锐帜,是天一觀的道長田盈。 經(jīng)常有香客問我,道長缴阎,這世上最難降的妖魔是什么允瞧? 我笑而不...
    開封第一講書人閱讀 60,294評論 1 300
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上述暂,老公的妹妹穿的比我還像新娘痹升。我一直安慰自己,他們只是感情好贸典,可當我...
    茶點故事閱讀 69,295評論 6 398
  • 文/花漫 我一把揭開白布视卢。 她就那樣靜靜地躺著,像睡著了一般廊驼。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上惋砂,一...
    開封第一講書人閱讀 52,874評論 1 314
  • 那天妒挎,我揣著相機與錄音,去河邊找鬼西饵。 笑死酝掩,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的眷柔。 我是一名探鬼主播期虾,決...
    沈念sama閱讀 41,285評論 3 424
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼驯嘱!你這毒婦竟也來了镶苞?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 40,249評論 0 277
  • 序言:老撾萬榮一對情侶失蹤鞠评,失蹤者是張志新(化名)和其女友劉穎茂蚓,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體剃幌,經(jīng)...
    沈念sama閱讀 46,760評論 1 321
  • 正文 獨居荒郊野嶺守林人離奇死亡聋涨,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,840評論 3 343
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了负乡。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片牍白。...
    茶點故事閱讀 40,973評論 1 354
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖抖棘,靈堂內(nèi)的尸體忽然破棺而出茂腥,到底是詐尸還是另有隱情,我是刑警寧澤钉答,帶...
    沈念sama閱讀 36,631評論 5 351
  • 正文 年R本政府宣布础芍,位于F島的核電站,受9級特大地震影響数尿,放射性物質(zhì)發(fā)生泄漏仑性。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 42,315評論 3 336
  • 文/蒙蒙 一右蹦、第九天 我趴在偏房一處隱蔽的房頂上張望诊杆。 院中可真熱鬧歼捐,春花似錦、人聲如沸晨汹。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,797評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽淘这。三九已至剥扣,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間铝穷,已是汗流浹背钠怯。 一陣腳步聲響...
    開封第一講書人閱讀 33,926評論 1 275
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留曙聂,地道東北人晦炊。 一個月前我還...
    沈念sama閱讀 49,431評論 3 379
  • 正文 我出身青樓,卻偏偏與公主長得像宁脊,于是被迫代替她去往敵國和親断国。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 45,982評論 2 361

推薦閱讀更多精彩內(nèi)容