3 實(shí)用系統(tǒng)
3.1 實(shí)用系統(tǒng)分類(lèi)
最常見(jiàn)的分類(lèi)法是按編碼時(shí)使用的特征信息元(或稱(chēng)字元)將漢字編碼輸入法分為音碼迄靠、形碼妻献、音形碼和形音碼晚碾。音碼又可以細(xì)分為全拼碼糯耍、雙拼碼扔字、簡(jiǎn)拼碼。形碼又可以細(xì)分為部件碼和筆畫(huà)碼温技。部件碼需要將漢字拆分為部件或字根革为,再將它們通過(guò)音托、位托舵鳞、形托等方式映射到鍵盤(pán)字符震檩。音形碼以音為主以形為輔。形音碼以形為主以音為輔蜓堕。
另外抛虏,按處理對(duì)象大小來(lái)分,漢字編碼輸入法可以采用單字型套才、字詞型和語(yǔ)句型迂猴;按適用的輸入者來(lái)分,漢字編碼輸入法可以分為普及型與專(zhuān)業(yè)型霜旧;按編碼時(shí)使用的字符來(lái)分错忱,漢字編碼輸入法可以分為字母碼和數(shù)字碼;按軟件的適應(yīng)性來(lái)分挂据,漢字編碼輸入法可以分為通用輸入法平臺(tái)(又稱(chēng)碼表輸入法)和專(zhuān)用輸入法(或稱(chēng)定制輸入法)以清;按使用的鍵盤(pán)來(lái)分,漢字編碼輸入法可以分為通用鍵盤(pán)輸入法和數(shù)字鍵盤(pán)輸入法崎逃。
最后掷倔,還可以按照漢字編碼輸入的發(fā)展歷程將其分代。目前个绍,分代方法并沒(méi)有形成共識(shí)勒葱。漢字編碼輸入法究竟分為幾代?每一代的特征是什么巴柿?這些問(wèn)題都有不同的看法凛虽。吳越將漢字編碼輸入法分為三代。其斷代標(biāo)志為:第一代广恢,以單音節(jié)的字為單位輸入凯旋;第二代,以詞語(yǔ)(包括單音節(jié)和多音節(jié))為單位輸入;第三代至非,除了有固定詞庫(kù)可以用通用詞輸入外钠署,還可以根據(jù)用戶(hù)的需要自造詞語(yǔ),并具有人工智能荒椭,可以自動(dòng)選擇區(qū)分重碼(同音)詞 [28]谐鼎。單波也將漢字編碼分為三代,但是各代的特征與吳越所描述的大不一樣 [29]趣惠。
本文在敘述時(shí)狸棍,按歷史發(fā)展進(jìn)程把漢字編碼輸入法分為第一代、第二代信卡、第三代隔缀,各代的特征與單波和吳越描述的都不一樣,在具體論述時(shí)會(huì)加以說(shuō)明傍菇。由于除第一代外,各代的漢字編碼輸入法的數(shù)量都很多界赔,因此本文只能選擇具有代表型的和具有較大影響的作比較詳細(xì)的介紹丢习。數(shù)字鍵盤(pán)編碼輸入法,作為目前大家的研究熱點(diǎn)淮悼,單列出來(lái)進(jìn)行評(píng)述咐低。最后,單獨(dú)介紹一下比較常見(jiàn)的通用輸入法平臺(tái)袜腥。
3.2 第一代漢字編碼輸入法
電子工業(yè)部第六所于 1983 年正式公布了我國(guó)第一個(gè)中文磁盤(pán)操作系統(tǒng) CC-DOS见擦,這在我國(guó)中文信息處理歷史上具有劃時(shí)代的意義。CC-DOS 是在 PC-DOS 的基礎(chǔ)上擴(kuò)充羹令、修改而成鲤屡。在廣泛使用的 CC-DOS 2.1 版中,有簡(jiǎn)拼福侈、首尾碼酒来、快速碼和區(qū)位碼輸入法,已經(jīng)涵蓋了包括音碼肪凛、形碼堰汉、音形碼和數(shù)字碼這些主要類(lèi)型的輸入法,對(duì)我國(guó)計(jì)算機(jī)應(yīng)用的普及起到了開(kāi)路先鋒的作用伟墙。
當(dāng)時(shí)使用得最廣泛的輸入法是簡(jiǎn)拼和首尾碼翘鸭。簡(jiǎn)拼是純音碼,使用的是介于全拼和雙拼之間的一種拼音方法戳葵,對(duì)三個(gè)及三個(gè)字母以上的韻母進(jìn)行了壓縮就乓。首尾碼是一種純形碼,包含 97 個(gè)部件,分為 52 類(lèi)档址;部件到鍵盤(pán)字母的映射沒(méi)有太多的規(guī)律可循盹兢,記憶量很大;編碼時(shí)只取字首和字尾各一個(gè)部件守伸,對(duì)于未列出的變形部件需要輸入者自己去猜測(cè)其應(yīng)歸屬的鍵位绎秒。這兩種方法都不支持聯(lián)想,也不支持詞組尼摹,都有很多重碼见芹。因此,在輸入時(shí)選擇蠢涝、翻頁(yè)操作很頻繁玄呛,眼睛需要不斷地掃描提示行以便在眾多的重碼中找尋所需的字,輸?shù)糜掷塾致投豢赡軐?shí)現(xiàn)盲打徘铝。
快速碼是通過(guò)壓縮拼音加碼方法實(shí)現(xiàn)的,可以在一定的程度上離散重碼惯吕。由于快速碼的加碼方法沒(méi)有規(guī)律可循惕它,因此沒(méi)有得到真正的應(yīng)用。區(qū)位碼需要完全要靠死記 6763 個(gè)漢字和符號(hào)的數(shù)字編碼來(lái)輸入废登,因此除了用于輸入當(dāng)時(shí)還沒(méi)有其它辦法輸入的特殊符號(hào)外淹魄,基本上沒(méi)有人實(shí)際使用。盡管如此堡距,快速碼仍然為后來(lái)的音甲锡、形結(jié)合編碼指出了方向,區(qū)位碼仍然為后來(lái)的數(shù)字碼提供了一條線索羽戒,它們的理論指導(dǎo)意義大于實(shí)用意義缤沦。
另一個(gè)早期的漢字編碼輸入法是電報(bào)碼。電報(bào)碼最初并不是用于漢字輸入的半醉,而是用于拍發(fā)電報(bào)的疚俱,是最早的漢字?jǐn)?shù)碼方案。電報(bào)碼由丹麥人設(shè)計(jì)缩多,早在清光緒六年(1880 年)就已經(jīng)在我國(guó)使用了呆奕。電報(bào)碼為 4 位等長(zhǎng)碼方案,使用的碼字從 0000 到 9999衬吆,可以代表一萬(wàn)個(gè)字符(包括漢字梁钾、字母、符號(hào))逊抡。電報(bào)碼沒(méi)有重碼姆泻,但編碼的規(guī)律性不強(qiáng)零酪,十分難記。因此拇勃,它完全是為了郵電部門(mén)那些已經(jīng)熟悉電報(bào)碼的人的需要而移植進(jìn)計(jì)算機(jī)的四苇,對(duì)一般的漢字輸入者沒(méi)有什么意義。
1986 年方咆,聯(lián)想集團(tuán)在推出聯(lián)想漢卡的同時(shí)推出了聯(lián)想式漢字環(huán)境月腋,首先使用了聯(lián)想方法來(lái)加快漢字的輸入。那時(shí)還沒(méi)有詞組輸入方法瓣赂,聯(lián)想技術(shù)讓人耳目一新榆骚。漢字輸入過(guò)程由原來(lái)的編碼 -> 翻頁(yè) -> 選擇 -> 編碼… 變成了編碼 -> 選擇 -> 選擇…,因此稍后的很多輸入法都采用了這種技術(shù)煌集。不過(guò)妓肢,按照現(xiàn)代漢字編碼輸入技術(shù)的標(biāo)準(zhǔn)來(lái)看,聯(lián)想技術(shù)仍然存在兩個(gè)致命的弱點(diǎn)苫纤。一個(gè)弱點(diǎn)是碉钠,如果后續(xù)要輸入的字與前面已輸入的字不能構(gòu)成詞組的話,則聯(lián)想就會(huì)失敗卷拘。另一個(gè)弱點(diǎn)是放钦,聯(lián)想選擇時(shí)人機(jī)交互過(guò)于平凡,雖然平均碼長(zhǎng)縮短了恭金,但是實(shí)際的輸入速度反而會(huì)下降。
總之褂策,第一代漢字編碼輸入法是在漢字操作系統(tǒng)建立的同時(shí)誕生的横腿。在西文操作系統(tǒng)上實(shí)現(xiàn)漢字操作系統(tǒng)有許多工作要做,例如漢字字模的設(shè)計(jì)斤寂、漢字的顯示耿焊、打印等等,漢字的輸入僅僅是其中的一個(gè)部分遍搞。那時(shí)罗侯,漢字操作系統(tǒng)是由計(jì)算機(jī)專(zhuān)家完成的,漢字編碼專(zhuān)家?guī)缀跷茨軈⑴c其中溪猿,雖然當(dāng)時(shí)已有一些人在專(zhuān)門(mén)搞漢字編碼了钩杰。由于計(jì)算機(jī)的價(jià)格還很昂貴,漢字系統(tǒng)的用戶(hù)很少诊县。漢字編碼輸入法使得漢字能夠輸入計(jì)算機(jī)了讲弄,但幾乎還沒(méi)有考慮易學(xué)、易用和快速的問(wèn)題依痊。
第一代漢字編碼輸入法的特點(diǎn)是:在 DOS 環(huán)境下避除,以單字為單位進(jìn)行輸入,在屏幕底部提供專(zhuān)門(mén)的提示行顯示數(shù)量眾多的重碼字,翻頁(yè)瓶摆、選擇操作頻繁凉逛;用數(shù)字鍵選擇重碼字,用 ALT + 數(shù)字鍵可重復(fù)選擇出現(xiàn)在提示行中的重碼字群井;連極為常用的標(biāo)點(diǎn)符號(hào)的輸入需要使用區(qū)位碼状飞,很不方便;聯(lián)想技術(shù)的采用使輸入效率有所改善蝌借,但其作用是相當(dāng)有限的昔瞧;各種輸入法間的切換(包括切換到英文)都是通過(guò)復(fù)合功能鍵 ALT+Fn (F1-F12) 來(lái)進(jìn)行的;支持全角和半角方式菩佑,但不支持中文標(biāo)點(diǎn)方式自晰;不支持詞組輸入,更不支持自定義詞組稍坯。
3.3 第二代漢字編碼輸入法
1986 年酬荞,四通公司與日本三井物業(yè)合作,推出了四通 MS-2400 中文電子打字機(jī)瞧哟,宣告了中國(guó)專(zhuān)業(yè)電子打字時(shí)代的到來(lái)混巧。由于當(dāng)時(shí)微型計(jì)算機(jī)的價(jià)格還很昂貴,一般的個(gè)人用戶(hù)根本買(mǎi)不起勤揩。而單位用戶(hù)主要希望解決辦公打字的問(wèn)題咧党,并非必須使用微機(jī)不可。四通打字機(jī)既比較便宜又能適應(yīng)輸入漢字和編輯打印的要求陨亡,正好迎合了市場(chǎng)的需要傍衡。另外,為了適應(yīng)沒(méi)有四通打字機(jī)的個(gè)人和單位的需要负蠕,采用四通打字機(jī)的商業(yè)打字店也應(yīng)運(yùn)而生蛙埂。隨著四通打字機(jī)的廣泛使用,首先捆綁在四通打字機(jī)上的五筆字型輸入法也在其發(fā)明人王永民的極力推廣下流傳開(kāi)來(lái)遮糖,以培訓(xùn)專(zhuān)業(yè)打字員為目標(biāo)的遍布全國(guó)的商業(yè)電腦培訓(xùn)機(jī)構(gòu)更加速的五筆字型的推廣绣的,造就了幾十萬(wàn)使用五筆字型的打字員。后來(lái)捆綁到四通打字機(jī)上的由劉衛(wèi)民發(fā)明的雙音輸入法也在當(dāng)時(shí)得到比較廣泛的使用欲账。
九十年代初屡江,一方面由于四通公司的內(nèi)部運(yùn)作出現(xiàn)問(wèn)題,另一方面也由于微機(jī)的價(jià)格迅速的下降敬惦,四通打字機(jī)逐步的被微機(jī)取代盼理。由于在微機(jī)的漢字操作系統(tǒng)上漢字編碼輸入法是可擴(kuò)展的,這就為其它非四通打字機(jī)輸入法提供了發(fā)展空間俄删。但是宏怔,與五筆字型類(lèi)似的以拆分漢字為基礎(chǔ)的部件類(lèi)輸入法奏路,如表形碼、鄭碼臊诊,雖然比五筆字型相對(duì)易學(xué)且輸入速度也差不了多少鸽粉,發(fā)明人的名氣也比較大,然而面對(duì)已在專(zhuān)職打字員輸入法市場(chǎng)上占盡先機(jī)的五筆字型抓艳,最終沒(méi)能廣泛被用戶(hù)采用触机。更具有諷刺意義的是,曾在 86 年的首屆漢字輸入方案評(píng)測(cè)中被評(píng)為 A 類(lèi)的 11 個(gè)漢字編碼方案沒(méi)有一個(gè)得到了廣泛的使用玷或。倒是面向一般使用人員的自然碼脫穎而出儡首,在克服了雙音輸入法在速度上的缺陷后,在日益擴(kuò)大的非職業(yè)打字領(lǐng)域得到了廣泛采納偏友。這樣便形成了以王永民的五筆字型蔬胯、劉衛(wèi)民的雙音輸入法和周志農(nóng)的自然碼為代表的第二代漢字編碼輸入法格局。
五筆字型是最典型的純形碼部件類(lèi)方案位他。在五筆字型中氛濒,一般將部件稱(chēng)為字根。五筆字型采用了 130 個(gè)基本字根鹅髓∥韪停基本字根按起筆分為五類(lèi),對(duì)應(yīng)通用鍵盤(pán)上的五個(gè)區(qū)窿冯。每類(lèi)又細(xì)分為五組骗奖,每組對(duì)應(yīng)一個(gè)鍵盤(pán)字母。在一個(gè)漢字中醒串,字根間的關(guān)系被歸納為 “單重归、散、連厦凤、交” 四種。在漢字拆分時(shí)育苟,遵循 “取大優(yōu)先较鼓,兼顧直觀,能連不交违柏,能散不連” 的原則博烂。
五筆字型將漢字被分為鍵名漢字、成字字根漢字和鍵外漢字三種漱竖,分別服從不同的編碼規(guī)則禽篱。鍵名漢字有 25 個(gè),其編碼是重復(fù)其所在鍵上的字母四次馍惹。成字字根漢字有近一百個(gè)躺率,其編碼規(guī)則為 “鍵名碼 + 首筆碼 + 次筆碼 + 末筆碼”玛界,不足三筆時(shí)按 “鍵名碼 + 首筆碼 + 末筆碼” 編碼。鍵外漢字?jǐn)?shù)量最多悼吱,其編碼規(guī)則為順序取字的第一慎框、二、三后添、末字根碼笨枯,不足四個(gè)字根的需補(bǔ)加一個(gè)交叉識(shí)別碼。交叉識(shí)別碼根據(jù)字的末筆(橫遇西、豎馅精、撇、點(diǎn)粱檀、折)和字型(左右型洲敢、上下型、雜合型)而定梧税。另外沦疾,字的編碼還有一、二第队、三級(jí)簡(jiǎn)碼哮塞,其形成方法是取相應(yīng)全碼的前一、二凳谦、三個(gè)字母忆畅。
五筆字型將詞組也分為二字詞、三字詞和多字詞三種尸执。二字詞按順序取各字的前兩個(gè)字根來(lái)編碼家凯。三字詞按順序取頭兩個(gè)字的第一個(gè)字根和末字的前二個(gè)字根來(lái)編碼。多字詞按順序取第一如失、二绊诲、三、末字的第一個(gè)字根來(lái)編碼褪贵。
職業(yè)打字員打字時(shí)的一個(gè)重要特征是看稿進(jìn)行錄入掂之,并且要求很快的輸入速度。所以他應(yīng)盡量少地去觀察提示行和已輸入的內(nèi)容脆丁,否則當(dāng)他回頭看稿時(shí)再次定位應(yīng)輸入的漢字就會(huì)非常吃力世舰,從而極大地影響錄入速度。只看稿件進(jìn)行打字就是平常所說(shuō)的盲打槽卫。絕對(duì)的盲打?qū)嶋H上是不可能的跟压。可能的是盡量不將視線離開(kāi)稿件歼培。職業(yè)打字的另一個(gè)特征是錄入的內(nèi)容比較廣泛震蒋,承接商業(yè)打字業(yè)務(wù)時(shí)更是如此茸塞。這就需要他記住各級(jí)簡(jiǎn)碼,知道哪些字應(yīng)該使用簡(jiǎn)碼輸入喷好,哪些字應(yīng)該用全碼輸入翔横,哪些詞是輸入法有的,哪些詞是輸入法沒(méi)有的梗搅。由于詞組的數(shù)量巨大禾唁,收錄過(guò)多的詞組一方面會(huì)加大重碼率,另一方面也會(huì)增加記憶量无切,因此職業(yè)打字員多以單字輸入為主荡短,輔以常用的詞組。這也暗示著自定義詞組在職業(yè)打字中起的作用是十分有限的哆键。鑒于以上原因掘托,要成為一個(gè)合格的職業(yè)打字員,除了具有靈敏的手指外籍嘹,沒(méi)有數(shù)月的專(zhuān)門(mén)的系統(tǒng)的打字培訓(xùn)是不可能的闪盔。
五筆字型以非常復(fù)雜的編碼規(guī)則換來(lái)了在 GB2312-80 字符集內(nèi)較低的重碼率。當(dāng)采用強(qiáng)制簡(jiǎn)碼時(shí)辱士,還可進(jìn)一步將低重碼率泪掀。詞組編碼被放進(jìn)全碼字的剩余編碼空間中,實(shí)現(xiàn)了字詞混合編碼颂碘。只要收錄的詞組量不大异赫,發(fā)生重碼的可能性是比較小的。一般的五筆字型也不具備自造詞的功能头岔。五筆字型擁有的這些特點(diǎn)塔拳,正好適應(yīng)了職業(yè)打字的需要,成為它在職業(yè)打字時(shí)代非常流行的重要原因之一峡竣。
雖然五筆字型在市場(chǎng)上取得了巨大的成功靠抑,但它存在的問(wèn)題也是不容忽視的。首先适掰,五筆字型是非常難學(xué)的孕荠,而且容易遺忘。它除了有非常復(fù)雜的編碼規(guī)則而外攻谁,還有很多例外需要記憶。五筆字型打字員在打字時(shí)對(duì)一些常見(jiàn)字出現(xiàn) “卡殼” 的現(xiàn)象是很普遍的事情弯予。這時(shí)就需要臨時(shí)換用拼音輸入法來(lái)輸入 “卡殼” 的字戚宦。其次,五筆字型的擴(kuò)展性差锈嫩。當(dāng)字符集從 GB2312-80 到 GBK 和 GB18030 過(guò)渡時(shí)受楼,當(dāng)詞組量增大時(shí)垦搬,五筆字型在碼長(zhǎng)為 4 的碼位上會(huì)出現(xiàn)大量的重碼,使其喪失重碼率低的優(yōu)勢(shì)艳汽。五筆字型采用的是 4 碼無(wú)重碼自動(dòng)上屏的策略猴贰,4 碼重碼增多就迫使打字員的視線更多地離開(kāi)稿件來(lái)觀察提示行以確認(rèn)自己的輸入,從而減低錄入速度河狐。最后米绕,五筆字型最致命的弱點(diǎn)是規(guī)范性差。張孝存等就此提出了言辭激烈的批評(píng) [25]馋艺≌じ桑“五筆字型違反語(yǔ)言文字規(guī)范。它對(duì)漢字的拆分具有相當(dāng)大的隨意性捐祠,對(duì)國(guó)民基礎(chǔ)文化素質(zhì)具有不可忽視的負(fù)面影響碱鳞。它對(duì)規(guī)范的漢字教育的沖擊同其應(yīng)用范圍的擴(kuò)大成正比□庵” 所以窿给,五筆字型不能適應(yīng)一般漢字輸入者的需要,更不能適應(yīng)中小學(xué)漢字輸入教學(xué)的需要率拒。
雙音輸入法是一種比較巧妙的純音碼崩泡,曾經(jīng)是四通打字機(jī)和西山 DOS 的必備漢字輸入法之一 [28][30]。雙音輸入法支持全拼俏橘、簡(jiǎn)拼和雙拼三種拼音方式允华。對(duì)于全拼來(lái)講,除了用 v 代替 ü 而外寥掐,音節(jié)的拼寫(xiě)形式和標(biāo)準(zhǔn)漢語(yǔ)拼音完全一致靴寂,非常簡(jiǎn)單,會(huì)拼音的人基本上不用學(xué)習(xí)就會(huì)召耘,但效率最低百炬。簡(jiǎn)拼是為兼容早期 CCDOS 而設(shè)立的。雙拼用兩個(gè)字母代表一個(gè)音節(jié)污它,是效率最高的拼音方法剖踊,但學(xué)習(xí)時(shí)的記憶量也最大。在雙拼雙音中衫贬,可以選擇采用劉氏雙拼德澈,也可以選擇采用四通雙拼。
雙音輸入法最大的特點(diǎn)就是 “以詞定字固惯、反向聯(lián)想”梆造,以緩解純音碼方式下單字重碼過(guò)多的問(wèn)題。因?yàn)槎衷~的數(shù)量很多葬毫,所以一般情況下總可以找到某個(gè)二字詞镇辉,它的第一個(gè)字就是你想要輸入的字屡穗。如果該二字詞處于提示行的第一候選位置,則可以省略選擇鍵忽肛;否則需要用數(shù)字鍵進(jìn)行選擇村砂。如果整個(gè)二字詞都是你需要的,你可以加一個(gè)空格鍵輸入第二個(gè)字屹逛。也就是說(shuō)础废,如果采用雙拼的話,利用 “以詞定字” 技術(shù)可以使得常用字輸入時(shí)的平均擊鍵數(shù)為 2.5煎源,而且基本上避免了傳統(tǒng)拼音 + 聯(lián)想方式下過(guò)多地掃視提示行和翻頁(yè)色迂、選擇的毛病。聯(lián)想方式僅僅作為一個(gè)選項(xiàng)手销,并不怎么推薦使用它歇僧。
在雙音輸入法中,對(duì)于三字詞和四字詞锋拖,取各字的聲母作為編碼來(lái)輸入诈悍,必要時(shí)加空格結(jié)束。對(duì)于不認(rèn)識(shí)的字兽埃,可以打入 “\” 調(diào)用 “手寫(xiě)模擬”侥钳,其規(guī)則是:首末兩筆打代碼,中間筆畫(huà)用空格代替柄错;如果事先計(jì)算出應(yīng)輸入的空格數(shù)舷夺,也可以用數(shù)字鍵代替應(yīng)輸入的空格數(shù)。雖然可以自定義詞組售貌,但它不支持在線造詞给猾。造詞時(shí)需要用外部文本編輯器按照它定義的格式輸入編碼和對(duì)應(yīng)的詞組。
雙音輸入法是拼音漢字輸入歷史上的一大進(jìn)步颂跨,在當(dāng)時(shí)受到了許多非職業(yè)打字員的歡迎敢伸。但是,它也存在一些比較嚴(yán)重的不足恒削,以至于現(xiàn)在幾乎沒(méi)有人再使用它了池颈。首先,雖然在輸入效率上它較傳統(tǒng)的拼音有很大的提升钓丰,但是它與后來(lái)的語(yǔ)句級(jí)拼音輸入法如智能 ABC 相比躯砰,還有相當(dāng)?shù)牟罹唷A硗庑。耙栽~定字” 時(shí)很多字可以采用多個(gè)詞來(lái)確定琢歇,而有的字難以找到詞來(lái)確定,用戶(hù)常常感到不知所措。雖然雙音輸入法中提供了很多其它的方法來(lái)解決單字的錄入問(wèn)題矿微。例如,鄧尚揣、郭涌矢、姚等姓氏用字的輸入就有 6 條輔助規(guī)則。要記住這些方法并判斷何時(shí)采用何種方法可不是一件容易的事情快骗。由于只能離線造詞娜庇,所以詞組的自定義也很不方便。
自然碼是最具代表性的音形碼 [31]方篮。吳越在 1993 年對(duì)自然碼作出了極高的評(píng)價(jià) [28]名秀。他說(shuō)自然碼輸入法 “是目前以拼音為基礎(chǔ)的普及型漢字輸入系統(tǒng)中最先進(jìn)、最好學(xué)藕溅、最方便匕得、最快捷、具有最大人工智能容量的一種方案”巾表。這種評(píng)價(jià)在當(dāng)時(shí)來(lái)說(shuō)汁掠,除了 “最好學(xué)” 這一點(diǎn)是言過(guò)其實(shí)了(因?yàn)樗@然沒(méi)有全拼或筆順輸入法簡(jiǎn)單)而外,其它的優(yōu)點(diǎn)自然碼都是具有的集币。自然碼在拼音部分采用了在 CCDOS 簡(jiǎn)拼的基礎(chǔ)上修改而來(lái)的雙拼考阱,以方便 CCDOS 用戶(hù)向自然碼過(guò)渡。自然雙拼與劉氏雙拼和四通雙拼都是不一樣的鞠苟。
為了解決拼音輸入中普遍存在的同音字問(wèn)題乞榨,自然碼采用了與雙音輸入法完全不同的策略。它通過(guò)在雙拼后附加形碼当娱,大大減少了單字的重碼吃既。其形碼部分采用 “近義部部首分類(lèi)” 法,最多可有兩碼趾访,用部首讀音的聲母作代碼态秧,取碼時(shí)堅(jiān)持 “義部?jī)?yōu)先” 的原則,以便減少記憶量和增加形碼對(duì)重碼字的離散能力扼鞋。采用附加的形碼來(lái)區(qū)分同音字還可以避免雙音輸入法中一個(gè)字可以利用多個(gè)詞組來(lái)確定的不確定性申鱼。對(duì)于不認(rèn)識(shí)的字,可以用單純使用形碼部分輸入云头,但需要以 “/” 鍵開(kāi)頭進(jìn)行引導(dǎo)捐友。
自然碼的簡(jiǎn)碼字也很有特色,除了傳統(tǒng)上用 “聲母 + 空格” 輸入的高頻簡(jiǎn)碼字而外溃槐,還有用 “聲母 +;” 輸入的次級(jí)簡(jiǎn)碼字和用 “聲母 +’” 輸入的附加簡(jiǎn)碼字匣砖。自然碼還設(shè)置了用 “聲母 + 聲母 +’” 輸入的簡(jiǎn)碼二字詞,以加快高頻二字詞的錄入。輸入一般的二字詞時(shí)猴鲫,詞組作為一個(gè)整體上屏对人,比雙音輸入法的 “以詞定字” 每輸入一個(gè)二字詞就少用了一個(gè)空格鍵。三字詞用各字的聲母 +“’” 輸入拂共,單獨(dú)享有編碼空間牺弄。
自然碼還設(shè)計(jì)了 “中文標(biāo)點(diǎn)狀態(tài)”,使得常用標(biāo)點(diǎn)符號(hào)的輸入和半角字母宜狐、數(shù)字的輸入可以不加切換的進(jìn)行势告。自然碼的外掛技術(shù)使得它可以不加改變地掛接于所有常見(jiàn)的中文 DOS 系統(tǒng)上「Ш悖考慮到南方人普通話不準(zhǔn)的現(xiàn)實(shí)咱台,自然碼還提供了南方音選項(xiàng)。設(shè)置南方音選項(xiàng)后俭驮,用戶(hù)可以不區(qū)分聲母 z 和 zh回溺、c 和 ch、s 和 sh表鳍,也可以不區(qū)分 en 和 eng馅而、in 和 ing,還可以不區(qū)分 wang 和 huang譬圣、n 和 l瓮恭。當(dāng)然,這時(shí)的重碼就增多了厘熟。聯(lián)想方式在自然碼中也僅僅是作為一個(gè)選項(xiàng)提供的屯蹦,但由于人機(jī)交互過(guò)于頻繁,嚴(yán)重影響輸入速度绳姨,因而熟練的用戶(hù)是不會(huì)使用的登澜。自然碼還對(duì)中文數(shù)字、日期飘庄、時(shí)間脑蠕、制表符等提供了編碼式的快速輸入手段;對(duì)字詞的疊加操作也相當(dāng)方便跪削,可以用于輸入 “想想”谴仙、“思考思考”、“試一試” 等碾盐。
智能相關(guān)處理是自然碼宣傳得很多的一項(xiàng)技術(shù)晃跺。它實(shí)際上是一種擴(kuò)展的聯(lián)想技術(shù),即把聯(lián)想用到了詞組與詞組之間毫玖。例如掀虎,輸入 “知名” 以后再輸入 “rfui”(標(biāo)準(zhǔn)拼音為 “renshi”)后會(huì)把 “人士” 作為默認(rèn)選擇凌盯,而輸入 “不久” 以后再輸入 “rfui” 則會(huì)把 “人事” 作為默認(rèn)選擇。
在線造詞是自然碼自譽(yù)的另一特色烹玉。在漢字輸入過(guò)程中驰怎,如果敲完某個(gè)詞的拼音以后發(fā)現(xiàn)這個(gè)詞不存在,立即敲空格鍵二打,系統(tǒng)便進(jìn)入 “自動(dòng)加詞狀態(tài)”砸西;這時(shí),連續(xù)輸入的字址儒、詞都作為新詞的內(nèi)容,在送到屏幕上的同時(shí)便被紀(jì)錄到自造詞庫(kù)中衅疙;當(dāng)再敲空格鍵或回車(chē)鍵時(shí)莲趣,系統(tǒng)結(jié)束自造詞操作。如果想造詞的編碼正好與其他詞的編碼重復(fù)饱溢,這時(shí)就要按 Shift+Tab 復(fù)合鍵進(jìn)行強(qiáng)制造詞喧伞,此后的操作與前面相同。對(duì)于已自定義的詞绩郎,還可以將其刪除潘鲫。刪除的方法是,在輸入詞的編碼且詞還未上屏?xí)r肋杖,按 Ctrl + 回車(chē)復(fù)合鍵溉仑;此時(shí),如果無(wú)重碼則那個(gè)唯一的詞被刪除掉状植,如果有重碼則還需要選擇想刪除的是哪個(gè)詞浊竟。需要說(shuō)明的是,系統(tǒng)自帶的詞是不能刪除的津畸。在進(jìn)行了增振定、刪詞組的操作后,在關(guān)機(jī)或重新啟動(dòng)計(jì)算機(jī)之前肉拓,必須先將自造詞庫(kù)保存到磁盤(pán)中后频,否則關(guān)機(jī)后所作的修改就無(wú)效了。
總之暖途,第二代漢字編碼輸入法都是在 CCDOS 2.1 的原始輸入法的基礎(chǔ)上發(fā)展起來(lái)的卑惜,以提高漢字的輸入速度為主要目標(biāo),增加了詞組的輸入丧肴,單字輸入時(shí)的重碼也減少了残揉,出現(xiàn)了中文標(biāo)點(diǎn)狀態(tài),多數(shù)都能自定義詞組芋浮。第二代漢字編碼輸入法非常多抱环,除了上面介紹的而外壳快,在大陸影響較大的還有陳愛(ài)文先生的表形碼、鄭易里先生的鄭碼镇草、錢(qián)玉趾先生設(shè)計(jì)的未來(lái)碼眶痰、肖水清先生的肖碼、蕭啟宏先生的啟宏全息碼等 [55] [56]梯啤,在港臺(tái)影響較大的還有朱邦復(fù)先生的倉(cāng)頡輸入法竖伯、王贊杰先生的大易輸入法、廖明德先生的行列輸入法因宇、陳華偉先生的華象中文輸入法七婴、劉重次先生的嘸蝦米中文輸入法、戚桐欣先生的中易系統(tǒng)察滑、黃金富先生的唯物輸入法等打厘,另外還有美籍華人饒達(dá)先生的饒氏筆形輸入法和美國(guó)王安電腦公司開(kāi)發(fā)的王安三角編碼法等。