Rime輸入法—鼠須管(Squirrel)詞庫(kù)添加及配置

為什么用Rime

13年底的時(shí)候蛇券,日本爆出百度的日本版本輸入法的問(wèn)題,要求政府人員停用猪杭,沒(méi)當(dāng)回事餐塘,反正我沒(méi)用,當(dāng)然了胁孙,有關(guān)搜狗和用戶(hù)隱私有關(guān)的問(wèn)題就一直沒(méi)有中斷過(guò)唠倦,也沒(méi)太在意。但涮较,前幾天McAfee爆出的某輸入法用戶(hù)敏感數(shù)據(jù)未加密傳輸?shù)膯?wèn)題稠鼻,就讓人擔(dān)心了。

好吧狂票,既然這樣候齿,還是卸了第三方的輸入法吧,雖然Yosemite自帶的輸入法已經(jīng)進(jìn)步很大了闺属,但是總是用的不順手慌盯,也想念自己多年在搜狗輸入法上積累的詞庫(kù)。既然這樣掂器,那就只能考慮自己動(dòng)手豐衣足食的問(wèn)題了亚皂。

有關(guān)“Rime鼠須管”輸入法,在各類(lèi)MAC相關(guān)的論壇上都能看到“神級(jí)輸入法”這樣標(biāo)題的推薦国瓮,必須承認(rèn)僅僅就速度這個(gè)角度來(lái)說(shuō)灭必,確是非常優(yōu)秀,輸入過(guò)程非常流暢毫無(wú)卡鈍乃摹,當(dāng)然做為開(kāi)源軟件禁漓,作者的思路應(yīng)該是:字庫(kù)無(wú)需非常龐大,字庫(kù)是靠用戶(hù)用自己的輸入習(xí)慣來(lái)“養(yǎng)成”的孵睬。

Rime是什么

有關(guān)Rime的介紹及基本的安裝介紹播歼,不多說(shuō),請(qǐng)自行搜索了解掰读,下面借“眀無(wú)夢(mèng)”的一個(gè)Gif圖:

** 原文在此 **:安裝及配置 Mac 上的 Rime 輸入法——鼠鬚管 (Squirrel)

之前對(duì)Rime僅僅是當(dāng)作一個(gè)新鮮玩意試著玩玩秘狞,沒(méi)太在意有關(guān)配置及詞庫(kù)的問(wèn)題,這次準(zhǔn)備下定決定長(zhǎng)期使用蹈集,想按照自己的需要進(jìn)行一些調(diào)整谒撼,檢索資料,發(fā)現(xiàn)相關(guān)內(nèi)容分布較散亂雾狈,有些內(nèi)容寫(xiě)的過(guò)于簡(jiǎn)單或者晦澀理解起來(lái)還是需要花點(diǎn)時(shí)間廓潜。

本著兼聽(tīng)則明的原則,在理解了官方的指南以及一些優(yōu)質(zhì)的資料(如上面gif的作者)的基礎(chǔ)上開(kāi)始了定制過(guò)程,我的目標(biāo)很簡(jiǎn)單辩蛋,主要有三個(gè):

1. 調(diào)整外觀
2. 優(yōu)化輸入體驗(yàn)
3. 增加詞庫(kù)

** BTW :**

  1. 我用的是鼠須管呻畸,別的OS下的版本還未嘗試,但從Rime的系統(tǒng)架構(gòu)來(lái)看悼院,以下的這些東西應(yīng)該是對(duì)非OSX平臺(tái)也有借鑒的伤为。
  2. 鼠須管在OSX下的“用戶(hù)文件路徑”如下,下文中修改/增加的文件都在這個(gè)目錄下完成据途。(當(dāng)然绞愚,也可以右鍵鼠須管的圖標(biāo),選擇“用戶(hù)設(shè)定...”直達(dá)目錄颖医。)

~/Library/Rime/

  1. Rime的配置文件都要求是“encoding: utf-8”位衩,所以建議準(zhǔn)備一個(gè)好用的文本文件工具,比如強(qiáng)悍的:Sublime Text等熔萧,后面有關(guān)字庫(kù)的處理糖驴,最好能適當(dāng)懂一點(diǎn)終端工具的使用。

  2. 在準(zhǔn)備自己動(dòng)手之前佛致,請(qǐng)自行學(xué)習(xí)官方說(shuō)明:《Rime 定製指南 | rimeime》贮缕,在下面的文字中,會(huì)對(duì)官方資料做一些摘錄和引用俺榆,在此一并說(shuō)明感昼。

  3. 一定要注意配置文件的縮進(jìn)控制,所有的修改都必須“重新部署”才能生效罐脊。

配置方法

目標(biāo)明確定嗓,資料消化結(jié)束,下面正式開(kāi)始介紹鼠須管的配置過(guò)程:

1. 外觀配置

對(duì)于外觀調(diào)整爹殊,主要想解決以下幾個(gè)問(wèn)題:a蜕乡、不習(xí)慣豎排奸绷,要改為橫排梗夸;b、默認(rèn)自體太大号醉,要改小一點(diǎn)反症;c、修改字體顏色和背景顏色畔派。

調(diào)整候選詞數(shù)量:

在“用戶(hù)文件”路徑:~/Library/Rime/
新建文件:default.custom.yaml, 內(nèi)容如下:
# default.custom.yaml
patch:
menu/page_size: 9 #設(shè)置候選字?jǐn)?shù)量铅碍,根據(jù)喜好調(diào)整。

注:如果之前修改過(guò)“default.custom.yaml”文件线椰,那么請(qǐng)一定按照官方的要求去做:所有 * .custom.yaml文件中只能有一個(gè)“path:”胞谈!

調(diào)整候選欄樣式

在“用戶(hù)文件”路徑:~/Library/Rime/
新建文件:squirrel.custom.yaml, 內(nèi)容如下:
# squirrel.custom.yaml
patch:
# us_keyboard_layout: true # 鍵盤(pán)選項(xiàng):應(yīng)用美式鍵盤(pán)布局
# show_notifications_when: growl_is_running # 狀態(tài)通知,默認(rèn)裝有Growl時(shí)顯示,也可設(shè)爲(wèi)全開(kāi)(always)全關(guān)(never)
style/color_scheme: demo # 選擇配色方案
style/horizontal: true # 候選窗橫向顯示
# style/inline_preedit: false # 關(guān)閉內(nèi)嵌編碼烦绳,這樣就可以顯示首行的拼音(MAC下不建議開(kāi)啟)
style/corner_radius: 3 # 窗口圓角半徑
style/border_height: 4 # 窗口邊界高度卿捎,大于圓角半徑才有效果
tyle/border_width: 4 # 窗口邊界寬度,大于圓角半徑才有效果
# style/line_spacing: 1 # 候選詞的行間距
# style/spacing: 5 # 在非內(nèi)嵌編碼模式下径密,預(yù)編輯和候選詞之間的間距
style/font_face: "Lantinghei TC Extralight" # 預(yù)選欄文字字體午阵,使用中文字體:蘭亭黑-纖黑
style/font_point: 17 #預(yù)選欄文字字號(hào)
style/label_font_face: "Myriad Pro Light" # 預(yù)選欄編號(hào)字體,使用西文字體:Myriad Pro Light
style/label_font_point: 17 #預(yù)選欄編號(hào)字號(hào)
#上述是候選欄的基本設(shè)置享扔,確定了文字的大小和候選欄的外觀樣式底桂。
#下面是“demo”樣式文件的配置,主要確定候選欄顏色配置惧眠。
preset_color_schemes:
demo: #樣式名稱(chēng)籽懦,就是上述“style/color_scheme: demo”
author: "***** ****@gmail.com" #作者
name: "無(wú)語(yǔ)/*****" #作者名字
label_color: 0xf2a45a #預(yù)選欄編號(hào)顏色
back_color: 0x333333 #背景顏色
candidate_text_color: 0xb9b9b9 #非第一后選項(xiàng)文字顏色
comment_text_color: 0xa5a5a5 #注解文字顏色
hilited_candidate_back_color: 0x333333 #第一后選項(xiàng)背景顏色
hilited_candidate_text_color: 0xff7d00 #第一后選項(xiàng)文字顏色
hilited_comment_text_color: 0x00a5ea #注解文字高亮
hilited_text_color: 0x7fffff #拼音串高亮(需要開(kāi)啟內(nèi)嵌編碼)
text_color: 0xa5a5a5 #拼音串顏色(需要開(kāi)啟內(nèi)嵌編碼)

已經(jīng)完成基本的外觀調(diào)整:橫排候選欄,9個(gè)候選字锉试,候選欄的:字體猫十、背景色、文字顏色等都完成了調(diào)整呆盖。

注:在調(diào)整過(guò)程中發(fā)現(xiàn)Rime可能存在一個(gè)小Bug(或者是還沒(méi)有理解透這個(gè)文件):“l(fā)abel_color: 0xf2a45a”配置的顏色并不是實(shí)際顯示出來(lái)的顏色拖云,需要找個(gè)配色工具,將你選擇的顏色確定后应又,選擇“色輪”對(duì)面顏色的“Hex Value”填上去既可顯示你選擇的目標(biāo)顏色宙项。

2. 優(yōu)化輸入體驗(yàn)

輸入體驗(yàn)的調(diào)整主要是想解決以下內(nèi)容:a摔竿、按自己的習(xí)慣增加“方案選單”的呼出快捷鍵诬留;b、屏蔽自己不需要的方案日熬;c洞就、增加混和輸入的方式盆繁,實(shí)現(xiàn)上面gif動(dòng)畫(huà)中的“中英文+emoji”輸入方案等。

調(diào)整快捷鍵:

修改:default.custom.yaml, 設(shè)定“輸入選單”中激活的輸入方式旬蟋,內(nèi)容如下:
# default.custom.yaml
patch:
menu/page_size: 9 #這是之前增加的候選詞數(shù)量油昂,可以看見(jiàn)“patch:”只能有一個(gè)的意思了。
schema_list: #“輸入選單”中激活的輸入方案定義倾贰。
# - schema: terra_pinyin
- schema: luna_pinyin
# - schema: emoji
- schema: luna_pinyin_fluency
# - schema: double_pinyin_mspy
- schema: luna_pinyin_simp
# - schema: bopomofo
# - schema: double_pinyin_flypy

根據(jù)自己的輸入習(xí)慣進(jìn)行選擇冕碟,我只保留了“朙月拼音”、“朙月拼音?語(yǔ)句流”匆浙、“朙月拼音?簡(jiǎn)化字”三個(gè)方案安寺,其余的都屏蔽了。

由于Rime默認(rèn)“輸入選單”激活的快捷鍵有三個(gè)首尼,其中:F4在MAC下是沒(méi)用的挑庶,“control+`”的快捷鍵在Sublime Text沖突言秸,所以建議增加一個(gè)快捷鍵并優(yōu)化中西文切換的配置。繼續(xù)修改“default.custom.yaml ”迎捺,內(nèi)容如下:
# default.custom.yaml
patch:
menu/page_size: 9 #這是之前增加的候選詞數(shù)量井仰。
schema_list: #“輸入選單”中激活的輸入方案定義。
# - schema: terra_pinyin
- schema: luna_pinyin
# - schema: emoji
- schema: luna_pinyin_fluency
# - schema: double_pinyin_mspy
- schema: luna_pinyin_simp
# - schema: bopomofo
# - schema: double_pinyin_flypy

#下面定義中英文切換的方式
    ascii_composer/good_old_caps_lock:  true
    ascii_composer/switch_key:
    Caps_Lock: noop
    Control_L: commit_text
    Control_R: commit_text
    Eisu_toggle: clear
    Shift_L: inline_ascii
    Shift_R: inline_ascii

#下面定義“輸入選單”的切換控制
    switcher:
        abbreviate_options: true
        caption: "〔切換〕"          #把默認(rèn)的“方案選單”修改為了“切換”破加。
        fold_options: true
        hotkeys:
            - "Control+grave"       #默認(rèn)方案
            - "Control+Shift+grave"   #默認(rèn)方案
            - "Control+s"             #新增方案
        option_list_separator: "/"   #以下都為默認(rèn)custom.yaml文件的默認(rèn)配置俱恶,copy過(guò)來(lái)就可以。
        save_options:
            - full_shape
            - ascii_punct
            - simplification
            - extended_charset

上述配置參數(shù)解釋如下:

中西文切換鍵的默認(rèn)設(shè)置寫(xiě)在default.yaml里面范舀,default.custom.yaml 可以在全局范圍重可以定義該組快速鍵合是。

可用的按鍵有Caps_Lock, Shift_L, Shift_R, Control_L, control_R,而Mac 系統(tǒng)上的鼠須管不能區(qū)分左锭环、右聪全,因此只有對(duì)Shift_L, Control_L 的設(shè)定起作用。已輸入編碼時(shí)按切換鍵辅辩,可以進(jìn)一步設(shè)定輸入法中西文切換的形式难礼。

可選的臨時(shí)切換策略有三種:

inline_ascii :在輸入法的臨時(shí)西文編輯區(qū)內(nèi)輸入字母、數(shù)字玫锋、符號(hào)蛾茉、空格等,回車(chē)上屏后自動(dòng)復(fù)位到中文撩鹿。
commit_text :已輸入的候選文字上屏并切換至西文輸入模式谦炬。
commit_code :已輸入的編碼字符上屏并切換至西文輸入模式。
noop :屏蔽該切換鍵节沦。

所以键思,我的配置的意思是:Caps lock鍵保持系統(tǒng)默認(rèn)配置;Shift鍵臨時(shí)切換為英文輸入甫贯,回車(chē)確認(rèn)后繼續(xù)保持中文輸入法吼鳞;Control鍵:已經(jīng)輸入的漢字上屏,并切換為英文輸入法叫搁。

增加emoji表情輸入

注:由于Rime輸入法不同的輸入方案有不同的配置文件赔桌,以下對(duì)輸入方案的配置文件的修改都以“朙月拼音”為例進(jìn)行,其余的輸入方案修改基本類(lèi)似常熙。

在“~/Library/Rime/”下新建:“l(fā)una_pinyin.custom.yaml”就是朙月拼音對(duì)應(yīng)的個(gè)性化定義文件纬乍。
在這里多說(shuō)一句碱茁,為什么不直接修改而是增加一個(gè)“custom”文件呢裸卫?這個(gè)方法的好處是,這些custom的配置文件是可以放在網(wǎng)盤(pán)備份的纽竣,這個(gè)備份可以有三個(gè)好處:

1墓贿、個(gè)人的數(shù)據(jù)在自己信得過(guò)的網(wǎng)盤(pán)中茧泪,不會(huì)有亂七八糟的事情初現(xiàn);
2聋袋、可以讓多個(gè)客戶(hù)端都指向備份文件夾队伟,這樣就可以做到多端同步;
3幽勒、版本升級(jí)嗜侮,不會(huì)影響個(gè)人數(shù)據(jù)與個(gè)性化配置,一勞永逸啥容。

在“l(fā)una_pinyin.custom.yaml”中新增如下代碼:
# luna_pinyin.custom.yaml
patch:
engine/translators:
- punct_translator
- r10n_translator
- reverse_lookup_translator
recognizer/patterns/reverse_lookup: "[a-z]*$ " #請(qǐng)刪除$后的空格锈颗!不加一個(gè)空格貌似總是解析錯(cuò)誤,不知道MarkDown我還有多少不知道的地方:( schema/dependencies: - emoji abc_segmentor/extra_tags: - reverse_lookup reverse_lookup: dictionary: emoji enable_completion: false prefix: ""
tips: 〔表情〕

保存咪惠,重新部署击吱,切換到“朙月拼音”輸入“`”然后輸入“biaoqing”看看是不是出來(lái)了,如果不生效遥昧,請(qǐng)檢查代碼的對(duì)齊是不是有問(wèn)題覆醇。有關(guān)emoji表情的介紹看符號(hào)表(自備梯子,沒(méi)梯子的同學(xué)看最后炭臭,我會(huì)把圖片放在后面)永脓。

到這里,是不是感覺(jué)鼠須管有點(diǎn)意思了鞋仍,我前面說(shuō)了憨奸,目標(biāo)是實(shí)現(xiàn)“中英文混輸+emoji”,現(xiàn)在看起來(lái)實(shí)現(xiàn)了一半凿试,下面開(kāi)始解決中英文混輸?shù)膯?wèn)題排宰。這個(gè)問(wèn)題要解決,就要開(kāi)始增加詞庫(kù)了那婉。

3. 增加詞庫(kù)

開(kāi)源軟件的好處是:總會(huì)有很多熱心的同學(xué)做好一些現(xiàn)成的東西供大家享用板甘,我在這里主要是做開(kāi)源資料的搬運(yùn)工,下面引用的資料所有權(quán)及解釋權(quán)還是人家創(chuàng)作者的详炬,請(qǐng)大家懷著感恩的心合理使用(可能需要梯子)盐类。

為什么是“增加詞庫(kù)”而不是導(dǎo)入詞庫(kù)呢?詳細(xì)的解釋看這里:〔新手推薦敎程〕關(guān)于導(dǎo)入詞庫(kù)及「深藍(lán)詞庫(kù)轉(zhuǎn)換」的正確操作方法 | rime 吧呛谜。建議3樓到15樓能耐心看一遍在跳,對(duì)理解Rime解構(gòu)大有幫助,總結(jié)下來(lái)就是:Rime的詞庫(kù)設(shè)計(jì)是遞歸引用和調(diào)用的隐岛,如果盲目的使用Rime默認(rèn)提供的詞庫(kù)導(dǎo)入工具把詞庫(kù)全部導(dǎo)入到默認(rèn)的碼表里猫妙,很有可能造成Rime性能下降,行云流水般打字的感覺(jué)就木有了聚凹,木有了割坠!
如果沒(méi)耐心看齐帚,那就先看我的處理過(guò)程,然后會(huì)頭再去看官方的說(shuō)明彼哼。

增加可用的詞庫(kù)

原材料在這里:朙月拼音擴(kuò)充詞庫(kù)对妄,下載,可以順便看看網(wǎng)頁(yè)上的Readme敢朱,然后解壓縮剪菱,開(kāi)工。
摘錄Readme部分內(nèi)容如下:

解壓縮得到六個(gè)文件拴签。
如果是「朙月拼音」系列輸入方案的用戶(hù)琅豆,請(qǐng)將補(bǔ)靪文件 luna_pinyin.custom.yaml 改名爲(wèi)你所使用的輸入方案對(duì)應(yīng)的 id。(比如朙月拼音·簡(jiǎn)化字方案篓吁,則將 luna_pinyin.custom.yaml 改名爲(wèi) luna_pinyin_simp.custom.yaml)
如果是雙拼輸入方案的用戶(hù)茫因,請(qǐng)將補(bǔ)靪文件 double_pinyin.custom.yaml 改名爲(wèi)你所使用的輸入方案對(duì)應(yīng)的 id。(比如智能ABC雙拼方案杖剪,則將 double_pinyin.custom.yaml 改名爲(wèi) double_pinyin_abc.custom.yaml)
將六個(gè)文件放入用戶(hù)文件夾中(Windows:%AppData%\Rime冻押,Mac/Library/Rime,*Linux*:/.config/ibus/rime/)盛嘿。
重新部署(Windows 用戶(hù)請(qǐng)?jiān)陂_(kāi)始菜單中找到〔小狼毫輸入法〕洛巢,然後點(diǎn)選「重新部署小狼毫」;Mac/Linux 用戶(hù)請(qǐng)?jiān)谟疑辖堑妮斎敕ㄟx單中點(diǎn)選「重新部署/ ? (Deploy) 」)次兆。
驗(yàn)證:切換到拼音或其他適用方案稿茉,輸入「一介書(shū)生」(驗(yàn)證擴(kuò)充詞庫(kù)之基本詞庫(kù))、「一丈紅」(驗(yàn)證擴(kuò)充詞庫(kù)之漢語(yǔ)大詞典詞徑嫣俊)漓库、「疑是地上霜」(驗(yàn)證擴(kuò)充詞庫(kù)之詩(shī)詞詞庫(kù))、輸入「哆啦A夢(mèng)(duo la a meng)」(驗(yàn)證擴(kuò)充詞庫(kù)之西文詞庫(kù)园蝠,此子詞庫(kù)爲(wèi)朙月拼音系列方案專(zhuān)有渺蒿,雙拼方案不推薦使用)。

1. 修改luna_pinyin.custom.yaml

這里一定要注意的是:因?yàn)橹拔覀円呀?jīng)調(diào)整了“l(fā)una_pinyin.custom.yaml”文件彪薛,所以在copy的過(guò)程中一定不能把這個(gè)文件覆蓋過(guò)去茂装,否則,前面你就白忙乎了善延。

正確的作法是少态,打開(kāi)解壓縮后的luna_pinyin.custom.yaml文件,將其“patch:”下的代碼copy到我們自己的“~/Library/Rime/luna_pinyin.custom.yaml”中易遣,copy完成后彼妻,自己的luna_pinyin.custom.yaml文件看起來(lái)應(yīng)該是下面這個(gè)樣子的:
# luna_pinyin.custom.yaml

patch:
    engine/translators:
        - punct_translator
        - r10n_translator
        - reverse_lookup_translator
    recognizer/patterns/reverse_lookup: "`[a-z]*$ "   #請(qǐng)刪除$后的空格!不加一個(gè)空格貌似總是解析錯(cuò)誤训挡,不知道MarkDown我還有多少不知道的地方:(
    schema/dependencies:
        - emoji
    abc_segmentor/extra_tags:
        - reverse_lookup
    reverse_lookup:
        dictionary: emoji
        enable_completion: false
        prefix: "`"
        tips: 〔表情〕
            
# 載入朙月拼音擴(kuò)充詞庫(kù)
    "translator/dictionary": luna_pinyin.extended
# 改寫(xiě)拼寫(xiě)運(yùn)算澳骤,使得含西文的詞彙(位於 luna_pinyin.cn_en.dict.yaml 中)不影響簡(jiǎn)拼功能(注意澜薄,此功能只適用於朙月拼音系列方案为肮,不適用於各類(lèi)雙拼方案)
# 本條補(bǔ)靪只在「小狼毫 0.9.30」、「鼠鬚管 0.9.25 」肤京、「Rime-1.2」及更高的版本中起作用颊艳。
    "speller/algebra/@before 0": xform/^([b-df-np-z])$/$1_/             

2. Copy文件

將:
luna_pinyin.extended.dict.yaml
luna_pinyin.hanyu.dict.yaml
luna_pinyin.poetry.dict.yaml
luna_pinyin.cn_en.dict.yaml
這四個(gè)詞庫(kù)文件移動(dòng)到用戶(hù)資料夾 “~/Library/Rime/”

如果你是雙拼用戶(hù),請(qǐng)按照Readme的說(shuō)明將“una_pinyin.poetry.dict.yaml”詞庫(kù)文件修改名稱(chēng)后忘分,移動(dòng)到用戶(hù)資料夾 “~/Library/Rime/”

3. 重新部署

由于涉及到詞庫(kù)文件的處理棋枕,你會(huì)發(fā)現(xiàn)本次部署的時(shí)間要稍為長(zhǎng)一點(diǎn),在等待的過(guò)程妒峦,看看上面的Readme中的“驗(yàn)證”重斑。

按照驗(yàn)證中的幾個(gè)詞輸入一下試試看,再輸入“upan”肯骇、“ip”看看窥浪,是不是直接輸出了U盤(pán)和iPad?很驚喜有木有笛丙?中英文混輸已經(jīng)可以了漾脂。

如果驗(yàn)證不成功,請(qǐng)確認(rèn)你的“輸入方案”選擇是“朙月拼音”胚鸯,如果還有問(wèn)題骨稿,請(qǐng)會(huì)頭仔細(xì)檢查過(guò)程中有沒(méi)有出錯(cuò)。

增加自己的詞庫(kù)

相信很多人和我一樣以前用也是搜狗輸入法姜钳,所以以下內(nèi)容都是如何將搜狗的詞庫(kù)轉(zhuǎn)移到Rime中進(jìn)行使用坦冠。在〔新手推薦敎程〕關(guān)于導(dǎo)入詞庫(kù)及「深藍(lán)詞庫(kù)轉(zhuǎn)換」的正確操作方法 | rime 吧中的9、10哥桥、13樓提到另一個(gè)開(kāi)源軟件OpenCC蓝牲,用途就一個(gè):繁簡(jiǎn)轉(zhuǎn)化。按照貼吧中的說(shuō)法需要將詞庫(kù)進(jìn)行繁簡(jiǎn)轉(zhuǎn)化后再考慮導(dǎo)入系統(tǒng)的問(wèn)題泰讽。所以例衍,我先考慮的是,將搜狗詞庫(kù)轉(zhuǎn)化為方案文件已卸,仿照朙月拼音擴(kuò)充詞庫(kù)的處理方式先擴(kuò)容詞庫(kù)佛玄,而不是直接導(dǎo)入到Rime詞庫(kù)中。

1. 詞庫(kù)準(zhǔn)備

1.1 下載一個(gè)可用的Rime詞庫(kù)

這里有一個(gè)現(xiàn)成的搜狗詞庫(kù)轉(zhuǎn)為Rime詞庫(kù)的可用文件累澡,感謝愿意分享的同學(xué)們(如果鏈接失效了請(qǐng)自行尋找梦抢,或者聯(lián)系我索取我處理過(guò)的詞庫(kù))。

這個(gè)詞庫(kù)命名為: sogou-1.txt

1.2 導(dǎo)出自己的搜狗詞庫(kù)

不幸的事情是搜狗MAC版本好像沒(méi)有詞庫(kù)導(dǎo)出的選項(xiàng)愧哟,Win下面7.4. * 以后的版本貌似導(dǎo)出的詞庫(kù)是加密的了奥吩,我所檢索到的資料還沒(méi)有找到能處理的辦法(一個(gè)輸入法哼蛆,都要給用戶(hù)制造選擇障礙,體高用戶(hù)遷移成本霞赫,唉腮介,誰(shuí)讓人是免費(fèi)的呢,也沒(méi)啥好計(jì)較的端衰,想起來(lái)了“艱難的決定”)叠洗。
當(dāng)然,問(wèn)題總是可以解決的:Win下7.1以?xún)?nèi)的版本是支持將詞庫(kù)導(dǎo)出到TXT文件的旅东,依靠度娘找一個(gè)舊版本灭抑,趕緊起虛機(jī)導(dǎo)出詞庫(kù)文件把(現(xiàn)在不用,以后說(shuō)不定也用得著)抵代。建議導(dǎo)出的時(shí)候格式選擇txt腾节,免得后面的處理出現(xiàn)意外。

1.3 詞庫(kù)轉(zhuǎn)換

神器出場(chǎng):深藍(lán)詞庫(kù)轉(zhuǎn)換,如果鏈接打不開(kāi)荤牍,請(qǐng)百度并安裝2.0版本(ZIP包:959KB)禀倔。這個(gè)工具使用很簡(jiǎn)單,綠色版本参淫,界面簡(jiǎn)單救湖,操作友好,只要確定輸入是搜狗詞庫(kù)涎才,輸出是Rime文件格式就可以鞋既。

轉(zhuǎn)換完成后這個(gè)詞庫(kù)命名為: sogou-2.txt

2. 詞庫(kù)簡(jiǎn)繁轉(zhuǎn)換

2.1 OpenCC安裝

有關(guān)OpenCC的項(xiàng)目介紹可以看這里可以看到Rime項(xiàng)目的大神“佛振”也參與了這個(gè)項(xiàng)目。如果你是碼農(nóng)耍铜,你完全可以從GitHub拉下來(lái)這個(gè)項(xiàng)目之后安裝邑闺,如果你是MAC的試用者,對(duì)開(kāi)發(fā)不熟悉棕兼,那么這個(gè)OpenCC的安裝還是需要花點(diǎn)時(shí)間的陡舅。
安裝方式看這里,沒(méi)有pkg也沒(méi)有dmg伴挚,只有源代碼和命令行靶衍。如果你不是碼農(nóng),那么很有可能需要從:

Homebrew套件管理器開(kāi)始安裝茎芋,Homebrew是OSX下的一個(gè)好東西颅眶,你可以不用去了解他,打開(kāi)“終端”(默認(rèn)在“實(shí)用工具”里面)田弥,輸入下面的命令:

ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"

中間會(huì)有提示涛酗,請(qǐng)確認(rèn),然后等待安裝結(jié)束,具體安裝時(shí)間就看你的網(wǎng)絡(luò)情況了商叹,安裝結(jié)束后開(kāi)始:

開(kāi)始安裝OpenCC燕刻,不要關(guān)閉“終端”,請(qǐng)輸入下面的命令:

brew install opencc

具體安裝進(jìn)度看你的網(wǎng)絡(luò)情況了剖笙,等待安裝完成卵洗。
安裝完成后應(yīng)該可以看到OpenCC的版本是1.0.2。在“終端”輸入:

opencc -h   

可以看到opencc的命令行幫助信息枯途,這時(shí)候就說(shuō)明opencc已經(jīng)部署好了忌怎,下面開(kāi)始詞庫(kù)轉(zhuǎn)換籍滴。

2.2 OpenCC簡(jiǎn)繁轉(zhuǎn)換

首先用Sublime Text分別打開(kāi)sogou-1.txt酪夷、sogou-2.txt確定編碼格式是否為utf-8。
如果沒(méi)問(wèn)題孽惰,分別將兩個(gè)文件另存為:sogou-1.1.txt晚岭、sogou-2.1.txt,全選后刪除所有數(shù)據(jù)保存退出勋功。這樣我們就有了編碼格式正確的sogou-1坦报、sogou-2這2個(gè)源文件和sogou-1.1、sogou-2.1這2個(gè)目標(biāo)空文件狂鞋。

為了方便后面的操作片择,在“/Library/Rime/”目錄中新建一個(gè)文件夾,并命名為“sogou”骚揍;然后將上一步準(zhǔn)備的四個(gè)文件Copy到“/Library/Rime/sogou”文件夾中字管。

在“終端”,請(qǐng)輸入下面的命令:

opencc -i ~/Library/Rime/sogou/sogou-1.txt -o ~/Library/Rime/sogou/sogou-1.1.txt 

很快就會(huì)執(zhí)行完成信不,然后在終端中繼續(xù)轉(zhuǎn)換第二個(gè)文件:

opencc -i ~/Library/Rime/sogou/sogou-2.txt -o ~/Library/Rime/sogou/sogou-2.1.txt 

回到“~/Library/Rime/sogou”文件夾中嘲叔,可以看到sogou1.1txt、sogou2.1txt已經(jīng)有在了轉(zhuǎn)換后的繁體字的詞庫(kù)抽活,至此詞庫(kù)轉(zhuǎn)換完成硫戈。

3. 制做詞庫(kù)文件

將“/Library/Rime/sogou”中的sogou-1.1txt、sogou-2.1txt文件copy到“/Library/Rime/”文件夾中下硕,然后將之前臨時(shí)新建的sogou文件夾刪除或者是剪切到適當(dāng)?shù)奈恢帽4妗?/p>

將“sogou-1.1txt”重命名為:“l(fā)una_pinyin.sogou.dict.yaml”丁逝。

如果不知道怎么修改擴(kuò)展名,可以復(fù)制任一 * .yaml文件梭姓,并將其名字修改后果港,將sogou-1.1.txt中的全部?jī)?nèi)容copy進(jìn)去,然后刪除沒(méi)用的sogou-1.1.txt即可糊昙。

打開(kāi):“l(fā)una_pinyin.sogou.dict.yaml”辛掠,在文件** 最上方 **增加如下內(nèi)容:

#  luna_pinyin.sogou.dict.yaml
    
    ---
    name: luna_pinyin.sogou    #這就是你自定義的詞庫(kù)的名字:sogou,后面還要用到
    version: "2015.XX.XX"       #版本時(shí)間,最好填當(dāng)前時(shí)間萝衩,要版本控制的意識(shí)
    sort: by_weight
    use_preset_vocabulary: true
    ...
#下面就是之前轉(zhuǎn)換好的詞庫(kù)回挽,如:

    釣魚(yú)島 diao yu dao 1
    黑瞎子島    hei xia zi dao  1
    南沙羣島    nan sha qun dao 1
    鴻庥島 hong xiu dao    1
    南威島 nan wei dao 1
    景宏島 jing hong dao   1

將“sogou-2.1txt”重命名為:“l(fā)una_pinyin.yourname.dict.yaml”,同樣的猩谊,在文件前面增加:

#  luna_pinyin.sogou.dict.yaml
    
    ---
    name: luna_pinyin.yourname    #這就是你自定義的詞庫(kù)的名字:yourname千劈,后面還要用到
    version: "2015.XX.XX"       #版本時(shí)間,最好填當(dāng)前時(shí)間牌捷,要版本控制的意識(shí)
    sort: by_weight
    use_preset_vocabulary: true
    ...

4. 使詞庫(kù)生效

4.1 修改yaml文件

回顧一下墙牌,在前面增加詞的過(guò)程中,對(duì)“l(fā)una_pinyin.custom.yaml”path了這樣一條:

#  luna_pinyin.custom.yaml
    
    patch:
# 略去其余部分
    "translator/dictionary": luna_pinyin.extended

可以看到暗甥,對(duì)于“朙月拼音”喜滨,現(xiàn)在調(diào)用的是luna_pinyin.extended,打開(kāi)“l(fā)una_pinyin.extended.dict.yaml”撤防,可以找到下面這段:
# luna_pinyin.extended.dict.yaml
---
name: luna_pinyin.extended
version: "2014.09.07"
sort: by_weight
use_preset_vocabulary: true
#此處爲(wèi)明月拼音擴(kuò)充詞庫(kù)(基本)默認(rèn)鏈接載入的詞庫(kù)虽风,有朙月拼音官方詞庫(kù)、明月拼音擴(kuò)充詞庫(kù)(漢語(yǔ)大詞典)寄月、明月拼音擴(kuò)充詞庫(kù)(詩(shī)詞)辜膝、明月拼音擴(kuò)充詞庫(kù)(含西文的詞彙)漾肮。如果不需要加載某個(gè)詞庫(kù)請(qǐng)將其用「#」註釋掉厂抖。
#雙拼不支持 luna_pinyin.cn_en 詞庫(kù),請(qǐng)用戶(hù)手動(dòng)禁用克懊。
import_tables:
- luna_pinyin
- luna_pinyin.hanyu
- luna_pinyin.poetry
- luna_pinyin.cn_en
...

現(xiàn)在明白了吧:對(duì)于“朙月拼音”忱辅,我們?cè)谌值膌una_pinyin.custom.yaml中定義了dictionary是“l(fā)una_pinyin.extended”,在“l(fā)una_pinyin.extended.dict.yaml”中定義了import_tables是:luna_pinyin保檐、luna_pinyin.hanyu耕蝉、luna_pinyin.poetry、luna_pinyin.cn_en夜只,所以只需要做如下修改垒在,增加“tables”即可:

#  luna_pinyin.extended.dict.yaml
    ---
    name: luna_pinyin.extended
    version: "2014.09.07"
    sort: by_weight
    use_preset_vocabulary: true
#此處爲(wèi)明月拼音擴(kuò)充詞庫(kù)(基本)默認(rèn)鏈接載入的詞庫(kù),有朙月拼音官方詞庫(kù)扔亥、明月拼音擴(kuò)充詞庫(kù)(漢語(yǔ)大詞典)场躯、明月拼音擴(kuò)充詞庫(kù)(詩(shī)詞)、明月拼音擴(kuò)充詞庫(kù)(含西文的詞徛眉贰)踢关。如果不需要加載某個(gè)詞庫(kù)請(qǐng)將其用「#」註釋掉。
#雙拼不支持 luna_pinyin.cn_en 詞庫(kù)粘茄,請(qǐng)用戶(hù)手動(dòng)禁用签舞。
    import_tables:
        - luna_pinyin
        - luna_pinyin.hanyu
        - luna_pinyin.poetry
        - luna_pinyin.cn_en
        - luna_pinyin.sogou
        - luna_pinyin.yourname
    ... 

4.2 重新部署

如果操作正確秕脓,請(qǐng)用你個(gè)人詞庫(kù)你認(rèn)為屬于生僻的詞組做測(cè)試吧,比如你一個(gè)奇怪的同事的名字儒搭,你們公司奇怪的產(chǎn)品名字等吠架,驚喜不?雞凍不搂鲫?

5. 同步詞庫(kù)

到了這里傍药,你已經(jīng)對(duì)鼠須管的配置文件比較熟悉了,所以魂仍,同步詞庫(kù)很簡(jiǎn)單拐辽。編輯 installation.yaml 文件,添加一行:

sync_dir: “/Users/username/Dropbox/sync/Rime”

如果你是細(xì)節(jié)控擦酌,還可以修改:

installation_id: "yourname" #自定義個(gè)人文件夾的名字

怎么樣俱诸,現(xiàn)在是不是感覺(jué)到Rime真的是一個(gè)不錯(cuò)的輸入法了?

如果你屬于專(zhuān)業(yè)人士仑氛,對(duì)于搜狗的細(xì)胞詞庫(kù)依賴(lài)度很高乙埃,沒(méi)關(guān)系闸英,按照前面的方法:下載——深藍(lán)轉(zhuǎn)換——OpenCC轉(zhuǎn)換-形成詞庫(kù)——修改yaml文件的順序去處理就OK了锯岖。

如果在過(guò)程中還有什么搞不定的,請(qǐng)留言甫何。最后附上官方提供的emoji表情的介紹看符號(hào)表

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末出吹,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子辙喂,更是在濱河造成了極大的恐慌捶牢,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,214評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件巍耗,死亡現(xiàn)場(chǎng)離奇詭異秋麸,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)炬太,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,307評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門(mén)灸蟆,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人亲族,你說(shuō)我怎么就攤上這事炒考。” “怎么了霎迫?”我有些...
    開(kāi)封第一講書(shū)人閱讀 152,543評(píng)論 0 341
  • 文/不壞的土叔 我叫張陵斋枢,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我知给,道長(zhǎng)瓤帚,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 55,221評(píng)論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮戈次,結(jié)果婚禮上轰胁,老公的妹妹穿的比我還像新娘。我一直安慰自己朝扼,他們只是感情好赃阀,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,224評(píng)論 5 371
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著擎颖,像睡著了一般榛斯。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上搂捧,一...
    開(kāi)封第一講書(shū)人閱讀 49,007評(píng)論 1 284
  • 那天驮俗,我揣著相機(jī)與錄音,去河邊找鬼允跑。 笑死王凑,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的聋丝。 我是一名探鬼主播索烹,決...
    沈念sama閱讀 38,313評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼弱睦!你這毒婦竟也來(lái)了百姓?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 36,956評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤况木,失蹤者是張志新(化名)和其女友劉穎垒拢,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體火惊,經(jīng)...
    沈念sama閱讀 43,441評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡求类,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,925評(píng)論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了屹耐。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片尸疆。...
    茶點(diǎn)故事閱讀 38,018評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖张症,靈堂內(nèi)的尸體忽然破棺而出仓技,到底是詐尸還是另有隱情,我是刑警寧澤俗他,帶...
    沈念sama閱讀 33,685評(píng)論 4 322
  • 正文 年R本政府宣布脖捻,位于F島的核電站,受9級(jí)特大地震影響兆衅,放射性物質(zhì)發(fā)生泄漏地沮。R本人自食惡果不足惜嗜浮,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,234評(píng)論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望摩疑。 院中可真熱鬧危融,春花似錦、人聲如沸雷袋。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,240評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)楷怒。三九已至蛋勺,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間鸠删,已是汗流浹背抱完。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,464評(píng)論 1 261
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留刃泡,地道東北人巧娱。 一個(gè)月前我還...
    沈念sama閱讀 45,467評(píng)論 2 352
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像烘贴,于是被迫代替她去往敵國(guó)和親禁添。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,762評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容