將有道單詞本導出到墨墨自建詞庫記憶,只背那些私人訂制的單詞

對于很多人來說背單詞是一個很痛苦的經歷列林,但是學習英語又是一件非做不可的事情。其中有一個痛點是酪惭,你用托福希痴,GRE等詞庫記憶會遇到很多你已經會的單詞或者由于你平時很難遇到因此背了就忘的單詞。這篇文章專門針對這個問題分享一個我用了很久的詞庫私人訂制方案春感,同時還可以治療懶癌砌创。

有道詞典

有道詞典的屏幕取詞比較方便,詞庫和社區(qū)功能也比較全面鲫懒,所以平時使用比較多嫩实。日常遇到的生單詞可以隨時放到有道自帶的單詞本中,收集記憶窥岩。雖然有道單詞本提供背單詞的功能甲献,但是非常單一,沒有艾賓浩斯遺忘曲線颂翼,所以非常不適合用來復習單詞晃洒。

墨墨背單詞

再說說墨墨(添加個Link以免有人想多)。墨墨是我用過的背單詞app中最推薦的一個疚鲤。原因有以下:
  1. 根據艾賓浩斯遺忘曲線給你需要復習的單詞锥累;
  2. 可以自己創(chuàng)建詞庫(在網頁中操作),不用按照托福集歇、雅思桶略、專四專八的詞庫去記很多你已經記住了的或者你平時基本遇不到的單詞;
  3. 可以每日簽到诲宇,簽到的時候還會‘Peng’一下际歼,細致的給你成就感;
  4. 你有必要每日簽到姑蓝!一是因為如果連續(xù)幾天不簽到會累積很多你需要復習的單詞鹅心,二是自建詞庫的單詞數(shù)不是無限的,你需要通過簽到來掙纺荧,或者花錢買(雖然不貴但是掙不到數(shù)量靠買獲取是不是很傷自尊)旭愧;
  5. 此外,每天至少記憶單詞數(shù)累積到10個你才能簽到宙暇;
  6. 例句和助記非常豐富输枯,而且你可以自己創(chuàng)建自己喜歡的助記方式;
  7. 例句或助記中的生單詞可以直接添加到記憶清單中占贫;
  8. app內部鏈接五大在線詞典桃熄;
  9. 可以查看自己記憶單詞的很多統(tǒng)計指標和未來復習單詞數(shù)的預測;
  10. 暫時就想到這些了型奥。

詞庫私人訂制

那么瞳收,問題來了碉京。一個是平時使用和收集生單詞的有道詞典,一個是可以方便記憶和復習自建詞庫的墨墨背單詞螟深,怎么快速有效的把有道詞典單詞本收集的生單詞導入到自己創(chuàng)建的墨墨詞庫中?
  在這里谐宙,我肯定不會允許你耗時費力地一個一個復制!而如果把有道單詞本導出來再放入墨墨詞庫血崭,你會發(fā)現(xiàn)導出的單詞本包括序號卧惜,音標,詞性標識和漢語意思等夹纫,把這些全部直接復制到自建詞庫中將會引起很大的麻煩(試試你就知道了)咽瓷。我的solution是這樣的:
  1. 從有道詞典單詞本中導出你想加入記憶的單詞到一個.txt文件;
  2. 把.txt文件的編碼改為 utf-8 (直接另存為舰讹,有選項)茅姜;
  3. 使用本文后面的附加的python程序可以提取出你需要記憶的單詞;
  4. 程序將會生成一個.txt文件月匣,打開之后會發(fā)現(xiàn)里面只剩英語單詞了钻洒,將他們復制到你的墨墨自建詞庫中,記下詞庫編號锄开;
  5. 用墨墨記憶單詞的時候通過詞庫編號鏈接到你的詞庫素标,你就可以開始學習你的私人訂制的詞庫了。

程序代碼

此程序完成將text文件中這樣的記錄:

350, incarnation [?nkɑ?'ne??(?)n] n. 化身萍悴;道成肉身头遭;典型 incarnation: 化身 |
道成肉身 | 道成肉身

轉化為這樣的詞條:

incarnation

程序是用python寫的,我不常做文本處理癣诱,本程序只為滿足簡單的基礎需要计维,所以應該有很多可以改進的地方(歡迎分享你的更好的方案)。你只需要用自己的有道詞典導出的utf-8編碼的記事本文件路徑和名稱替換第19行的E:\voc.txt

# -*- coding: utf-8 -*-
"""
Created on Apr 28 2016
Extracting vocabulary from Youdao dictionary
The vocabulary text file should be code as utf-8

<INPUT>
file_in: the exported vocabulary from Youdao
</INPUT>

<OUTPUT>
file_out: the file to save the English words. Default file name is
            new_words_'time'.txt ('time' is the local date)
<OUTPUT>

@author: sinit
"""
import codecs,time
file_in = r'E:\voc.txt'
outname = 'new_words'+'_'+time.strftime("%Y-%m-%d",time.localtime())+".txt"
file_out = r'E:\\'+outname
fs = codecs.open(file_in, 'r','utf-8')
vocabulary = fs.readlines()
fs.close()
word = []
word.append(vocabulary[0].split()[1])
def is_chinese(uchar):
#Judge if a unicode is Chinese
    if (uchar >=u'/u4e00')&(uchar<=u'/u9fa5'):
        return True
    else:
        return False
def is_zh (c):
        x = ord (c)
        # Punct & Radicals
        if x >= 0x2e80 and x <= 0x33ff:
                return True

        # Fullwidth Latin Characters
        elif x >= 0xff00 and x <= 0xffef:
                return True

        # CJK Unified Ideographs &
        # CJK Unified Ideographs Extension A
        elif x >= 0x4e00 and x <= 0x9fbb:
                return True
        # CJK Compatibility Ideographs
        elif x >= 0xf900 and x <= 0xfad9:
                return True

        # CJK Unified Ideographs Extension B
        elif x >= 0x20000 and x <= 0x2a6d6:
                return True

        # CJK Compatibility Supplement
        elif x >= 0x2f800 and x <= 0x2fa1d:
                return True

        else:
                return False
for i in range(1,len(vocabulary)):
    line = vocabulary[i].split()
    if vocabulary[i].split()[0][:-1].isdigit():
        newword = vocabulary[i].split()[1]
        if is_zh(newword[0]):
            continue
        else:
            word.append(vocabulary[i].split()[1])
fs = open(file_out, 'w+')
for line in word:
    fs.write(line)
    fs.write('\n')
fs.close()

print('Assignment Done!')
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末撕予,一起剝皮案震驚了整個濱河市鲫惶,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌实抡,老刑警劉巖欠母,帶你破解...
    沈念sama閱讀 222,627評論 6 517
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異吆寨,居然都是意外死亡艺蝴,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,180評論 3 399
  • 文/潘曉璐 我一進店門鸟废,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人姑荷,你說我怎么就攤上這事盒延∷趵蓿” “怎么了?”我有些...
    開封第一講書人閱讀 169,346評論 0 362
  • 文/不壞的土叔 我叫張陵添寺,是天一觀的道長胯盯。 經常有香客問我,道長计露,這世上最難降的妖魔是什么博脑? 我笑而不...
    開封第一講書人閱讀 60,097評論 1 300
  • 正文 為了忘掉前任,我火速辦了婚禮票罐,結果婚禮上叉趣,老公的妹妹穿的比我還像新娘。我一直安慰自己该押,他們只是感情好疗杉,可當我...
    茶點故事閱讀 69,100評論 6 398
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著蚕礼,像睡著了一般烟具。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上奠蹬,一...
    開封第一講書人閱讀 52,696評論 1 312
  • 那天朝聋,我揣著相機與錄音,去河邊找鬼囤躁。 笑死冀痕,一個胖子當著我的面吹牛,可吹牛的內容都是我干的割以。 我是一名探鬼主播金度,決...
    沈念sama閱讀 41,165評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼亮曹,長吁一口氣:“原來是場噩夢啊……” “哼侯勉!你這毒婦竟也來了?” 一聲冷哼從身側響起色查,我...
    開封第一講書人閱讀 40,108評論 0 277
  • 序言:老撾萬榮一對情侶失蹤消玄,失蹤者是張志新(化名)和其女友劉穎跟伏,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體翩瓜,經...
    沈念sama閱讀 46,646評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡受扳,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 38,709評論 3 342
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了兔跌。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片勘高。...
    茶點故事閱讀 40,861評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出华望,到底是詐尸還是另有隱情蕊蝗,我是刑警寧澤,帶...
    沈念sama閱讀 36,527評論 5 351
  • 正文 年R本政府宣布赖舟,位于F島的核電站蓬戚,受9級特大地震影響,放射性物質發(fā)生泄漏宾抓。R本人自食惡果不足惜子漩,卻給世界環(huán)境...
    茶點故事閱讀 42,196評論 3 336
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望石洗。 院中可真熱鬧幢泼,春花似錦、人聲如沸劲腿。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,698評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽焦人。三九已至挥吵,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間花椭,已是汗流浹背忽匈。 一陣腳步聲響...
    開封第一講書人閱讀 33,804評論 1 274
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留矿辽,地道東北人丹允。 一個月前我還...
    沈念sama閱讀 49,287評論 3 379
  • 正文 我出身青樓,卻偏偏與公主長得像袋倔,于是被迫代替她去往敵國和親雕蔽。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 45,860評論 2 361

推薦閱讀更多精彩內容