語言學(xué)習(xí)拙見
從實際的項目中進(jìn)行學(xué)習(xí),是我的學(xué)習(xí)理念蚌成,學(xué)習(xí)語言也是一樣芹缔,從實際的文本中進(jìn)行學(xué)習(xí)是一種比較高效的學(xué)習(xí)方式瓶盛〕兔ǎ看語法書轧房、背單詞,然后再去閱讀文本迟赃,我認(rèn)為這是本末倒置纤壁,和人類的認(rèn)知規(guī)律不符合酌媒。
假如說索尼大法星有一種外星生物馍佑,他們的語言只有四種字母拭荤,×、○旦委、□缨硝、△查辩,而他們的單詞不超過兩個字母宜岛,他們的語言有以下幾種字母組合是有意義的單詞萍倡,×:不列敲,○:我戴而,□:你 填硕,△:東西,××:想壮莹,○○:有涝滴,□□:餓歼疮,△△:渴,×○:吃缩麸,×□:喝,其他的概念暫時還沒有開發(fā)出來吹散,該物種只有最基本的自我意識空民,以及表達(dá)最基礎(chǔ)的生物反應(yīng)界轩。他們句子的單詞與單詞之間用=連接。這時候你看到一篇外星文章:
○=×=□□
○=×=△△
□=□□
○=○○=△
□=×○
這篇文章的意思就是:我不餓荒澡,我不渴单山,你餓嗎米奸?我有東西悴晰,你吃嗎铡溪?通過一篇文章棕硫,你習(xí)得了○哈扮、×滑肉、△问畅、□按声、□□签则、△△渐裂、×○等單詞柒凉,在此例中膝捞,占到了其基本單詞的70%蔬咬,除此以外更重要的是林艘,你看到了這些詞匯的具體使用場景和一些語法的規(guī)則狐援,比如說叫x放在“感覺詞”之前作為否定詞啥酱。
當(dāng)然語言學(xué)習(xí)的困難之處便在于懈涛,只掌握基本的單詞是遠(yuǎn)遠(yuǎn)不夠的,因為基本的單詞可以通過組合衍生出許多新的概念埋心,有些時候靠基本單詞的本意并不能夠猜測出組合之后的意思拷呆。比如說茬斧,英語中g(shù)ive和up,都是再簡單不過的單詞,但是放在一起give up伐庭,就有了特定的意思溶耘,雖然說和give、up本身的詞義之間并非沒有關(guān)聯(lián)寇蚊,但是也絕不是顯而易見地就能從give和up單獨(dú)的意思中來推斷出其組合之后的含義。
再舉一例,有個老外聽別人說3000常用漢字能覆蓋99%的漢語文章涕癣,于是他搞了本漢字的字典,閉關(guān)三年前标,把3000漢字學(xué)了個遍坠韩。終于有一天,他能倒著寫“神”和“經(jīng)”兩個字候生,知道這兩個字單獨(dú)的意思,而且每個字都背了其中4、5種釋義,他覺得自己已經(jīng)能夠看懂99%的漢語文章,他找來一篇文章的妖,一來就看到兩個字“神經(jīng)”星虹,他的大腦開始飛速運(yùn)算卸亮,他想著‘神’的意思:god寝受、spirit甩苛、clever等等墨林∩Ω‘經(jīng)’的意思:warp、longitude腊凶、manage政鼠、 as a result of官帘、through等等,神+經(jīng)哪廓,他左思右想综膀,“god longitude(神的經(jīng)度)?讥此、clever manage?(很神的經(jīng)營)充坑、spirit through(神靈經(jīng)過)?等等”甜紫。當(dāng)然他是不會猜對的。
甚至拿索尼大法星球的語言來說揣云,雖然就十個基本單詞矿咕,但是他們還是由此發(fā)展出了不少的俚語的圆,甚至是成語赂韵,比如說□=□=△=△(餓餓渴渴怒炸,意思是饑腸轆轆又口渴)、○=□□=□=×○(我餓你吃梳虽,指對方不講情面)、×○=×□=○○=△(吃喝有東西缠导,意思是生活很富足)汽畴。
從上面的例子可以看出隙券,把單詞作為語言學(xué)習(xí)的基本單位顯然是不夠的,單詞的顆粒度太小了俯艰,根本不是我們平時說話的基本單位。
就拿上面的這句話來舉例博个,基本單位絕對不是一個個孤立的漢字佃蚜,而是:上面的例子、語言學(xué)習(xí)肮之、不夠的筐高、基本單位冰单、顆粒度轿偎、平時說話,這些好比是一個個點(diǎn)直奋,通過“線”把這些點(diǎn)串聯(lián)起來肛度,形成了我們能夠理解的概念傻唾。線是描述點(diǎn)之間的關(guān)系,比如整體和部分的關(guān)系承耿、原因和結(jié)果的關(guān)系冠骄、位置和方向的關(guān)系等等。上面的這句話中加袋,“線”就是:從...出(從...[可以/能夠][看/聽..]出)凛辣,把...作為,是/不是职烧。學(xué)習(xí)一門語言扁誓,就是要把握住它的點(diǎn)和線防泵,其中點(diǎn)顯然不僅僅是孤立的單詞,它應(yīng)該是你生活中常用到的概念蝗敢,通常情況下捷泞,是字或者說單字的組合。除了點(diǎn)和線寿谴,很多語言還要加上一個時間的維度锁右,那就是時態(tài)、動詞變化等方面的內(nèi)容讶泰。
另外咏瑟,也沒必要先去把八百年都用不到的單詞背的滾瓜爛熟。有些人學(xué)英語痪署,他知道30年以內(nèi)只會碰到一次的幽閉恐懼癥的單詞是claustrophobia码泞,但他不知道天天看到的床頭柜英語怎么說,這恰恰是許多國內(nèi)英語學(xué)習(xí)者都在走的偏門惠桃∑忠模花80%的時間去學(xué)20%的機(jī)會才會使用的單詞,當(dāng)然是得不償失辜王。
我認(rèn)為一個比較好的書面語言學(xué)習(xí)平臺便是維基百科(口語和書面語在許多語言里都有一定程度甚至是相當(dāng)程度的差異)劈狐,維基百科的優(yōu)勢在于它的同一個知識點(diǎn)或者說概念,綜合了各種語言的版本呐馆,大體上肥缔,這個概念本身的含義是穩(wěn)定的,你可以先去理解你所熟悉的語言對某個概念的解釋汹来,進(jìn)而再去看你想學(xué)的那一門語言對這個概念的解釋续膳,在參照下進(jìn)行學(xué)習(xí),并且保證首先自己對這個概念的理解不會產(chǎn)生太大的偏差收班。
備注:索尼大法星球的外星人鍵盤
學(xué)習(xí)素材示例
這里先選擇一段維基百科的示例來演示我的語言學(xué)習(xí)方法坟岔,選取的是“neural network”詞條。本身我只會一點(diǎn)點(diǎn)日語摔桦,現(xiàn)在我試圖在不了解任何日本語語法和詞匯的前提下社付,理解這段文本的含義,并且將其中的點(diǎn)和線整理出來邻耕。
ニューラルネットワーク(神経回路網(wǎng))は鸥咖、脳機(jī)能に見られるいくつかの特性を計算機(jī)上のシミュレーションによって表現(xiàn)することを目指した數(shù)學(xué)モデルである。研究の源流は生體の脳のモデル化であるが兄世、神経科學(xué)の知見の改定などにより次第に脳モデルとは乖離が著しくなり啼辣、生物學(xué)や神経科學(xué)との區(qū)別のため、人工ニューラルネットワーク(人工神経回路網(wǎng)御滩、artificial neural network, ANN)とも呼ばれる鸥拧。
第一步:了解大意
通過中文或者英文的該詞條党远,了解其大概的意思
這里摘選一段英文版的釋義:Artificial neural networks (ANNs) or connectionist systems are a computational model used in machine learning, computer science and other research disciplines, which is based on a large collection of connected simple units called artificial neurons, loosely analogous to axons in a biological brain. Connections between neurons carry an activation signal of varying strength.
這一段話無非就是在解釋神經(jīng)網(wǎng)絡(luò)是什么、由什么組成住涉、在何處運(yùn)用以及進(jìn)一步解釋組成它的元素有什么作用麸锉。原文中的大意就是人工神經(jīng)網(wǎng)絡(luò)是一種計算模型,它由大量的人工神經(jīng)元連接而構(gòu)成舆声,在這些人工神經(jīng)元之間的連接的作用是傳遞不同強(qiáng)度的信號花沉。
通過谷歌翻譯,了解其大意
這里僅摘錄第一句話的谷歌翻譯媳握,使用日語翻譯英語碱屁,經(jīng)過測試,感覺準(zhǔn)確性高于日語翻譯成中文蛾找。
這句話的意思是:人工神經(jīng)網(wǎng)絡(luò)是一種數(shù)學(xué)模型娩脾,旨在將大腦功能中的一些特質(zhì),通過計算機(jī)模擬表現(xiàn)出來打毛。
第二步:尋找斷點(diǎn)
再復(fù)雜的句子也是由基本的元素所構(gòu)成的柿赊,把一個句子拆解開,把里面的零件找出來幻枉,進(jìn)而再觀察零件之間的關(guān)系碰声。
斷點(diǎn)
- 次第
- 乖離
- 呼ばれる
- ニューラルネットワーク(neural network)
- シミュレーション(simulation)
- 人工ニューラルネットワーク(artificial neural network)
- モデル(model)
- 見られる
- いくつか
- によって
- する
- である
- など
- により
- とも
神経回路網(wǎng)は、脳機(jī)能に見られるいくつかの特性を計算機(jī)上のシミュレーションによって表現(xiàn)することを目指した數(shù)學(xué)モデルである熬甫。
第一句話胰挑,明顯是在解釋什么是神經(jīng)回路網(wǎng),也就是說如果你要解釋一樣?xùn)|西的時候椿肩,就可以套用它的句式:
神経回路網(wǎng)は瞻颂、數(shù)學(xué)モデルである。(神經(jīng)網(wǎng)絡(luò)是一種數(shù)學(xué)模型)
****東西は郑象、釋義である贡这。*
擴(kuò)展:文末です、ます與だ厂榛、である的區(qū)別
第一句話剩下沒搞明白的地方也就剩下脳機(jī)能に見られるいくつかの特性を計算機(jī)上のシミュレーションによって表現(xiàn)することを目指した這部分了盖矫,繼續(xù)打斷點(diǎn)。
脳機(jī)能に見られるいくつかの特性を計算機(jī)上のシミュレーションによって表現(xiàn)することを目指した
計算機(jī)上のシミュレーション(計算機(jī)上的Simulation)
脳機(jī)能
見られる:「見られる」和「見える」用哪個噪沙?
いくつかの特性(一些特性)
いくつか是什么意思
によって:によって(は)
目指し:目指し是什么意思
表現(xiàn)する:詳細(xì)解說不尋常的學(xué)習(xí)日語詞する
ことを:ことは炼彪、ことが吐根、ことを 正歼、 のは、のが拷橘、のを 有什么區(qū)別和規(guī)律嗎局义?
斷點(diǎn)之間的連接詞相對于斷點(diǎn)本身而言更為難找喜爷,因此在這里劃分的斷點(diǎn)很可能并不準(zhǔn)確。而且由于參考的樣本太少萄唇,還不足以把其中的語言規(guī)律給總結(jié)出來檩帐。但是結(jié)合多種參考素材(如谷歌翻譯、維基百科相同詞條的不同語言版本)另萤,還是能夠比較接近地猜測出原文的含義湃密,并且同時積累下相應(yīng)的斷點(diǎn)表達(dá)。打完斷點(diǎn)之后的上述語句如下:
【脳機(jī)能】に【見られる】【いくつかの特性】を【計算機(jī)上のシミュレーション】【によって】【表現(xiàn)する】【ことを】【目指し】た
先暫且不論上述語句中概念之間的關(guān)系四敞,只看有哪些概念被涉及:大腦機(jī)能(脳機(jī)能)泛源、看到(見られる)、一些特性(いくつかの特性)忿危、計算機(jī)模擬(計算機(jī)上のシミュレーション)达箍、目的(目指し),(表現(xiàn))表現(xiàn)する
前面已經(jīng)說铺厨,神經(jīng)網(wǎng)絡(luò)本質(zhì)上是一種數(shù)學(xué)模型(神経回路網(wǎng)は缎玫、數(shù)學(xué)モデルである),那么這里的一段話應(yīng)該類似于定語解滓,描述神經(jīng)網(wǎng)絡(luò)究竟是怎樣的一種數(shù)學(xué)模型赃磨。根據(jù)已知的內(nèi)容,有理由猜測伐蒂,上述整段話煞躬,主體有兩個部分:
A:在大腦機(jī)能中所觀察到的一些特性
B:計算機(jī)模擬
這兩個部分之間的關(guān)系是通過B表現(xiàn)出A,并且“通過B表現(xiàn)出A”即是該數(shù)學(xué)模型的目的逸邦。
進(jìn)一步可以通過谷歌翻譯來驗證:
可以看出恩沛,英語翻譯中使用了過去分詞seen,有理由相信缕减,見られる是日語動詞的被動形式雷客,按圖索驥,查日語動詞的被動語態(tài)桥狡,可以發(fā)現(xiàn)以下內(nèi)容:
動詞的被動態(tài)及被動助動詞「れる·られる」
含有“被…”之意的動詞為被動態(tài)動詞搅裙。五段動詞未然形后接「れる」、「一段動詞裹芝、カ變動詞部逮、サ變動詞」未然形后接「られる」,便構(gòu)成了被動動詞
由此進(jìn)一步驗證了之前的猜想嫂易,而此處的に則應(yīng)該是作為前面的名詞“腦機(jī)能”和被動動詞“見”之間的連接詞兄朋。
接下來看剩下的內(nèi)容中的によって,從英語翻譯來看怜械,它是一個介詞颅和,大致的意思是漢語中的“通過”
因此在日語中傅事,A通過B,很可能是這樣的結(jié)構(gòu):
ABによって
進(jìn)一步驗證峡扩,找到以下材料蹭越,「~で、によって教届、を用いて」を表現(xiàn)する前置詞: with と by
因此上述的語句的斷點(diǎn)顆粒度可以進(jìn)一步變大响鹃,如下所示:
【脳機(jī)能に見られるいくつかの特性】を【計算機(jī)上のシミュレーション】<によって>{表現(xiàn)する}【こと】を{目指し}た
其含義浮現(xiàn):通過計算機(jī)模擬來表現(xiàn)在腦機(jī)能中所觀察到的一些特性。后面的動詞目指案训,應(yīng)該是表示整個神經(jīng)網(wǎng)絡(luò)的目的茴迁,而ことを,或者こと萤衰,在此處的劃分尚不明晰堕义,但已然不影響對整句話的理解。