作為非英語國家的人,在學習的時候總會遇到很多前人留下的翻譯裕坊,一個體會就是在學習的時候要努力把這些詞匯翻譯成自己能夠理解的語言包竹,因為如果不能深刻的理解一個概念,就很有效的用它進行思考籍凝。在此基礎(chǔ)上如果仍然感到理解困難周瞎,則可以嘗試去查找對應(yīng)的英文原文,很可能它會直截了當?shù)母嬖V你當初的命名者對于這個術(shù)語如此命名的初衷和思考在哪里饵蒂。
先舉一個不那么常見但很有代表性的例子声诸,如果你接觸過機器學習的模型評估方面的內(nèi)容,很可能見過一個奇妙的術(shù)語:魯棒性退盯,你可能想不到這個土到土星的翻譯彼乌,對應(yīng)的英文單詞居然是 Robust泻肯,這個單詞常見的翻譯是“健壯”,因此在模型評估的語境中更現(xiàn)代化的翻譯應(yīng)該是“穩(wěn)健性”慰照。這個“魯棒”不是一根棒子灶挟,也跟魯班沒有關(guān)系,而是一個特定時期下英文水平集體欠佳時的習慣性音譯毒租。
接下來我們看一個線性代數(shù)的例子:在很多線性代數(shù)教材中稚铣,一上來就會介紹一個概念叫“行列式”,這個翻譯乍看起來沒有任何問題蝌衔,因為它表面上看起來就是把一張行列狀的數(shù)表放在兩條豎線里榛泛,進而教材還會直接給你一個異常奇怪的計算方法,好像你只要記住這個計算規(guī)則就可以了噩斟!如果你也足夠的好奇曹锨,并和我一樣相信欣賞數(shù)學之美的關(guān)鍵在于理解而不是記憶,決定不糊里糊涂的接受這個概念剃允,就會發(fā)現(xiàn)這個行列式的英文單詞是 Determinant沛简,源于 Determine 這個詞,后者翻譯為“決定”斥废,這是否暗示我們的“行列式”是被某個東西決定的呢椒楣?如果你有這個直覺,那么值得為自己驕傲牡肉!因為行列式的值實際上就是使用相應(yīng)的矩陣進行線性變換后對于標準基下的單位面積的一個縮放比例捧灰,因此行列式就是被對應(yīng)的矩陣所“決定”的。
剛剛提到線性代數(shù)中的基 basis统锤,我們?nèi)粘=佑|到的大多數(shù)的矩陣和向量如不特殊指明毛俏,其數(shù)值表示都來自于其在標準基 naive basis 下的坐標,這個 naive 的英文原意為“未經(jīng)改變的,初始的”,也就意味著我們默認將以形如 [1, 0, ... , 0], ... , [0, 0, ... , 1] 這樣的一個方陣來作為標準阳距,用它來衡量其他的一切矩陣和向量的坐標,其他的基都是通過矩陣對于這個標準基施加線性變換而得來的阀溶,也就是經(jīng)過改變的基。進一步地鸦泳,對應(yīng)上面的標準基構(gòu)成的矩陣還有一個英文單詞银锻,叫做 identity matrix,也即它就是一切其他矩陣的身份識別矩陣做鹰。
和基相關(guān)的另一個概念是“張成的空間”徒仓,用以描述一組基的所有線性組合構(gòu)成的向量集合。我在最初學習的時候看到書上這個翻譯就非常難以理解誊垢,后來查看原版書籍才恍然大悟掉弛,其對應(yīng)的英文單詞就是 span 這個詞,其更為常用的翻譯為“范圍”喂走,而張成的空間也就是以一組向量為出發(fā)點殃饿,對其窮盡所有可能的線性組合所能覆蓋到的向量的范圍。對應(yīng) span 的一個更為具體的例子是機械手的各個關(guān)節(jié)的轉(zhuǎn)動和移動最終使得執(zhí)行機構(gòu)的工作空間在某個范圍內(nèi)芋肠,對應(yīng)這個范圍就是 span乎芳。
繼續(xù)線性代數(shù)的例子,在了解了基是可變的這一事實的基礎(chǔ)上帖池,我們會遇到相似矩陣奈惑,兩個互為相似矩陣的關(guān)系的其實質(zhì)是同一個線性變換在不同基下的坐標表示。在線性代數(shù)中所見到的相似矩陣的定義:P-1AP = B 睡汹,這其中默認隱含 A 與 B 的坐標是基于標準基的肴甸。式中矩陣 P 對應(yīng)的英文單詞是 Permutation,翻譯為“置換”囚巴,實際上 P 就是在不同基之間執(zhí)行切換的置換矩陣原在,并且實現(xiàn)基的置換的方法就是通過 P 左乘想要置換基的矩陣和向量即可,這實際是矩陣左乘實現(xiàn)線性變換的一個特殊實例彤叉。
相似矩陣的另一個應(yīng)用是本征分解 Eigendecomposition庶柿,其含義是對于任何實對稱矩陣來說本征值都是實數(shù),且都可以通過本征分解展開成 A = QΛQT= QΛQ-1秽浇,其中 Q 為標準正交矩陣浮庐,做這個矩陣分解的目的是作為一個相似關(guān)系,我們用矩陣 A 施加線性變換的結(jié)果和采用這個更簡潔的對角陣的結(jié)果是一樣的柬焕,所以如果我們有更加簡潔的形式便于操作审残,何樂而不為呢?這里我想說的是對于這個公式中的 Q击喂,因為其是一個標準正交矩陣维苔,對應(yīng)的英文單詞是 Orthognormal matrix,但這里為何符號用的是 Q 而不是 O 呢懂昂?我一直查了很久最終才從別人那里獲知矩陣 Q 對應(yīng)的英文單詞是 Quadrature介时,同樣翻譯為正交,對應(yīng) QR 分解里的 Q 也是這個單詞凌彬。在知道了這個翻譯之后沸柔,對于記憶這兩個矩陣分解對分解后的矩陣的形式要求是不是就容易了呢?
再舉一個微積分中的例子铲敛,我不知道有多少人在接觸“導數(shù)”這個詞的時候立即就對其有直覺的理解褐澎,實際上其英文單詞為 derivative,常翻譯為“衍生的”伐蒋,而導數(shù)就是從原函數(shù)衍生出來的不是嗎工三?相對應(yīng)的迁酸,在描述自變量或因變量的一個微小變動時我們又回見到一個術(shù)語叫做“差分”,其對應(yīng)的英文單詞其實就是 difference俭正,實際上就是“差異”而已奸鬓,在理解了這些概念之后,其對應(yīng)的運算也就一清二楚了掸读。
在統(tǒng)計學中串远,被研究的對象的所有可能的結(jié)果的集合稱為總體 Population,之所以采用這個詞是因為正是人口普查 census 催生了現(xiàn)代統(tǒng)計學的很多研究結(jié)果儿惫,所以總體這個英文單詞最常用的翻譯是“人口”澡罚。同樣地,統(tǒng)計中“均值”這個指標是如此重要以至于它已經(jīng)融入到我們的日常表達中肾请,我們常說某個事情的平均水平是某個值留搔,就代表如果從樣本集中獲取一個樣本,可以預期其取值應(yīng)該在平均水平附近筐喳,因此在統(tǒng)計學中均值也被稱為期望 Expectation催式。在統(tǒng)計中將樣本點做頻數(shù)統(tǒng)計后,頻數(shù)最高的那個數(shù)就稱為眾數(shù) Mode避归,這個數(shù)值反映了一種取值的傾向性荣月,對應(yīng)的在英文中用的是 Mode,而這個英文單詞比較令人熟知的翻譯是“趨勢”梳毙。
不只是數(shù)學哺窄,在編程學習中的文本查詢和處理中會遇到“正則表達式”這個讓很多人聽而生畏的詞,對應(yīng)的英文單詞是 Regular Expression账锹,實際上它的目的就是通過一些標準化的符號來概括性的表達一些常用的文字表述萌业,并以此輔助字符串的查詢和匹配,因此并不是一個很難的數(shù)學公式或者其他形式奸柬,這個詞我自己的翻譯版本就是“常用表達方式”或者“常規(guī)表達方式”生年。
與此類似的是在機器學習中,為了增強模型的泛化能力而減少方差廓奕,會使用一種聽起來非常拗口技術(shù)叫做“正則化”抱婉,對應(yīng)的英文單詞為 regularization,這個技術(shù)是在模型預測結(jié)果的成本函數(shù)中不僅考慮誤差的絕對值大小桌粉,還將模型的復雜度作為一個評價指標蒸绩,進而利用“范數(shù)”這個工具對參數(shù)的獲取過程施加一定的影響而使得最終的模型參數(shù)更加的“規(guī)范和尋常”铃肯,不容易受到輸入中的異常因素的影響而反應(yīng)過激患亿,所以我個人頭腦中的翻譯是“規(guī)范化”。
上面這些單詞只是日常遇到的很多例子中的幾個押逼,實際上的例子比這個要多很多步藕。如果你是一個對自己負責的學習者惦界,對于新的概念稍微多做幾分思考,對于學習絕對會大有裨益漱抓。你當然可以不喜歡我自己的翻譯表锻,更重要的是:你要有自己理解和翻譯。那些創(chuàng)造這些概念的先賢們也一定經(jīng)歷了很多苦思才選定了相應(yīng)的單詞乞娄,而我們不能因為一些不恰當?shù)姆g而丟掉那些賢者們賜予我們的智慧。所以如果可能显歧,盡量去閱讀原版的英文教材仪或,你會看到另外一個世界。
Happy Learning!