語義栏笆,詞典,樹與網(wǎng)

卷首語

前陣子在看《符號(hào)學(xué)與語言哲學(xué)》臊泰。
  這種跨種族啊不對(duì)是跨學(xué)科的看書總是很酸爽蛉加。
  然后,拖了很久,今天打算寫一篇關(guān)于這貨的東西针饥。
  當(dāng)然厂抽,僅僅是關(guān)于其中“字典與意義”這一部分的。

老規(guī)矩丁眼,說是說寫關(guān)于這本書的筷凤,其實(shí)和這本書沒多大關(guān)系,兩者交集甚小苞七。


關(guān)于符號(hào)

關(guān)于符號(hào)與語言藐守,之前寫過兩篇東西:《符號(hào)與語言》《思考與語言》蹂风。
  簡(jiǎn)單來說卢厂,符號(hào)(包括語言)是人的思想的承載者,是思想的表現(xiàn)惠啄,這就導(dǎo)致了一個(gè)顯而易見的問題——符號(hào)究竟如何表達(dá)思想慎恒?
  以語言來說,a這個(gè)字母所表達(dá)的意義是什么撵渡?在英語中表示“一個(gè)”這樣的量詞意義巧号,但a本身可以僅僅是一個(gè)字母從而不表達(dá)任何意思——比如說字母b就沒有任何意義,直到某個(gè)語言將b選出來賦予一個(gè)意義位置姥闭,比如b語言(真的有么丹鸿??棚品?)或者“兩個(gè)”(你夠了?炕丁)。
  因此铜跑,作為符號(hào)的一種的語言本身不具備任何意義门怪,意義是后期人們指派上去的,所以是一種約定俗成锅纺。
  于是掷空,這里就可以分解出兩個(gè)次級(jí)問題:
  <u>1,被賦予的意義本身從哪來的囤锉;</u>
  <u>2坦弟,為何如此給符號(hào)賦予意義。</u>
  這里官地,很顯然酿傍,第一個(gè)問題更<u>重要</u>也更<u>基本</u>。

意義的來源

關(guān)于符號(hào)意義的來源驱入,讓我們來考慮一個(gè)純粹思想的實(shí)驗(yàn):

假定赤炒,有一個(gè)生物氯析,它是如此之簡(jiǎn)單,以至于所有我們?nèi)祟愃鶕碛械母呒?jí)感官都不存在莺褒;同時(shí)掩缓,它又是如此之復(fù)雜,以至于它可以清楚地知道自己的感受是什么——所以遵岩,這樣的妖孽是不存在的你辣,我們只是假設(shè)一下——那么這樣的生物所能形成的符號(hào),有哪些旷余?

我們當(dāng)然不能斷然地說這樣的生物的腦海(按照我們的妖孽設(shè)定,應(yīng)該是有“腦”海的)中空空如也——事實(shí)上扁达,語言文字乃至所有的符號(hào)僅僅是思想的承載著正卧,所以勢(shì)必是先存在思想,然后再被符號(hào)化的跪解。我們的妖孽生物當(dāng)然是缺少“符號(hào)化”此一能力的炉旷,但我們不能 認(rèn)為它的腦海中什么都沒有。
  由于它沒有任何高級(jí)感官功能叉讥,所以它能具有的只能是最基本的生物性的本能窘行,比如條件反射。
  生物的定義中便包含了這么一條——可以對(duì)周圍的環(huán)境刺激作出應(yīng)激反應(yīng)图仓。因此罐盔,收到輸入,然后做出反饋救崔,只是生物的本能惶看。如果一個(gè)物體不具備這樣的基本行為反應(yīng)模式,那么要么它不是生物六孵,要么它曾是生物——現(xiàn)在掛了纬黎。當(dāng)然,更高級(jí)的比如裝死這種劫窒,我們就不在我們的妖孽問題中討論了本今。
  這種應(yīng)激反應(yīng)是很簡(jiǎn)單的根據(jù)輸入反饋輸出的模式,而且它是如此之簡(jiǎn)單——比如感受到光與熱就移動(dòng)過去主巍,如果太熱就移開冠息,如果一段有可以吸收消化的東西一段沒有就朝有的那一段移動(dòng),等等孕索,這是都是細(xì)胞級(jí)的基本反應(yīng)——以至于都可以被規(guī)約為“如果……就……”這樣的范式——當(dāng)然铐达,如果的未必是具體的事件,而是一類綜合刺激條件檬果。
  因此瓮孙,我們的妖孽在最少的程度唐断,也可以通過漫長時(shí)間積累的條件反射來在腦海中形成最基本的“邏輯”的概念,以及那一類綜合刺激條件的概念——從而杭抠,最最簡(jiǎn)單最最基本的妖孽生物的腦海中也會(huì)存在兩大可被符號(hào)化的概念體——具象的刺激脸甘,與,抽象的邏輯偏灿。
  那么丹诀,這兩個(gè)最根本的概念體的本意從何而來?
  具象的刺激來源于那些具體的妖孽細(xì)胞所受到的刺激翁垂,而抽象的邏輯則源自對(duì)生物本能的抽象铆遭。
  當(dāng)然,這里不得不說的是:<u>實(shí)際生物圈并不存在這樣的妖孽細(xì)胞沿猜,所以不存在這種簡(jiǎn)單的結(jié)果枚荣,但人造亞智慧體就說不定了。</u>
  就實(shí)際生物來說啼肩,在它們強(qiáng)大到足以進(jìn)化出語言文字之前橄妆,思考已經(jīng)存在(當(dāng)然,前文字等符號(hào)也必然會(huì)存在祈坠,但個(gè)人始終堅(jiān)定地認(rèn)為害碾,即便是前文字等符號(hào),也是晚于思考的出現(xiàn)的赦拘,更別說從不會(huì)思考到具有思考能力的進(jìn)化過程本就不是突變的而是漸變的慌随,所以還會(huì)出現(xiàn)比人類的思考簡(jiǎn)單得多得多得多的“前思考”,比如純粹的直覺)躺同,而后由于交流的需要而形成各種人造的符號(hào)儒陨,這些符號(hào)的形成也都出自上述兩個(gè)源泉:對(duì)真實(shí)世界的總結(jié),與對(duì)抽象過程的總結(jié)笋籽。
  符號(hào)的一個(gè)意義是表征蹦漠、跡象,這在考慮純粹動(dòng)物性的行為的時(shí)候也很有幫助——比如進(jìn)化程度沒有達(dá)到人類這樣的高度的生物车海,它們依然可以通過地面上的爪印笛园、周圍別的生物的排泄物的味道等等感官資料來明了危險(xiǎn)就在身邊——埃科在《符號(hào)學(xué)與語言哲學(xué)》中曾不無酸意地調(diào)侃著地問到那些能看到大洋上各種水文與氣象環(huán)境的意義的水手難道說比符號(hào)學(xué)家更了解符號(hào)么侍芝?就事實(shí)來說研铆,答案是肯定的,因?yàn)榱私夥?hào)形成過程與內(nèi)在邏輯本質(zhì)的理論的人在真實(shí)的實(shí)際的符號(hào)面前完全有可能是白癡州叠,所以在這里我們可以說:符號(hào)學(xué)家在面對(duì)自然界的符號(hào)以及它們的意義與內(nèi)在邏輯本質(zhì)的時(shí)候往往連草原上的一條鬣狗都不如棵红。
  這些自然界中的符號(hào)的意義的來源,很顯然地源自那些生物長期的生存本能以及對(duì)真實(shí)世界的觀察總結(jié)——當(dāng)然咧栗,不要看到“總結(jié)”一詞就傲嬌地認(rèn)為是人類專有逆甜。

說這么多虱肄,就是為了說明一點(diǎn):<u>符號(hào)的起源是現(xiàn)實(shí)世界,所以符號(hào)的意義也必然源自現(xiàn)實(shí)世界交煞。</u>

但這話又顯得有問題——你告訴我例外群在現(xiàn)實(shí)世界的哪里咏窿?Finsler幾何又在現(xiàn)實(shí)世界的哪里?
  中土世界在哪里素征?福爾摩斯又在哪里呢集嵌?

這些問題,其實(shí)就和之前提出但是之后被忽略的另一個(gè)符號(hào)意義的來源有關(guān)御毅,那就是有些符號(hào)的意義源自對(duì)抽象概念對(duì)象的再次抽象化——比如說根欧,我們的妖孽細(xì)胞原則上可以分析出“如果……就……”這樣的形式邏輯概念,因?yàn)樗鼈兪窃醋陨锉拘缘亩饲菓?yīng)激反應(yīng)的抽象化凤粗,所以原則上是可以被妖孽細(xì)胞總結(jié)形成的。
  同樣的欺税,無論是抽象中的最艱深者現(xiàn)代數(shù)學(xué)侈沪,還是文藝作品想象世界中的虛構(gòu)人事物揭璃,本質(zhì)上它們都可以認(rèn)為是對(duì)現(xiàn)實(shí)世界中實(shí)在之物在思想世界中的抽象對(duì)象的二次處理——可以是對(duì)它們的抽象與總結(jié)晚凿,也可以是運(yùn)用這些抽象之物的再造與重構(gòu)。
  換言之瘦馍,<u>符號(hào)的意義可以直接源自現(xiàn)實(shí)世界歼秽,也可以源自那些直接源自現(xiàn)實(shí)世界的概念之物的二次處理甚至更高階。</u>

從這點(diǎn)來說情组,符號(hào)的意義本身既收到現(xiàn)實(shí)的影響燥筷,也受到符號(hào)使用者與接收者的主觀意愿的影響。

這點(diǎn)具體到語言與文字上院崇,就體現(xiàn)為這么兩個(gè)基本現(xiàn)實(shí):不同環(huán)境的人所使用的語言中肆氓,相同的對(duì)象所對(duì)應(yīng)的詞匯就算再接近,也總會(huì)有所不同底瓣;以及谢揪,每個(gè)不同的人對(duì)同一個(gè)詞匯的使用也總是存在一定的差異的。
  如果說著說明了符號(hào)的意義的來源的話捐凭,那這種來源顯然并不牢靠拨扶。

意義的差異

對(duì)于一套語言的使用者來說,在一定的時(shí)間段內(nèi)茁肠,大概總會(huì)出現(xiàn)這么一種情況患民,那就是人們對(duì)于大部分術(shù)語的意義都有一個(gè)基本確定的能指范圍——當(dāng)然,對(duì)于那些只有極少數(shù)人使用或者本身就處于不斷變化著的領(lǐng)域的術(shù)語就不能作此要求垦梆。
  于是匹颤,一個(gè)人所說的一個(gè)詞或者所作的一個(gè)符號(hào)的意義仅孩,大致可以分解為三部分:
  <big><u>實(shí)際詞義 = 基本詞義 + 語境詞義 + 私語詞義</u></big>
  比如說,在電影《PK》中一開始有一段是PK和女主在監(jiān)獄里惋嚎,PK就說杠氢,同一句話就有四種不同的意思,配合四個(gè)不同的使用場(chǎng)景與人物表情另伍。
  實(shí)際生活中語言的使用就是如此——同樣的一個(gè)“羊”鼻百,在學(xué)術(shù)領(lǐng)域可能表示的是牛科的羊亞科摆尝,也可能表示某種抽象的羊(作為生肖的羊温艇,或者說是山羊與綿羊等的統(tǒng)稱),也可能是指具有羊的形狀特征的物體堕汞,或者某個(gè)具體的動(dòng)物勺爱,甚至僅僅是表示“羊”這個(gè)字。
  比如說下面這些場(chǎng)景:
  1, A:“前面那是什么動(dòng)物讯检?”B:“羊琐鲁。”
  2, A:“這個(gè)雕塑是什么人灼?”B:“羊围段。”
  3, A:“那是什么動(dòng)物的叫聲投放?”B奈泪;“羊【姆迹”
  4, A:“到底是這頭羊還是這頭牛把這里的草吃光的涝桅?”B:“羊±友”
  5, A:“這副壁畫太抽象了冯遂,到底畫的是什么啊谒获?”B:“羊试读⌒窭ⅲ”
  6, A:“你屬什么诞吱?”B:“羊辖源。”
  7, A:“你寫的是什么字熬汀狼速?”B:“羊∝酝#”
  8, A:“你說羊駝是羊還是鴕向胡?”B:“羊恼蓬。”
  你看僵芹,所有這些問題的答案都是相同的处硬,但所代表的東西卻完全不同。
  當(dāng)我們?cè)诳吹酱鸢浮把颉钡臅r(shí)候拇派,除了“羊”這個(gè)字的基本含義——生物學(xué)上羊亞科的那些動(dòng)物的總稱——外荷辕,這個(gè)字符還蘊(yùn)含了很多別的信息,且這些信息大多都可以通過上下文也即語境來做出區(qū)分——甚至于件豌,許多情況下符號(hào)的使用并不涉及這個(gè)符號(hào)所代表的意義與你想表達(dá)的意義到底是否吻合疮方,比如羊駝實(shí)際上是鴕科的,但我卻依然可以說我認(rèn)為羊駝是“羊”茧彤。
  因此骡显,符號(hào)或者說術(shù)語的使用與符號(hào)本身的基本意之間并不必然有限定關(guān)系。
  在《黑暗托馬》中曾掂,女主角的形態(tài)在人惫谤、蜘蛛等等形態(tài)之間連續(xù)過渡般地變化,而男主角也在人與貓之間忽左忽右珠洗。這里作為符號(hào)的“我”的具體意指與它的實(shí)際形態(tài)——文中的“我”當(dāng)然還是人——并沒有必然的關(guān)聯(lián)溜歪。
  換言之,無論我們?nèi)绾尉_一個(gè)術(shù)語在公共語言體系中的基本義到什么程度——無論是按照波菲利之樹的層次遞進(jìn)分解還是按照百科全書式的屬性剝離——在具體術(shù)語與符號(hào)的使用中险污,都可以完全不管這些基本義而做任何可能的衍生與流變——這既是術(shù)語之上的句痹愚、段富岳、文的整體性意義所為——也即語境詞義——也可以是一些私人化的語言的使用所導(dǎo)致的蛔糯。

再說那私語詞義。
  私語的出現(xiàn)顯然必然地遭遇真正的語言的形成窖式。人與人之間的交流的出現(xiàn)使得不同個(gè)體的私語相互磨合彼此妥協(xié)蚁飒,并最終形成一個(gè)群體公認(rèn)的基本詞義。
  但公共語言的形成并不表示私語的消失萝喘。
  比如說淮逻,當(dāng)我說“粒子”的時(shí)候和一個(gè)普通的路人所認(rèn)為的“粒子”就可以是完全不同的。
  一來阁簸,普通公共詞匯中的“粒子”所指的可能是一粒一粒的小顆粒爬早,但還是屬于宏觀世界,但在一個(gè)學(xué)過物理的人眼中的“粒子”卻是說的分子启妹、原子甚至是亞原子粒子筛严。學(xué)過理論物理的人所為的粒子基本所表示的是“規(guī)范群的生成元”。
  這些還是不同團(tuán)體之間的“小集體私語”現(xiàn)象饶米。
  再具體到個(gè)人桨啃,我所謂的“粒子”指的是“符合某規(guī)范群規(guī)律的P維實(shí)體”车胡,而在一個(gè)超標(biāo)準(zhǔn)理論支持者看來可能是“例外群E8的生成元”——這如果還屬于是流派之爭(zhēng)的話,那么任何兩個(gè)支持最正統(tǒng)標(biāo)準(zhǔn)模型的人所說的粒子也可能有些微差異——有些人可能認(rèn)為E8的每個(gè)生成元都代表一個(gè)粒子照瘾,而有些人可能認(rèn)為這代表了一個(gè)基本粒子的不同狀態(tài)匈棘,等等等等。
  事實(shí)上析命,就算是在理論物理學(xué)界內(nèi)主卫,所為“正統(tǒng)”與“主流”也僅僅是一個(gè)模糊的范疇性的說法,是一大類彼此足夠近似卻又并不精確相同的觀念的總和——甚至于鹃愤,幾乎可以說就算是同一個(gè)領(lǐng)域同一個(gè)流派同一個(gè)假設(shè)的兩個(gè)同行队秩,對(duì)于許多概念的細(xì)節(jié)理解都是彼此不同的,因此當(dāng)具體到一個(gè)確定的術(shù)語的時(shí)候昼浦,大家的理解也并不完全相同——但可以做到“彼此足夠近似但卻不精確相同”馍资。
  這其實(shí)也就是術(shù)語與符號(hào)的基本現(xiàn)實(shí)——基本詞義就是一個(gè)群體中“彼此足夠近似但卻不精確相同”的東西,而私語詞語則是那“并不精確相同”的“毛糙”部分关噪。
  而鸟蟹,使用理論物理這個(gè)例子的好處是可以最大程度地消除“語境詞義”的干擾。

當(dāng)我們研究一個(gè)術(shù)語與符號(hào)在實(shí)際使用過程中的意義時(shí)使兔,語境詞義是非常重要的東西——但建钥,也因此是無法被完備地歸納的東西,我們不可能窮舉所有可能出現(xiàn)的情況來為語境詞義建立一張表或樹或者別的什么分類學(xué)上的表征虐沥,這從可操作性上來說就不可為的熊经。
  因此,我們對(duì)術(shù)語與符號(hào)的意義的分析只能到基本詞義與私語私語這兩個(gè)層次——而后者又因?yàn)閺?qiáng)烈地依賴個(gè)體經(jīng)驗(yàn)與感受差異欲险,從而也是實(shí)際上很不具備可操作性的镐依。
  我們最終能做的,也就是來尋找那些基本詞義是如何誕生的——然后將其類推到私語詞義上天试,并結(jié)合具體個(gè)體的具體經(jīng)驗(yàn)與感受等個(gè)體性內(nèi)容槐壳。

基本詞義

對(duì)于基本詞義的固化,我們最早接觸的就是各類辭典喜每。

詞典本質(zhì)上是建立了一種一對(duì)多的映射务唐,即你輸入一個(gè)術(shù)語,便返回這個(gè)術(shù)語的幾個(gè)基本詞義——當(dāng)然带兜,一套完美的術(shù)語體系的詞典理應(yīng)是一一映射枫笛,一個(gè)確定的術(shù)語代表一個(gè)確定的詞義,但實(shí)際上的自然語言卻不可能做到這點(diǎn)——所以才有了基于雙關(guān)(基本詞義或者語境詞義在一句話中的一對(duì)多映射)的各種語言藝術(shù)形式刚照,包括笑話刑巧。
  從形式上說,詞典羅列了術(shù)語而不加區(qū)分。而從功能上說海诲,詞典給出了術(shù)語的基本要素——意義繁莹。
  但,羅列顯然不是一個(gè)好的系統(tǒng)化方式特幔,于是在羅列即詞典的基礎(chǔ)上咨演,我們又可以引入兩套相關(guān)但不同的整體體系——樹與網(wǎng)。

讓我們考慮這么一個(gè)場(chǎng)景(而且也是實(shí)際生活中必然會(huì)遇到的場(chǎng)景):
  我們有海量的文件需要整理蚯斯,方便日后搜索薄风,那么請(qǐng)問應(yīng)該如何整理這些文件?

一個(gè)比較傳統(tǒng)的做法拍嵌,那就是建立一個(gè)目錄樹遭赂,然后將不同的文件放置在不同的目錄下。
  比如說横辆,我有50GB的電子書(這是真的撇他,而且這還是還幾年前的存貨量,現(xiàn)在也許已經(jīng)上百G了……)狈蚤,可以先按照文學(xué)困肩、實(shí)用、技術(shù)脆侮、科學(xué)锌畸、人文這幾個(gè)大類,在第一層分出五個(gè)目錄靖避。
  然后潭枣,文學(xué)下又分出小說、紀(jì)實(shí)幻捏、散文盆犁、雜文、詩歌這五個(gè)目錄粘咖,實(shí)用下有詞典蚣抗、百科全書侈百、菜譜瓮下、旅游、其它這五個(gè)目錄钝域,技術(shù)下有編程讽坏、美工、電腦維修者三個(gè)目錄例证,科學(xué)下分出數(shù)學(xué)路呜、物理、天文這三個(gè)目錄,人文下分哲學(xué)胀葱、政治漠秋、歷史、經(jīng)濟(jì)抵屿、社會(huì)庆锦、法律這六個(gè)目錄。
  每個(gè)二級(jí)目錄下還可以再繼續(xù)細(xì)分轧葛,并在按照內(nèi)容無法做出區(qū)分后搂抒,再按照作者與年代做區(qū)分——比如在物理下,有理論物理尿扯,理論物理中有相對(duì)論和量子力學(xué)求晶,相對(duì)論中分索恩、惠勒衷笋、彭羅斯芳杏、愛因斯坦、霍金辟宗。
  這樣的目錄法可以將任何一份文檔唯一地確定到一個(gè)路徑蚜锨。
  這樣的方法不但在文件管理與知識(shí)管理中可以用,在實(shí)際生活中也可以說是大行其道慢蜓,比如圖書館中的書刊分類亚再,也比如博物學(xué)中的分類學(xué),或者生物學(xué)上的物種分類(這部分聽說還有好幾套不同的分類方法)晨抡,或者語言學(xué)中的波菲利之樹氛悬。

事實(shí)上,樹狀管理的基本思想耘柱,便是不斷地尋找同一個(gè)節(jié)點(diǎn)中復(fù)數(shù)個(gè)元素之間的差異如捅,并對(duì)這些差異做出歸類,總結(jié)出幾個(gè)最大的差異點(diǎn)调煎,然后做區(qū)分——這樣的做法總是可以不斷進(jìn)行下去镜遣,直到每個(gè)分岔的末端(所為的葉節(jié)點(diǎn))只有一個(gè)元素為止。
  甚至于士袄,我們可以將整棵樹做成二叉樹——也就是每個(gè)節(jié)點(diǎn)都根據(jù)某個(gè)確定屬性的有或無來做區(qū)分悲关,有是一類,無是一類娄柳,并最終以只有單一元素的葉節(jié)點(diǎn)為結(jié)束寓辱。
  因此,樹狀管理或者說樹狀分類的根本就在于<u>尋找獨(dú)有特性</u>與<u>“分岔”</u>——在波菲利之樹以及亞里士多德的詞典中稱為“種差”赤拒。
  就如之前說詞典的時(shí)候提到的秫筏,一個(gè)完美的語言诱鞠,每個(gè)術(shù)語與意義之間應(yīng)該是一一對(duì)應(yīng)的——這不但要求一個(gè)術(shù)語之具有唯一的確定的意思,也要求一個(gè)意思只有唯一確定的術(shù)語可以表達(dá)这敬。在這種情況下航夺,這種完美的語言的波菲利之樹應(yīng)該是完全夠用的,任何其它形式的術(shù)語管理都必然會(huì)無差別地規(guī)約到它的波菲利之樹上來崔涂。
  但敷存,這對(duì)于實(shí)際的天然語言來說卻是不可能的。

天然語言的特性堪伍,在于它的術(shù)語和意義之間不是一一對(duì)應(yīng)的——一個(gè)術(shù)語往往具有復(fù)數(shù)的意義锚烦,而一個(gè)意義也往往可以用復(fù)數(shù)個(gè)術(shù)語來表達(dá)(這里說的是同義詞而非近義詞)。這就導(dǎo)致了一個(gè)問題帝雇,那就是一個(gè)術(shù)語往往同時(shí)存在于波菲利之樹的多個(gè)葉節(jié)點(diǎn)上涮俄,而有些葉節(jié)點(diǎn)內(nèi)又同時(shí)存在多個(gè)術(shù)語,這顯然會(huì)造成一定的困擾尸闸。
  另一方面彻亲,樹狀管理還有另一個(gè)本質(zhì)性的問題,那就是分類方法或者說索引規(guī)則是沒有統(tǒng)一標(biāo)準(zhǔn)的——所以吮廉,到底按照什么標(biāo)準(zhǔn)來做每一層類別的劃分苞尝,其實(shí)存在很大的任意性。
  我們還是以電子書的整理為例宦芦。

在電子書的整理中宙址,我們基本必然會(huì)遇到這樣的情況:
  一本書既是說廣義相對(duì)論的,又是說規(guī)范場(chǎng)論的调卑,作者還是兩三人合著抡砂,即是教材,又是論文集(這在一些前沿領(lǐng)域是常態(tài)恬涧,比如我手上有三本超弦入門教材實(shí)際上就是十來位不同物理學(xué)家各自的論文匯總而成的論文集)注益。
  那么,這里同時(shí)存在上面所說的兩個(gè)問題——
  一本電子書可能同時(shí)位于廣義相對(duì)論與規(guī)范場(chǎng)論這兩個(gè)目錄下溯捆,也可能同時(shí)位于惠藤與溫伯格這兩個(gè)目錄下丑搔。
  同時(shí),我到底是根據(jù)作者來分提揍,還是根據(jù)種類(是教材還是論文)來分啤月,還是根據(jù)學(xué)科來分呢?
  更要命的是碳锈,無論以什么索引規(guī)則來建立索引顽冶,我都會(huì)遇到這樣的情況:某一層的多個(gè)目錄的下級(jí)子目錄的結(jié)構(gòu)與命名是完全相同的:廣義相對(duì)論下要分惠藤、溫伯格和霍金售碳,規(guī)范場(chǎng)論下也要分惠藤、溫伯格與霍金。
  相同的結(jié)構(gòu)在不同的目錄下反復(fù)出現(xiàn)贸人,這可以說是這種類型的大型資料數(shù)據(jù)庫的樹狀匯整中所必然會(huì)出現(xiàn)的间景。
  如果我們堅(jiān)持在每個(gè)目錄下放一本書的話,這會(huì)導(dǎo)致極大的冗余艺智。
  這倘要,可以說是樹狀管理與分類的不可避免的弊病——只要數(shù)據(jù)庫足夠龐大。

對(duì)于語言學(xué)中的詞義的分類來說十拣,波菲利之樹也面臨同樣的問題封拧。

為此,在樹狀管理與分類之上夭问,我們又得到了網(wǎng)狀管理與分類泽西。

網(wǎng)

網(wǎng)狀管理與分類的方法,則類似于Web2.0早期就出現(xiàn)的“Tag法”缰趋,即為數(shù)據(jù)對(duì)象添加標(biāo)簽捧杉,而非分配到某個(gè)具體的目錄下。
  比如說秘血,上面所提的電子書的例子中味抖,一本多位作者合著的前沿教材就可以同時(shí)具有“廣義相對(duì)論”、“規(guī)范場(chǎng)論”灰粮、“惠藤”仔涩、“溫伯格”、“霍金”粘舟、“教材”红柱、“論文”這些標(biāo)簽。

如果說蓖乘,樹狀管理的本質(zhì)是不斷根據(jù)特定屬性的有無來進(jìn)行分裂锤悄,但本質(zhì)上數(shù)據(jù)還是一體的從而是一元性的,那么網(wǎng)狀管理的本質(zhì)則是二元性的——現(xiàn)在我們所處理的對(duì)象分解為了數(shù)據(jù)本身嘉抒,以及描述數(shù)據(jù)部分特征的“Tag集”零聚。
  樹狀管理中的數(shù)據(jù)會(huì)不斷分裂歸并,而在樹狀管理中的數(shù)據(jù)則一直保持整體不做分裂些侍,而是單獨(dú)抽出一層Tag層隶症,我們所面對(duì)的是這個(gè)Tag層中的標(biāo)簽構(gòu)成的網(wǎng),然后通過這個(gè)網(wǎng)的節(jié)點(diǎn)來尋找對(duì)應(yīng)的數(shù)據(jù)集岗宣。
  因此蚂会,事實(shí)上網(wǎng)狀管理本身也是二元的——我們先要根據(jù)數(shù)據(jù)總結(jié)出“屬性集”,然后根據(jù)這個(gè)屬性集為每個(gè)數(shù)據(jù)標(biāo)上一組值耗式,用來表示對(duì)應(yīng)的屬性的值(一般可以看作就是“有”和“無”這二選一的值)胁住,接著根絕這份屬性值表來給出每個(gè)數(shù)據(jù)的屬性集合(前面的屬性集是所有數(shù)據(jù)的所有屬性構(gòu)成的集合趁猴,而這里的屬性集則是每個(gè)數(shù)據(jù)自身所有的屬性構(gòu)成的集合)。
  因此彪见,我們事實(shí)上就需要進(jìn)行“屬性集的制備”與“建立數(shù)據(jù)的屬性集”這兩部儡司,以完成最后的標(biāo)簽網(wǎng)的建立。

可見余指,網(wǎng)狀管理的優(yōu)點(diǎn)是數(shù)據(jù)的匯整更靈活捕犬,數(shù)據(jù)的查詢與提取也更容易;但缺點(diǎn)也是顯而易見的:當(dāng)屬性有很多的時(shí)候酵镜,我們依然需要對(duì)這些屬性來做整理匯總碉碉,這樣才能有效地實(shí)現(xiàn)管理的目的——此時(shí),就會(huì)出現(xiàn)將數(shù)據(jù)的屬性集視為數(shù)據(jù)的第二層網(wǎng)狀結(jié)構(gòu)淮韭,甚至更高層垢粮。
  比如在LDA中,關(guān)鍵詞可以看作是文章的第一層屬性集缸濒,而關(guān)鍵詞所屬的專題則是這第一層屬性集的屬性集——如果需要足丢,這個(gè)過程可以不斷重復(fù)下去,直到出現(xiàn)一層“足夠簡(jiǎn)單”的屬性層庇配。
  當(dāng)然斩跌,站在語言學(xué)對(duì)術(shù)語與符號(hào)的意義的整理的角度來說,找出每個(gè)符號(hào)所代表意義所具有的屬性捞慌,并以這些屬性來做歸整耀鸦,或許已經(jīng)足夠了。

總結(jié)來說啸澡,如果說樹狀管理的精髓是分類歸并袖订,那么網(wǎng)狀管理的精髓就是尋找共同點(diǎn)(或曰屬性),這顯然是兩個(gè)截然不同的方向嗅虏。

當(dāng)然洛姑,樹與網(wǎng)也并不是非此即彼的——事實(shí)上,對(duì)屬性集采用樹狀管理皮服,那么得到的數(shù)據(jù)的管理結(jié)構(gòu)也就是樹狀的楞艾;而如果使用樹狀結(jié)構(gòu)中的目錄全路徑為屬性的話,自然也就可以得到對(duì)應(yīng)的網(wǎng)狀結(jié)構(gòu)龄广。

詞義

在明白了樹與網(wǎng)(也即波菲利之樹與百科全書法)之后硫眯,語義(特指基本詞義)的分析也就有了可選的工具——對(duì),這也僅僅是方法論層面的問題而已择同。

現(xiàn)實(shí)世界的自然語言中詞義的形成两入,往往是樹狀與網(wǎng)狀同時(shí)存在的。
  我們?cè)谠缙谕ㄟ^觀察到的各種實(shí)體對(duì)象而不斷建立抽象的符號(hào)的概念體敲才,并不斷地為這些概念題-觀察到的實(shí)體對(duì)象做分類裹纳,這個(gè)過程是樹狀的择葡。
  但在初次感受之后,當(dāng)我們?cè)谀X海中再次使用這些概念的時(shí)候痊夭,對(duì)這個(gè)概念的運(yùn)用卻是逐漸偏向于網(wǎng)狀的刁岸。
  事實(shí)上脏里,隨著我們觀察到的事物的不斷增多她我,我們傾向于為它們尋找各種共同點(diǎn)并做分類,逐漸將豐繁復(fù)雜砸的現(xiàn)實(shí)之物不斷抽象出共同點(diǎn)來迫横,最后逐漸形成一個(gè)最大的最抽象的概念——這可以說是逆向的樹狀管理番舆,但卻也不能算是網(wǎng)狀。
  而后矾踱,當(dāng)新來之物被不斷使用不斷學(xué)習(xí)不斷強(qiáng)化后恨狈,它們就會(huì)被歸并到已有的經(jīng)驗(yàn)知識(shí)體系中,這個(gè)時(shí)候卻往往是以網(wǎng)狀的形式進(jìn)行新舊合并呛讲。

讓我們回到術(shù)語的使用上來禾怠。
  當(dāng)我們之考慮基本詞義的時(shí)候,樹與網(wǎng)的意義何在贝搁?
  恐怕吗氏,最大的意義在于:如果采用樹狀結(jié)構(gòu),我們可以知道一個(gè)術(shù)語是什么而不是什么雷逆;而采用網(wǎng)狀結(jié)構(gòu)弦讽,我們可以知道一個(gè)術(shù)語具有哪些特性。
  當(dāng)然膀哲,由于樹狀和網(wǎng)狀并不是截然不同不可互換的(這點(diǎn)之前已經(jīng)提過)往产,所以并不存在“樹狀可以做什么而網(wǎng)狀不可以”或者反過來的情況。

尾聲

關(guān)于詞典和詞義這部分某宪,基本上對(duì)此的理解就到這里的仿村。
  更深入的東西有些就太零碎了,這里就不說了兴喂。

嗯蔼囊,作為羊年第一篇,就這樣吧瞻想。


如果你覺得這篇東西寫得還行压真,愿意打賞我一口咖啡,請(qǐng)戳打賞頁~~
本文遵守創(chuàng)作共享CC BY-NC-SA 3.0協(xié)議**

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末蘑险,一起剝皮案震驚了整個(gè)濱河市滴肿,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌佃迄,老刑警劉巖泼差,帶你破解...
    沈念sama閱讀 217,734評(píng)論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件贵少,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡堆缘,警方通過查閱死者的電腦和手機(jī)滔灶,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,931評(píng)論 3 394
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來吼肥,“玉大人录平,你說我怎么就攤上這事∽褐澹” “怎么了斗这?”我有些...
    開封第一講書人閱讀 164,133評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長啤斗。 經(jīng)常有香客問我表箭,道長,這世上最難降的妖魔是什么钮莲? 我笑而不...
    開封第一講書人閱讀 58,532評(píng)論 1 293
  • 正文 為了忘掉前任免钻,我火速辦了婚禮,結(jié)果婚禮上崔拥,老公的妹妹穿的比我還像新娘极舔。我一直安慰自己,他們只是感情好握童,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,585評(píng)論 6 392
  • 文/花漫 我一把揭開白布姆怪。 她就那樣靜靜地躺著,像睡著了一般澡绩。 火紅的嫁衣襯著肌膚如雪稽揭。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,462評(píng)論 1 302
  • 那天肥卡,我揣著相機(jī)與錄音溪掀,去河邊找鬼。 笑死步鉴,一個(gè)胖子當(dāng)著我的面吹牛揪胃,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播氛琢,決...
    沈念sama閱讀 40,262評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼喊递,長吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了阳似?” 一聲冷哼從身側(cè)響起骚勘,我...
    開封第一講書人閱讀 39,153評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后俏讹,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體当宴,經(jīng)...
    沈念sama閱讀 45,587評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,792評(píng)論 3 336
  • 正文 我和宋清朗相戀三年泽疆,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了户矢。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,919評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡殉疼,死狀恐怖梯浪,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情株依,我是刑警寧澤驱证,帶...
    沈念sama閱讀 35,635評(píng)論 5 345
  • 正文 年R本政府宣布延窜,位于F島的核電站恋腕,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏逆瑞。R本人自食惡果不足惜荠藤,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,237評(píng)論 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望获高。 院中可真熱鬧哈肖,春花似錦、人聲如沸念秧。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,855評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽摊趾。三九已至币狠,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間砾层,已是汗流浹背漩绵。 一陣腳步聲響...
    開封第一講書人閱讀 32,983評(píng)論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留肛炮,地道東北人止吐。 一個(gè)月前我還...
    沈念sama閱讀 48,048評(píng)論 3 370
  • 正文 我出身青樓,卻偏偏與公主長得像侨糟,于是被迫代替她去往敵國和親碍扔。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,864評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容

  • 語言與精神分析 四川大學(xué)哲學(xué)系 霍大同 第一講 1999年3月1日 這是一個(gè)比較困難的題目秕重,我準(zhǔn)備講的課的題目是“...
    團(tuán)的花園閱讀 5,433評(píng)論 0 19
  • Spring Cloud為開發(fā)人員提供了快速構(gòu)建分布式系統(tǒng)中一些常見模式的工具(例如配置管理不同,服務(wù)發(fā)現(xiàn),斷路器悲幅,智...
    卡卡羅2017閱讀 134,656評(píng)論 18 139
  • References: 《speech and language processing 》2nd & 3rd 《統(tǒng)...
    藝術(shù)叔閱讀 7,517評(píng)論 1 8
  • 盡管我并不知道母親節(jié)是不是一個(gè)洋節(jié)套鹅,但是大家在這一天如果真的能為親愛的母親做點(diǎn)事站蝠,哪怕是一聲問候呢,這一個(gè)節(jié)日就值...
    63e3649f0ec3閱讀 201評(píng)論 0 0
  • “Lucy還要上小學(xué)卓鹿,上中學(xué)菱魔,上大學(xué)畢業(yè)畢業(yè)找工作,Lucy會(huì)越長越漂亮吟孙,直到有一天澜倦,她會(huì)領(lǐng)著那個(gè)把她心偷走的那個(gè)...
    雷雨話劇社閱讀 238評(píng)論 0 0