作者:賀易之
鏈接:https://www.zhihu.com/question/20679872/answer/65565699
來源:知乎
要理解這個問題乘盖,首先要知道“元”是什么庆揪。
元(meta)处嫌,一般被我們翻譯成“關(guān)于……的……”脏嚷。
事實上各淀,這個前綴來源于希臘文妇穴,表示“在……之后”灸姊,在某樣事情結(jié)束之后拱燃,就含有了“歸納”、“總結(jié)”的意思呢力惯?因此碗誉,元,就代表著“本原”父晶、“體系”的意思诗充。
以文學(xué)領(lǐng)域為例,后現(xiàn)代主義文學(xué)中有一種小說叫作“元小說”诱建,也就是“關(guān)于小說的小說”〉螅“傳統(tǒng)小說往往關(guān)心的是人物俺猿、事件,是作品所敘述的內(nèi)容格仲;而元小說則更關(guān)心作者本人是怎樣寫這部小說的押袍,小說中往往喜歡聲明作者是在虛構(gòu)作品,喜歡告訴讀者作者是在用什么手法虛構(gòu)作品凯肋,更喜歡交代作者創(chuàng)作小說的一切相關(guān)過程谊惭。(摘自百度百科)”。
比如英國作家伊恩·麥克尤恩的作品《贖罪》侮东。這本書講述的是妹妹布里奧妮幼時因為愛上了姐姐塞西莉婭的男友羅比卻被他拒絕圈盔,因報復(fù)心理作祟而陷害他入獄,長大成人之后為了彌補(bǔ)心中的愧疚而應(yīng)征入伍來贖罪的故事悄雅。在本書中习贫,主人公布里奧妮即是“主人公”洪囤,也是本書的“作者”。它著重于描述布里奧妮是如何寫這本的書的。這就是“關(guān)心作者是怎么寫這本小說”的小說氯葬。
在了解了元(meta)的含義之后,我們來看元數(shù)據(jù)相速。
元數(shù)據(jù)(meta data)——“data about data” 關(guān)于數(shù)據(jù)的數(shù)據(jù)秩彤,一般是結(jié)構(gòu)化數(shù)據(jù)(如存儲在數(shù)據(jù)庫里的數(shù)據(jù),規(guī)定了字段的長度览徒、類型等)狈定。
元數(shù)據(jù)是指從信息資源中抽取出來的用于說明其特征、內(nèi)容的結(jié)構(gòu)化的數(shù)據(jù)(如題名,版本习蓬、出版數(shù)據(jù)掸冤、相關(guān)說明,包括檢索點等)厘托,用于組織、描述稿湿、檢索铅匹、保存、管理信息和知識資源饺藤。
比如包斑,關(guān)于一本書(信息資源),我們在圖書館系統(tǒng)中檢索可以得到如下信息
<img src="https://pic3.zhimg.com/50/6f84d491a46fdb915a9439f427706722_hd.jpg" data-rawwidth="742" data-rawheight="515" class="origin_image zh-lightbox-thumb" width="742" data-original="https://pic3.zhimg.com/6f84d491a46fdb915a9439f427706722_r.jpg">
一個基本的元數(shù)據(jù)由元數(shù)據(jù)項目和元數(shù)據(jù)內(nèi)容的構(gòu)成涕俗。這里罗丰,“題名”就是它的元數(shù)據(jù)項目,“史蒂夫·喬布斯傳 (美) 沃爾特·艾薩克森著 = Steve Jobs Walter Isaacson eng”就是元數(shù)據(jù)內(nèi)容再姑。再比如萌抵,“著者”、“出版者”都是元數(shù)據(jù)項目元镀,而“艾薩克森 (Isaacson, Walter) 著”和“中信出版社”就是元數(shù)據(jù)內(nèi)容绍填。學(xué)過數(shù)據(jù)庫的應(yīng)該不難理解~
利用元數(shù)據(jù)來描述資源后,我們就可以用來做很多的事情栖疑。比如確定資源讨永,為資源提供檢索點,在不同系統(tǒng)之間進(jìn)行數(shù)據(jù)交換遇革。
可是卿闹,我們每個人都可以對資源進(jìn)行描述,取的名字(元數(shù)據(jù)項目)和值的樣子(元數(shù)據(jù)內(nèi)容)會千奇百怪怎么辦呢萝快?
因此锻霎,就有了元數(shù)據(jù)標(biāo)準(zhǔn)。
元數(shù)據(jù)標(biāo)準(zhǔn)包括元數(shù)據(jù)結(jié)構(gòu)標(biāo)準(zhǔn)(即元數(shù)據(jù)包含那些項目揪漩,都柏林核心集量窘,MARC元素集)、元數(shù)據(jù)內(nèi)容標(biāo)準(zhǔn)氢拥、元數(shù)據(jù)取值標(biāo)準(zhǔn)蚌铜、元數(shù)據(jù)編碼標(biāo)準(zhǔn)(用于機(jī)讀記錄的存儲和交換,比如MARC(Machine Readable Cataloging), XML)
在這里我們詳細(xì)看一下MARC格式(一種元數(shù)據(jù)標(biāo)準(zhǔn))嫩海。
在傳統(tǒng)的圖書館中冬殃,我們購買了很多的書。圖書館員們怎么能知道自己有什么書了呢叁怪?我們就需要把每本圖書的信息审葬,寫在一張小卡片上(有些老圖書館還有),存放在自己的圖書館里。
但是隨著計算機(jī)的發(fā)展涣觉,我們認(rèn)為把書目的信息存到電腦里是更好的方法痴荐。又隨著網(wǎng)絡(luò)的發(fā)展,我們覺得應(yīng)該來一個圖書館大聯(lián)合官册,把所有的圖書信息都一起存起來生兆。但是每個圖書館都有自己的一套記錄方法。因此膝宁,MARC格式就應(yīng)運(yùn)而生了鸦难。MARC就是在計算機(jī)出現(xiàn)后為系統(tǒng)間交換書目數(shù)據(jù)和相關(guān)信息而設(shè)計的。
當(dāng)然啦员淫,在傳統(tǒng)圖書館的手工編目時期合蔽,使用的術(shù)語與現(xiàn)在的計算機(jī)編目不同。比如那時候我們把一本書的“元數(shù)據(jù)”寫在一張張卡片上介返,稱之為“款目(entry)”拴事,而在計算機(jī)里,關(guān)于一本書的記錄圣蝎,就叫做“記錄(record)”刃宵。在機(jī)讀編目中,我們把要著錄的項目(著錄項目area)叫作“字段(field)捅彻,還有等等的區(qū)別。
說了這么多鞍陨,MARC格式是什么樣的呢步淹?
可以看一下中國使用的CN-MARC格式。(CNMARC是我國參照UNIMARC(國際圖聯(lián)制定UNIMARC規(guī)范各國的MARC格式)編寫的中國MARC格式诚撵。)
<img src="https://pic3.zhimg.com/50/73484f8a7688ee8998bc3bb99b091d2a_hd.jpg" data-rawwidth="402" data-rawheight="1021" class="content_image" width="402">
它規(guī)定了關(guān)于文獻(xiàn)資源應(yīng)該如何記錄缭裆。比如說在數(shù)據(jù)字段區(qū),它對于101字段是這么規(guī)定的:
101 0 $a正文語種$b中間語種$c原作語種
那么我們就要編目成:
101 1 $achi $ceng? (chi是中文寿烟,eng是英文)
再比如它規(guī)定210字段的編目形式如下:
210 $a出版澈驼、發(fā)行地$c出版、發(fā)行者名稱$d出版筛武、發(fā)行日期
根據(jù)這個要求我們就要寫成
210 $a北京 $c機(jī)械工業(yè)出版社 $d2003
接下來缝其,互聯(lián)網(wǎng)發(fā)展的越來越快,元數(shù)據(jù)的格式越來越多徘六,人們對它的互操作要求也越來越高内边,就出現(xiàn)了XML!
在利用XML描述一個文檔的時候待锈,我們可以自己定義標(biāo)簽漠其,如””。這些小標(biāo)簽都是元數(shù)據(jù)。
在網(wǎng)絡(luò)時代和屎,XML作為元數(shù)據(jù)的一種表現(xiàn)形式是非常有潛力的拴驮。
最后我們在來看一下XML的好朋友HTML。
HTML的head里有一個meta標(biāo)簽柴信。那么它是什么呢套啤?
根據(jù)上面的解釋,我們應(yīng)該知道它是“關(guān)于文檔的信息”了
meta的屬性有兩種颠印,name和http-equiv.
name屬性用來描述網(wǎng)頁的內(nèi)容纲岭,以便搜索引擎查找。比如這個網(wǎng)頁的keywords呀线罕。
http-equiv屬性指示服務(wù)器在發(fā)送實際的文檔之前先在要傳送給瀏覽器的 MIME 文檔頭部包含名稱/值對止潮。
比如
用以說明主頁制作所使用的文字以及語言
如果有哪里不對請務(wù)必告之!