元數(shù)據(jù)(轉(zhuǎn))

作者:賀易之

鏈接:https://www.zhihu.com/question/20679872/answer/65565699

來源:知乎

要理解這個問題乘盖,首先要知道“元”是什么庆揪。

元(meta)处嫌,一般被我們翻譯成“關(guān)于……的……”脏嚷。

事實上各淀,這個前綴來源于希臘文妇穴,表示“在……之后”灸姊,在某樣事情結(jié)束之后拱燃,就含有了“歸納”、“總結(jié)”的意思呢力惯?因此碗誉,元,就代表著“本原”父晶、“體系”的意思诗充。

以文學(xué)領(lǐng)域為例,后現(xiàn)代主義文學(xué)中有一種小說叫作“元小說”诱建,也就是“關(guān)于小說的小說”〉螅“傳統(tǒng)小說往往關(guān)心的是人物俺猿、事件,是作品所敘述的內(nèi)容格仲;而元小說則更關(guān)心作者本人是怎樣寫這部小說的押袍,小說中往往喜歡聲明作者是在虛構(gòu)作品,喜歡告訴讀者作者是在用什么手法虛構(gòu)作品凯肋,更喜歡交代作者創(chuàng)作小說的一切相關(guān)過程谊惭。(摘自百度百科)”。

比如英國作家伊恩·麥克尤恩的作品《贖罪》侮东。這本書講述的是妹妹布里奧妮幼時因為愛上了姐姐塞西莉婭的男友羅比卻被他拒絕圈盔,因報復(fù)心理作祟而陷害他入獄,長大成人之后為了彌補(bǔ)心中的愧疚而應(yīng)征入伍來贖罪的故事悄雅。在本書中习贫,主人公布里奧妮即是“主人公”洪囤,也是本書的“作者”。它著重于描述布里奧妮是如何寫這本的書的。這就是“關(guān)心作者是怎么寫這本小說”的小說氯葬。

在了解了元(meta)的含義之后,我們來看元數(shù)據(jù)相速。

元數(shù)據(jù)(meta data)——“data about data” 關(guān)于數(shù)據(jù)的數(shù)據(jù)秩彤,一般是結(jié)構(gòu)化數(shù)據(jù)(如存儲在數(shù)據(jù)庫里的數(shù)據(jù),規(guī)定了字段的長度览徒、類型等)狈定。

元數(shù)據(jù)是指從信息資源中抽取出來的用于說明其特征、內(nèi)容的結(jié)構(gòu)化的數(shù)據(jù)(如題名,版本习蓬、出版數(shù)據(jù)掸冤、相關(guān)說明,包括檢索點等)厘托,用于組織、描述稿湿、檢索铅匹、保存、管理信息和知識資源饺藤。

比如包斑,關(guān)于一本書(信息資源),我們在圖書館系統(tǒng)中檢索可以得到如下信息

<img src="https://pic3.zhimg.com/50/6f84d491a46fdb915a9439f427706722_hd.jpg" data-rawwidth="742" data-rawheight="515" class="origin_image zh-lightbox-thumb" width="742" data-original="https://pic3.zhimg.com/6f84d491a46fdb915a9439f427706722_r.jpg">

一個基本的元數(shù)據(jù)由元數(shù)據(jù)項目和元數(shù)據(jù)內(nèi)容的構(gòu)成涕俗。這里罗丰,“題名”就是它的元數(shù)據(jù)項目,“史蒂夫·喬布斯傳 (美) 沃爾特·艾薩克森著 = Steve Jobs Walter Isaacson eng”就是元數(shù)據(jù)內(nèi)容再姑。再比如萌抵,“著者”、“出版者”都是元數(shù)據(jù)項目元镀,而“艾薩克森 (Isaacson, Walter) 著”和“中信出版社”就是元數(shù)據(jù)內(nèi)容绍填。學(xué)過數(shù)據(jù)庫的應(yīng)該不難理解~

利用元數(shù)據(jù)來描述資源后,我們就可以用來做很多的事情栖疑。比如確定資源讨永,為資源提供檢索點,在不同系統(tǒng)之間進(jìn)行數(shù)據(jù)交換遇革。

可是卿闹,我們每個人都可以對資源進(jìn)行描述,取的名字(元數(shù)據(jù)項目)和值的樣子(元數(shù)據(jù)內(nèi)容)會千奇百怪怎么辦呢萝快?

因此锻霎,就有了元數(shù)據(jù)標(biāo)準(zhǔn)。

元數(shù)據(jù)標(biāo)準(zhǔn)包括元數(shù)據(jù)結(jié)構(gòu)標(biāo)準(zhǔn)(即元數(shù)據(jù)包含那些項目揪漩,都柏林核心集量窘,MARC元素集)、元數(shù)據(jù)內(nèi)容標(biāo)準(zhǔn)氢拥、元數(shù)據(jù)取值標(biāo)準(zhǔn)蚌铜、元數(shù)據(jù)編碼標(biāo)準(zhǔn)(用于機(jī)讀記錄的存儲和交換,比如MARC(Machine Readable Cataloging), XML)

在這里我們詳細(xì)看一下MARC格式(一種元數(shù)據(jù)標(biāo)準(zhǔn))嫩海。

在傳統(tǒng)的圖書館中冬殃,我們購買了很多的書。圖書館員們怎么能知道自己有什么書了呢叁怪?我們就需要把每本圖書的信息审葬,寫在一張小卡片上(有些老圖書館還有),存放在自己的圖書館里。

但是隨著計算機(jī)的發(fā)展涣觉,我們認(rèn)為把書目的信息存到電腦里是更好的方法痴荐。又隨著網(wǎng)絡(luò)的發(fā)展,我們覺得應(yīng)該來一個圖書館大聯(lián)合官册,把所有的圖書信息都一起存起來生兆。但是每個圖書館都有自己的一套記錄方法。因此膝宁,MARC格式就應(yīng)運(yùn)而生了鸦难。MARC就是在計算機(jī)出現(xiàn)后為系統(tǒng)間交換書目數(shù)據(jù)和相關(guān)信息而設(shè)計的。

當(dāng)然啦员淫,在傳統(tǒng)圖書館的手工編目時期合蔽,使用的術(shù)語與現(xiàn)在的計算機(jī)編目不同。比如那時候我們把一本書的“元數(shù)據(jù)”寫在一張張卡片上介返,稱之為“款目(entry)”拴事,而在計算機(jī)里,關(guān)于一本書的記錄圣蝎,就叫做“記錄(record)”刃宵。在機(jī)讀編目中,我們把要著錄的項目(著錄項目area)叫作“字段(field)捅彻,還有等等的區(qū)別。

說了這么多鞍陨,MARC格式是什么樣的呢步淹?

可以看一下中國使用的CN-MARC格式。(CNMARC是我國參照UNIMARC(國際圖聯(lián)制定UNIMARC規(guī)范各國的MARC格式)編寫的中國MARC格式诚撵。)

<img src="https://pic3.zhimg.com/50/73484f8a7688ee8998bc3bb99b091d2a_hd.jpg" data-rawwidth="402" data-rawheight="1021" class="content_image" width="402">

它規(guī)定了關(guān)于文獻(xiàn)資源應(yīng)該如何記錄缭裆。比如說在數(shù)據(jù)字段區(qū),它對于101字段是這么規(guī)定的:

101 0 $a正文語種$b中間語種$c原作語種

那么我們就要編目成:

101 1 $achi $ceng? (chi是中文寿烟,eng是英文)

再比如它規(guī)定210字段的編目形式如下:

210 $a出版澈驼、發(fā)行地$c出版、發(fā)行者名稱$d出版筛武、發(fā)行日期

根據(jù)這個要求我們就要寫成

210 $a北京 $c機(jī)械工業(yè)出版社 $d2003

接下來缝其,互聯(lián)網(wǎng)發(fā)展的越來越快,元數(shù)據(jù)的格式越來越多徘六,人們對它的互操作要求也越來越高内边,就出現(xiàn)了XML

在利用XML描述一個文檔的時候待锈,我們可以自己定義標(biāo)簽漠其,如””。這些小標(biāo)簽都是元數(shù)據(jù)。

在網(wǎng)絡(luò)時代和屎,XML作為元數(shù)據(jù)的一種表現(xiàn)形式是非常有潛力的拴驮。

最后我們在來看一下XML的好朋友HTML。

HTML的head里有一個meta標(biāo)簽柴信。那么它是什么呢套啤?

根據(jù)上面的解釋,我們應(yīng)該知道它是“關(guān)于文檔的信息”了

meta的屬性有兩種颠印,name和http-equiv.

name屬性用來描述網(wǎng)頁的內(nèi)容纲岭,以便搜索引擎查找。比如這個網(wǎng)頁的keywords呀线罕。

http-equiv屬性指示服務(wù)器在發(fā)送實際的文檔之前先在要傳送給瀏覽器的 MIME 文檔頭部包含名稱/值對止潮。

比如

用以說明主頁制作所使用的文字以及語言

如果有哪里不對請務(wù)必告之!

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末钞楼,一起剝皮案震驚了整個濱河市喇闸,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌询件,老刑警劉巖燃乍,帶你破解...
    沈念sama閱讀 218,386評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異宛琅,居然都是意外死亡刻蟹,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,142評論 3 394
  • 文/潘曉璐 我一進(jìn)店門嘿辟,熙熙樓的掌柜王于貴愁眉苦臉地迎上來舆瘪,“玉大人,你說我怎么就攤上這事红伦∮⒐牛” “怎么了?”我有些...
    開封第一講書人閱讀 164,704評論 0 353
  • 文/不壞的土叔 我叫張陵昙读,是天一觀的道長召调。 經(jīng)常有香客問我,道長蛮浑,這世上最難降的妖魔是什么唠叛? 我笑而不...
    開封第一講書人閱讀 58,702評論 1 294
  • 正文 為了忘掉前任,我火速辦了婚禮沮稚,結(jié)果婚禮上玻墅,老公的妹妹穿的比我還像新娘。我一直安慰自己壮虫,他們只是感情好澳厢,可當(dāng)我...
    茶點故事閱讀 67,716評論 6 392
  • 文/花漫 我一把揭開白布环础。 她就那樣靜靜地躺著,像睡著了一般剩拢。 火紅的嫁衣襯著肌膚如雪线得。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,573評論 1 305
  • 那天徐伐,我揣著相機(jī)與錄音贯钩,去河邊找鬼。 笑死办素,一個胖子當(dāng)著我的面吹牛角雷,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播性穿,決...
    沈念sama閱讀 40,314評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼勺三,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了需曾?” 一聲冷哼從身側(cè)響起吗坚,我...
    開封第一講書人閱讀 39,230評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎呆万,沒想到半個月后商源,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,680評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡谋减,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,873評論 3 336
  • 正文 我和宋清朗相戀三年牡彻,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片出爹。...
    茶點故事閱讀 39,991評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡庄吼,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出以政,到底是詐尸還是另有隱情霸褒,我是刑警寧澤伴找,帶...
    沈念sama閱讀 35,706評論 5 346
  • 正文 年R本政府宣布盈蛮,位于F島的核電站,受9級特大地震影響技矮,放射性物質(zhì)發(fā)生泄漏抖誉。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,329評論 3 330
  • 文/蒙蒙 一衰倦、第九天 我趴在偏房一處隱蔽的房頂上張望袒炉。 院中可真熱鬧,春花似錦樊零、人聲如沸我磁。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,910評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽夺艰。三九已至芋哭,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間郁副,已是汗流浹背减牺。 一陣腳步聲響...
    開封第一講書人閱讀 33,038評論 1 270
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留存谎,地道東北人拔疚。 一個月前我還...
    沈念sama閱讀 48,158評論 3 370
  • 正文 我出身青樓,卻偏偏與公主長得像既荚,于是被迫代替她去往敵國和親稚失。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,941評論 2 355

推薦閱讀更多精彩內(nèi)容