這一部分就不準(zhǔn)備用英語了众辨,因?yàn)樵谶@段時間的學(xué)習(xí)和查找過程中尉辑,發(fā)現(xiàn)關(guān)于RDF(Resource Description Framework)的中文資料較少椰苟,并且質(zhì)量也不是特別高牢贸。希望我的思考能給這相關(guān)方面的初學(xué)者帶來幫助句惯。由于自己也是初學(xué),水平有限引润,歡迎交流巩趁。
這里有最基本的語法常識痒玩,也有很多詳細(xì)介紹淳附,后面我會從中提煉出一些重要的來。
W3C教程之RDF
W3C給它的定義
RDF 是一個框架蠢古,用來描述網(wǎng)絡(luò)資源奴曙,諸如網(wǎng)頁的標(biāo)題、作者草讶、修改日期洽糟、內(nèi)容以及版權(quán)信息等。
在我看來堕战,簡單的說坤溃,RDF數(shù)據(jù)庫就是關(guān)系型數(shù)據(jù)庫的最大競爭對手。
共同點(diǎn):他們都是為了存儲數(shù)據(jù)而活
不同點(diǎn):RDF嘱丢,相較于關(guān)系型薪介,它是另一種建立和表示數(shù)據(jù)關(guān)系的一種方式。
眾所周知越驻,關(guān)系型數(shù)據(jù)庫是用表 來維系數(shù)據(jù)的整體性汁政。如一個成績單,一份財務(wù)報表缀旁。通過key來提取所需要的數(shù)據(jù)记劈。
然而,RDF則是通過URI(Uniform Resource Identifier)來聯(lián)系所有的數(shù)據(jù)元組并巍,元組就是數(shù)據(jù)的基本單位目木。通過 URI 來提取數(shù)據(jù),當(dāng)然還可以添加一些賓語或者主語來限定(取決于我們要提取的東西)懊渡。
Web上可用的每種資源 - HTML文檔刽射、圖像、視頻片段距贷、程序等 - 由一個通用資源標(biāo)志符(Uniform Resource Identifier, 簡稱"URI")進(jìn)行定位---搜狗百科
RDF主要有5種表示方式;
1.RDF/XML
例如要表示一列數(shù)據(jù):Empire Burlesque(title) Bob Dylan(artist) USA(country) Columbia(company) 10.90(price) 1985(year)---取自W3C
<rdf:Description
rdf:about="http://www.recshop.fake/cd/Empire Burlesque">
<cd:artist>Bob Dylan</cd:artist>
<cd:country>USA</cd:country>
<cd:company>Columbia</cd:company>
<cd:price>10.90</cd:price>
<cd:year>1985</cd:year>
</rdf:Description>
主體:rdf:about="http://www.recshop.fake/cd/Empire Burlesque
謂體:artist柄冲,country。忠蝗。现横。(一般是URI形式)
賓語:USA,Columbia。戒祠。骇两。
之前提到的元組就是由這三部分組成。
通常姜盈,主體和謂體是資源形式(URI)低千,賓語可以是資源,也可以如上面所示馏颂,為屬性值示血。
2.三元組(Turtle)
例如要表示之前的信息:
<http://www.recshop.fake/cd/Empire Burlesque> <cd/artist> “Bob Dylan”
這種形式更加容易理解,也是很多時候我們提取數(shù)據(jù)時的理想格式救拉,適用于Sparql查詢难审。
3.N-3元組(N-Triples)
N-Triples 的定義
格式舉例 取自wiki
<http://www.w3.org/2001/sw/RDFCore/ntriples/> <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> ?
<http://xmlns.com/foaf/0.1/Document> .
<http://www.w3.org/2001/sw/RDFCore/ntriples/> <http://purl.org/dc/terms/title> "N-Triples"@en-US .
<http://www.w3.org/2001/sw/RDFCore/ntriples/> <http://xmlns.com/foaf/0.1/maker> _:art .
<http://www.w3.org/2001/sw/RDFCore/ntriples/> <http://xmlns.com/foaf/0.1/maker> _:dave .
_:art <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> <http://xmlns.com/foaf/0.1/Person> .
_:art <http://xmlns.com/foaf/0.1/name> "Art Barstow".
_:dave <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> <http://xmlns.com/foaf/0.1/Person> .
_:dave <http://xmlns.com/foaf/0.1/name> "Dave Beckett".
對它確實(shí)沒有太多研究。
4.N-Quads
定義
簡單的說亿絮,是上一個類型的子集告喊,主要用于RDF圖的表達(dá)
5.JSON-LD
定義
基于json的一種格式
優(yōu)點(diǎn)
1.XML是用來傳輸數(shù)據(jù)的語言,用JavaScript就可以將其添加進(jìn)HTML派昧。所以利用XML可以很好地將RDF和web端連接在一起黔姜。
2.RDF利用URI來鏈接數(shù)據(jù),它的所有資源形式的主體和謂體都可以作為一個新的主體或者是謂體蒂萎。并且秆吵,視頻,圖片程序等資源都可以被檢索到岖是。對于一個query帮毁,RDF數(shù)據(jù)庫將能提供所有的相關(guān)數(shù)據(jù)而不受表單的限制。
實(shí)例
在澳大利亞昆士蘭大學(xué)的一群教授豺撑,開發(fā)了一個RDF數(shù)據(jù)庫烈疚,叫做Ontology-driven Data repository,針對表型組學(xué)的研究(phenomics)。全稱叫做PODD聪轿。
因?yàn)榭茖W(xué)家對data分析需求的特殊性爷肝,他們對數(shù)據(jù)的提取不能受限于表單的數(shù)量,所以一個全新的數(shù)據(jù)庫就這樣誕生了陆错。(本體論簡介)