FOAF文件的清洗、檢索芝雪、繪圖

# 信息系統(tǒng)前沿課--范老師授課 #第二次作業(yè)## 一减余、重新使用Markdown ##熟悉語法,了解Markdown的用法惩系,選擇在線編輯工具簡書進行編輯位岔。## 二、回顧xml蛆挫、rdf赃承、Foaf###1、xml語言xml語言與HTML語言既相識有不同悴侵,在我的理解看來HTML語言更加注重的是簡潔瞧剖、規(guī)范化的網絡設計語言,用來顯示網頁就好。xml語言我認為其復雜性是高于HTML語言的抓于,設計其的主要作用應該是著重于對于其要表現(xiàn)的內容的數(shù)據表示做粤。以后的可讀性、遷移性捉撮、更新的難度應該要低一些怕品。###2、rdf資源描述框架我覺得就是結構化的xml框架巾遭,能夠描述xml文件中的各種數(shù)據區(qū)分數(shù)據與元數(shù)據肉康。###3、Foaffoaf文件是一種 XML/RDF 詞匯表灼舍,通過URL來找朋友吼和,構建關聯(lián)數(shù)據,然后形成一種人與人之間相互聯(lián)系的社交網絡的一種小工具骑素。##三炫乓、清洗數(shù)據項目要求是清洗整理班級同學FOAF文件,使其符合RDF數(shù)據規(guī)范和關聯(lián)數(shù)據發(fā)布原則献丑,首先我根據要求找不到FOAF清洗末捣,RDF規(guī)范檢查的工具。所以我先退而求其次選擇了xml檢查工具创橄,通過DTD的w3c在線檢查工具檢查并沒有發(fā)現(xiàn)時什么問題箩做。我發(fā)現(xiàn)就文件是否正確的角度來說中英文并沒有檢測出什么不同的地方。![image.png](http://upload-images.jianshu.io/upload_images/6083033-f85c897ee5c5c963.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)那么問題來了筐摘,范老師究竟是想要我們做什么樣的數(shù)據清洗呢卒茬?我決定進一步的探索,我選擇了網上推薦的一款開源編輯軟件editix xml editor![image.png](http://upload-images.jianshu.io/upload_images/6083033-fd802430175afecc.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)安裝后咖熟,新建工程并開始使用通過檢測全部的文件我試圖發(fā)現(xiàn)全班同學的rdf是否有問題![image.png](http://upload-images.jianshu.io/upload_images/6083033-bbe201de9b25b2c2.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)結果不出所料![](http://upload-images.jianshu.io/upload_images/6083033-d6c37bb8f6b0bf36.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)那么我想這里單單從語法、從用法的角度是沒有必要清洗foaf數(shù)據的必要了柳畔,那么問題來了馍管,我們該怎么做?我先分析了同學們的foaf文件發(fā)現(xiàn)有幾點不同* 1薪韩、有的同學使用中文字符(其中中文字符在editxml中存在亂碼現(xiàn)象----懷疑應該改成拼音或者英文表達)![image.png](http://upload-images.jianshu.io/upload_images/6083033-758698dd05fa57b2.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)* 2确沸、有的同學認識的人數(shù)不同* 3、具體的在認識的人的標簽下全部的同學都有范煒762ec4260f2e1f25685e918a2f8adf9da6712be0兩個標簽但是并不是所有的都有![image.png](http://upload-images.jianshu.io/upload_images/6083033-3b9c8705e7c22777.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)標簽俘陷。去foaf網站查找后其實這本是![image.png](http://upload-images.jianshu.io/upload_images/6083033-5f11cba37f9d8293.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)針對以上的幾點不同是我們需要優(yōu)先考慮的清洗的部分罗捎。但是我發(fā)現(xiàn)還是沒有什么問題,所以我決定不要信任軟件的全部檢查拉盾,一個個查看同學的foaf文件結果:軟件真是不能相信的![image.png](http://upload-images.jianshu.io/upload_images/6083033-0c44216d521a248a.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)![image.png](http://upload-images.jianshu.io/upload_images/6083033-36f2727953fc52a2.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)有的是少了person(06號)學號尾號是17的同學少了person![image.png](http://upload-images.jianshu.io/upload_images/6083033-6b49eff6fcd7f7d9.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)尾號為18的同學刪除qq號后面數(shù)字后正常22號也是相同的問題經過長時間認真的篩查后桨菜,清洗foaf的工作圓滿的完成了。##四、將FOAF文件存入RDF TripleStore下載apache jena .zip解壓然后下載fusiki![image.png](http://upload-images.jianshu.io/upload_images/6083033-f79158402f51ca6e.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)解壓后打卡cmd![image.png](http://upload-images.jianshu.io/upload_images/6083033-0bc37e602c33dd08.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)![image.png](http://upload-images.jianshu.io/upload_images/6083033-6b284c4fe9bfd4b1.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)打開localhost:3030倒得,然后進行上傳工作泻红。![image.png](http://upload-images.jianshu.io/upload_images/6083033-2ad760024a49faf1.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)![image.png](http://upload-images.jianshu.io/upload_images/6083033-568881e0b101766f.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)然而在上傳的時候出現(xiàn)了很多的錯誤。為什么呢霞掺,出現(xiàn)編碼問題經過仔細的排查我發(fā)現(xiàn)有兩個解決途徑:1谊路、將中文全部表示為英文標識2、通過notepad++將編碼格式改變![image.png](http://upload-images.jianshu.io/upload_images/6083033-30aa7058ffdfe20c.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)但是增加這一行后沒有解決問題通過軟件更改編碼模式最后我通過更改編碼格式來解決這個額問題![image.png](http://upload-images.jianshu.io/upload_images/6083033-c10f3807fb62751c.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)都上傳成功了點擊edit![image.png](http://upload-images.jianshu.io/upload_images/6083033-dd63b4ac26cab681.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)點擊info查看信息## 五菩彬、使用SPARQL語法進行簡單查詢SPARQL是為rdf開發(fā)的一種查詢語言和數(shù)據獲取協(xié)議缠劝,反正就把它當作關系型數(shù)據庫的sql語言進行nosql數(shù)據庫的查詢。進行最簡單的3元組查詢![image.png](http://upload-images.jianshu.io/upload_images/6083033-5b0e771d65046bc4.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)調整limit可以改變查詢獲得的數(shù)量調整offset可以跳過開始的條數(shù)并且通過實驗我發(fā)現(xiàn)大小寫在sparql中都是可以的查詢個人![image.png](http://upload-images.jianshu.io/upload_images/6083033-7eb865e76853cb9a.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)![image.png](http://upload-images.jianshu.io/upload_images/6083033-fabeb25b212e5ade.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)在我看來這個data文件形成了一個大表骗灶,把所有foaf文件鏈接起來![image.png](http://upload-images.jianshu.io/upload_images/6083033-d2e70c9137e288c7.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)接下來查詢失敗![ ](http://upload-images.jianshu.io/upload_images/6083033-5c047bb54231ab5e.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)查詢名字(賓語部分)![image.png](http://upload-images.jianshu.io/upload_images/6083033-d9b3ef3aa0fd506c.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)##六惨恭、補充相關數(shù)據,建立數(shù)據關聯(lián)矿卑。這里我查詢了一下并沒有具體的做法喉恋。1、創(chuàng)建新的節(jié)點2母廷、通過D2R服務器在語義Web上發(fā)布關系數(shù)據庫的工具##七轻黑、建立可視化關系圖![image.png](http://upload-images.jianshu.io/upload_images/6083033-f88330ba175c8bb6.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)![image.png](http://upload-images.jianshu.io/upload_images/6083033-d77307d2839a3c4c.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)然而下載失敗使用另外一個軟件![image.png](http://upload-images.jianshu.io/upload_images/6083033-608f6d4bda9c0f4f.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)再次更換技術路線使用progege![image.png](http://upload-images.jianshu.io/upload_images/6083033-1e2721f7d5468b3d.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)在Protege中應該是不能編輯OWL代碼的,但可以生成或導出OWL琴昆、RDF代碼氓鄙。如果想直接編輯OWL代碼,然后在針對這種可視化的語言進行操作业舍。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末抖拦,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子舷暮,更是在濱河造成了極大的恐慌态罪,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,427評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件下面,死亡現(xiàn)場離奇詭異复颈,居然都是意外死亡,警方通過查閱死者的電腦和手機沥割,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,551評論 3 395
  • 文/潘曉璐 我一進店門耗啦,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人机杜,你說我怎么就攤上這事帜讲。” “怎么了椒拗?”我有些...
    開封第一講書人閱讀 165,747評論 0 356
  • 文/不壞的土叔 我叫張陵似将,是天一觀的道長获黔。 經常有香客問我,道長玩郊,這世上最難降的妖魔是什么肢执? 我笑而不...
    開封第一講書人閱讀 58,939評論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮译红,結果婚禮上预茄,老公的妹妹穿的比我還像新娘。我一直安慰自己侦厚,他們只是感情好耻陕,可當我...
    茶點故事閱讀 67,955評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著刨沦,像睡著了一般诗宣。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上想诅,一...
    開封第一講書人閱讀 51,737評論 1 305
  • 那天召庞,我揣著相機與錄音,去河邊找鬼来破。 笑死篮灼,一個胖子當著我的面吹牛,可吹牛的內容都是我干的徘禁。 我是一名探鬼主播诅诱,決...
    沈念sama閱讀 40,448評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼送朱!你這毒婦竟也來了娘荡?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 39,352評論 0 276
  • 序言:老撾萬榮一對情侶失蹤驶沼,失蹤者是張志新(化名)和其女友劉穎炮沐,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體回怜,經...
    沈念sama閱讀 45,834評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡央拖,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 37,992評論 3 338
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了鹉戚。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,133評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡专控,死狀恐怖抹凳,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情伦腐,我是刑警寧澤赢底,帶...
    沈念sama閱讀 35,815評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響幸冻,放射性物質發(fā)生泄漏粹庞。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,477評論 3 331
  • 文/蒙蒙 一洽损、第九天 我趴在偏房一處隱蔽的房頂上張望庞溜。 院中可真熱鬧,春花似錦碑定、人聲如沸流码。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,022評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽漫试。三九已至,卻和暖如春碘赖,著一層夾襖步出監(jiān)牢的瞬間驾荣,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,147評論 1 272
  • 我被黑心中介騙來泰國打工普泡, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留播掷,地道東北人。 一個月前我還...
    沈念sama閱讀 48,398評論 3 373
  • 正文 我出身青樓劫哼,卻偏偏與公主長得像叮趴,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子权烧,可洞房花燭夜當晚...
    茶點故事閱讀 45,077評論 2 355

推薦閱讀更多精彩內容