TIKA實驗報告

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?TIKA實驗報告

1.tika是什么

? ? ? ? Tika 是一個文本內(nèi)容檢測和解析工具贫母,主要功能包括文檔類型檢測耳胎、內(nèi)容提取、元數(shù)據(jù)提取遣臼、語言檢測性置。我覺得就是把文本內(nèi)容可以換成你想要的格式,便于人或計算機識別和讀取揍堰,比如pdf轉成word,把txt轉成json等嗅义。

2.Tika怎么安裝

1.配置java環(huán)境

先去官網(wǎng)下載安裝java jdk屏歹,安裝成功后在本地cmd中輸入java -version會有下圖類似輸出。

檢驗java

2下載Tika

下載Tika的源代碼tika-1.18-src.zip和Tika的jar包tika-app-1.18.jar之碗。

tika-1.18-src.zip
tika-app-1.18.jar

3.Tika怎么使用

在本地cmd中輸入java -jar E:\tika\tika-app-1.18.jar(你的本地taki.jar路徑)--gui蝙眶。會進入Tika的GUI界面。


Tika的GUI界面

之后把你想要解析的東西直接拖進去就行了褪那。默認顯示提取的元數(shù)據(jù)幽纷,你可以在view隨意切換成其他屬性,view中一共有6中博敬。


元數(shù)據(jù)Metadata


Formatted Tex


Plain Text


Main Content


XML


json

4.實驗過程的問題

1.用迅雷下java官網(wǎng)的java jdk會下不了友浸,會報錯,打開之后是亂碼偏窝,之后用百度云下載才成功的收恢。

報錯


亂碼


2.cmd打開tika的gui界面的時候,tika的路徑要是自己本地jar路徑祭往,不然打不開伦意。還有-gui有可能打不開,-g可能打開的快一點硼补,可以去java -jar E:\tika\tika-app-1.18.jar --help 查看相應命令驮肉。

5.實驗總結

從本次實驗中,了解了tika是什么東西和簡單的運用已骇,只是在本地打開和用tika是比較簡單的离钝,不過要用的好還是要多琢磨的。

最后編輯于
?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末疾捍,一起剝皮案震驚了整個濱河市奈辰,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌乱豆,老刑警劉巖奖恰,帶你破解...
    沈念sama閱讀 221,198評論 6 514
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異,居然都是意外死亡瑟啃,警方通過查閱死者的電腦和手機论泛,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,334評論 3 398
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來蛹屿,“玉大人屁奏,你說我怎么就攤上這事〈砀海” “怎么了坟瓢?”我有些...
    開封第一講書人閱讀 167,643評論 0 360
  • 文/不壞的土叔 我叫張陵,是天一觀的道長犹撒。 經(jīng)常有香客問我折联,道長,這世上最難降的妖魔是什么识颊? 我笑而不...
    開封第一講書人閱讀 59,495評論 1 296
  • 正文 為了忘掉前任诚镰,我火速辦了婚禮,結果婚禮上祥款,老公的妹妹穿的比我還像新娘清笨。我一直安慰自己,他們只是感情好刃跛,可當我...
    茶點故事閱讀 68,502評論 6 397
  • 文/花漫 我一把揭開白布抠艾。 她就那樣靜靜地躺著,像睡著了一般奠伪。 火紅的嫁衣襯著肌膚如雪跌帐。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,156評論 1 308
  • 那天绊率,我揣著相機與錄音谨敛,去河邊找鬼。 笑死滤否,一個胖子當著我的面吹牛脸狸,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播藐俺,決...
    沈念sama閱讀 40,743評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼炊甲,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了欲芹?” 一聲冷哼從身側響起卿啡,我...
    開封第一講書人閱讀 39,659評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎菱父,沒想到半個月后颈娜,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體剑逃,經(jīng)...
    沈念sama閱讀 46,200評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,282評論 3 340
  • 正文 我和宋清朗相戀三年官辽,在試婚紗的時候發(fā)現(xiàn)自己被綠了蛹磺。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,424評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡同仆,死狀恐怖萤捆,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情俗批,我是刑警寧澤俗或,帶...
    沈念sama閱讀 36,107評論 5 349
  • 正文 年R本政府宣布,位于F島的核電站扶镀,受9級特大地震影響蕴侣,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜臭觉,卻給世界環(huán)境...
    茶點故事閱讀 41,789評論 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望辱志。 院中可真熱鬧蝠筑,春花似錦、人聲如沸揩懒。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,264評論 0 23
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽已球。三九已至臣镣,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間智亮,已是汗流浹背忆某。 一陣腳步聲響...
    開封第一講書人閱讀 33,390評論 1 271
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留阔蛉,地道東北人弃舒。 一個月前我還...
    沈念sama閱讀 48,798評論 3 376
  • 正文 我出身青樓,卻偏偏與公主長得像状原,于是被迫代替她去往敵國和親聋呢。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 45,435評論 2 359

推薦閱讀更多精彩內(nèi)容

  • Spring Cloud為開發(fā)人員提供了快速構建分布式系統(tǒng)中一些常見模式的工具(例如配置管理颠区,服務發(fā)現(xiàn)削锰,斷路器,智...
    卡卡羅2017閱讀 134,693評論 18 139
  • 1.橫隔肌用力毕莱,將喉體放下去 2.打開腔體器贩,共振颅夺,平穩(wěn)控制氣息 3.氣泡音的上方 4.橫膈肌,下沉磨澡,控制氣息急緩碗啄,...
    魔山樂水閱讀 224評論 0 0
  • 綠松石是我國的四大名玉之一厦酬,受到很多人的喜愛胆描。但是綠松石真假難辨,常常讓石友們非常困擾仗阅。你知道嗎昌讲?其實綠松石本身就...
    五柳文玩華掌柜閱讀 692評論 0 0
  • 本來是個挺憊懶的一個人,喜歡無事發(fā)呆减噪,內(nèi)心戲狂多短绸,卻懶于表露行動,每天有很多想法感悟筹裕,可總不愿提筆紀錄醋闭。好了,終于...
    小鈴鐺的麥田閱讀 584評論 1 51
  • 聽說夢都是反著的,最好說話算話抗斤。 昨晚做了一個夢囚企,久違的你終于又出現(xiàn)了,但是夢里的你在白雪皚皚的空地看見我...
    LakeAndRiver閱讀 353評論 0 1