本項目是第九屆服創(chuàng)大賽的A組賽題涌哲,旨在解決龐大的文檔分類問題胖缤,快速檢索所鍵入的關鍵字信息尚镰。提供安全科學合理的權(quán)限訪問機制。在我看來哪廓,本系統(tǒng)就是兩個核心點第一訪問信息快速準確狗唉,第二安全科學合理的權(quán)限管理,其他還有知識分類涡真,知識上傳分俯,下載等等。
本系統(tǒng)采取的后端的技術(本人負責后端):
一哆料、系統(tǒng)架構(gòu)
? ? SSM 三大框架缸剪。
? ? 通過Maven 構(gòu)建,github 實現(xiàn)版本管理东亦。
搜索模塊:
? ? Lucene 全文檢索 Hanlp 中文智能分詞杏节。
? ? Redis 緩存歷史查詢記錄。
知識結(jié)構(gòu)分類模塊:
? ? 提供知識結(jié)構(gòu)兩級分類典阵,知識在數(shù)據(jù)庫中保存樹的結(jié)構(gòu)奋渔。
? ? 結(jié)合Echarts 智能提取每個節(jié)點繪制知識圖譜。
? ? Mahout 三種協(xié)同過濾算法壮啊,智能推薦知識嫉鲸。
權(quán)限管理模塊:
Shiro 權(quán)限管理,用戶-角色-權(quán)限權(quán)限管理
二歹啼、功能簡介
? ? 嚴格權(quán)限管理玄渗。基于shiro的權(quán)限管理狸眼,有一個超級管理員藤树,管理員,用戶份企,管理員可以對知識進行維護也榄,如知識增刪,審批發(fā)布打印司志,知識質(zhì)量評判等甜紫。
? ? 多種格式的批量上傳下載更新以及上傳前能夠?qū)Y源進行預覽。導入導出支持zip ,txt ,pdf , docx多種格式骂远,同時導出支持手動和自動囚霸。
? ? 知識圖譜。將海量但有關系的知識激才,自動構(gòu)建知識圖譜拓型,用戶可點擊知識圖譜相關節(jié)點進行查看额嘿。
? ? 快速而精準的搜索功能。提供全文劣挫,全拼册养,首字母,關鍵詞等多種查詢功能压固,以及搜索是提供關鍵詞提示搜索按熱點知識和時間排序球拦。
? ? 知識關聯(lián)功能。對知識點同類型帐我,具有相同關鍵字的知識進行關聯(lián)展示坎炼,也能通過專家判斷進行診斷式推理關聯(lián),形成以某一知識問題為核心拦键,逐層分析推理為分支的知識關聯(lián)體系谣光。
? ? 知識審批流程功能。用戶上傳的知識或要發(fā)表的知識需要由超級管理員指定的相關專家進行審查后芬为,才能上傳到我們的KnowAll云數(shù)據(jù)庫或者進行發(fā)表萄金。
? ? 熱點知識統(tǒng)計(點擊率,點贊收藏率等)碳柱。根據(jù)用戶評分捡絮,用戶的收藏,用戶的點贊或不喜歡數(shù)量以及知識被瀏覽點擊數(shù)量莲镣,對知識進行統(tǒng)計福稳。
? ? 用戶收藏點贊評論分享。用戶可以根據(jù)自己的喜愛對知識點贊和不喜歡評分
? ? 知識分類瑞侮。按時間的圆,點擊率等對知識進行分類,并對知識分熱點和高中低多個等級
? ? 知識收藏半火。課程收藏越妈,收藏視頻,更快捷的找到并學習自己所收藏的視頻钮糖。
三梅掠,特色綜述
? ? 智能構(gòu)建知識圖譜
根據(jù)知識跟節(jié)點遍歷查找所有的子節(jié)點,結(jié)合Echarts繪制出知識圖譜
? ? 個性化知識推薦功能
基于協(xié)同過濾的推薦引擎的輸入是用戶的歷史偏好信息店归, Mahout 提供的協(xié)同過濾的推薦策略阎抒,我們選擇其中最經(jīng)典的三種,User CF, Item CF 和 Slope One
? 2.? 知識的關鍵字提取功能
我們使用的基于TextRank算法提取關鍵詞同時結(jié)合TF-IDF統(tǒng)計詞條到我們數(shù)據(jù)庫消痛。能夠為用戶提供快速精準的知識定位與推薦功能且叁。
? 3? .多文件拖拽式及文件格式檢查和預覽式上傳
支持批量上傳,上傳時用bootStrap? fileinput? 結(jié)合百度富文本UEditor? 支持多文件拖拽上傳并且支持上傳時格式檢查和預覽秩伞。
? 4.無緩沖式逞带,多格式知識在線預覽
用ffmpeg處理視音視頻文件, openoffice轉(zhuǎn)化office文檔欺矫,itextpdf、poi處理office展氓,red5-server搭建流媒體服務 用Ckplay 播放器來在線預覽各種格式穆趴。
? ? 5.企業(yè)級的統(tǒng)一知識搜索
系統(tǒng)在采用Lucene的基礎上,引入了Hanlp自然語言處理技術带饱。同時將歷史查詢結(jié)果保存在Redis 非關系型數(shù)據(jù)庫毡代。查詢速度達到百萬條/毫秒阅羹,增加詞典勺疼,增強分詞效果。
四捏鱼、問題與解決方案
? ? 知識文檔龐大执庐,歸類麻煩:該系統(tǒng)建立智能知識圖譜,海量數(shù)據(jù)查找方便导梆。文檔分類結(jié)構(gòu)清晰
? ? 如何準確和快速全文檢索:采用Hanlp 智能中文分詞建立Lucene 索引庫轨淌,搜索結(jié)構(gòu)準確,對歷史查詢結(jié)果緩存在redis中看尼,這樣解決了搜索數(shù)量大慢的問題递鹉,基本能夠滿足初級企業(yè)級搜索要求。
? ? 批量上傳:使用支持多文件上傳的插件Fileinput 后臺多線程并發(fā)處理轉(zhuǎn)換成文件流藏斩。
? ? 知識在線預覽:用ffmpeg處理視音視頻文件, openoffice轉(zhuǎn)化office文檔躏结,itextpdf、poi處理office狰域,red5-server搭建流媒體服務 用Ckplay 播放器來在線預覽各種格式媳拴。增強用戶體驗實現(xiàn)類似主流播放網(wǎng)站的強大功能。
? ? 中文錯別字識別:集成JcJc 自動識別錯別字功能兆览。
五屈溉、產(chǎn)品優(yōu)勢
六、一些項目截圖
???
下載地址:
謝謝
---------------------