0-Answer 系列-前言

很久很久以前就說要寫博客了图谷,卻一直拖著沒有動筆票渠,結(jié)果一拖就是好幾年...囧...

不過現(xiàn)在終于決定要開始動手寫了逐哈!

然鵝...我相信光這篇文章就會前前后后斷斷續(xù)續(xù)寫好久_ ......

為什么寫博客

為什么現(xiàn)在下決心要開始好好寫博客了呢?主要是隨著項目和接觸到的技術(shù)越來越多问顷,越來越能體會作為一名程序員及時做筆記和定期寫博客的重要性昂秃。寫博客一來可以做定期的總結(jié)和歸納,二來可以記錄項目和技術(shù)以便日后復習和查詢杜窄,就如同為自己的知識和曾經(jīng)的學習建立索引肠骆。

當然也可以自己寫私人的筆記,但是公開的博客有時候?qū)ψ晕腋斜O(jiān)督作用塞耕,通過交流和討論也能更好的完善一些不足之處蚀腿,寫博客就如同將自己的知識和思路開源嘛,程序猿要懂得擁抱開源啊!

另一方面扫外,自己現(xiàn)在是越來越不喜歡微信莉钙、QQ、微博之類的社交軟件了畏浆,很多想法和思考越來越不愿意記錄在朋友圈里胆胰,所以想通過博客來記錄很多諸如生活、工作等方面的感想刻获,這可能是由于寫博客會更加嚴謹和深入一些,不至于太過于娛樂化瞎嬉。

這篇算是我的第一篇博客蝎毡,同時也是 Answer 系列的第一篇文章,接下來的幾篇文章將對 Answer 系統(tǒng)進行完整的原理和技術(shù)的介紹氧枣。

Answer 項目背景

Answer 系統(tǒng)是我本科階段的畢業(yè)設(shè)計沐兵,當時的畢設(shè)名稱為《基于領(lǐng)域?qū)嶓w的語義搜索引擎設(shè)計與實現(xiàn)》,當時開題時起名起的不是很準確便监,更準確的應該叫《基于領(lǐng)域本體的語義搜索引擎設(shè)計與實現(xiàn)》扎谎。

當然接下來的幾篇系列文章不會像論文那樣“難以閱讀”碳想,因為我寫這系列文章的初衷就是通俗易懂的介紹這個系統(tǒng),所以文章也不會糾結(jié)于系統(tǒng)的每個細節(jié)毁靶,而是抽出其中最為重要和核心的部分做介紹胧奔,而且會盡量做到言簡意賅,讓大家有一個初步認識预吆,而如果有人想做進一步的了解龙填,可以閱讀我發(fā)布在 github 上的項目源碼(見文末)。

另外當前這個版本的系統(tǒng)與其說是一款搜索引擎拐叉,不如說是一款自然語言問答系統(tǒng)岩遗,之前的版本有全文搜索知識問答兩部分。

其中全文搜索部分調(diào)用了必應的搜索 API凤瘦,但是現(xiàn)在必應的那個 API 失效了宿礁,系統(tǒng)目前只有知識問答這一部分。當然如果將知識問答這一部分內(nèi)容整合到傳統(tǒng)的全文搜索引擎中蔬芥,就可以稱之為一款所謂的語義搜索引擎了梆靖,現(xiàn)階段主流搜索引擎也是在全文搜索引擎的基礎(chǔ)上把語義問答的結(jié)果整合到最終結(jié)果上從而實現(xiàn)語義和知識搜索。

Answer 運行效果

當前系統(tǒng)運行的效果如下

  • 美人魚的導演是誰坝茎?

    美人魚的導演是誰.gif

  • 星爺是什么時候出生的涤姊?

星爺是什么時候出生的.gif
  • 周董妻子的丈夫的外祖母的女兒是誰?
周董妻子的丈夫....gif

Answer 當前版本的說明

因為一直沒有時間進行重構(gòu)嗤放,所以 Answer 當前的版本依然是我一年多以前寫的畢設(shè)版本思喊,基本沒有什么變化。

實際來說次酌,當前版本只能算是“校園水平”的系統(tǒng) Demo恨课,當前架構(gòu)也只適用于少數(shù)據(jù)量,主要用來演示和可行性探索岳服,另外其中應該還會有不少 bug(閱讀源碼請原諒那些當時寫的很粗糙的代碼)剂公。

但是從個人的角度來講,這是自己第一個需要查幾十篇論文以及其他各種資料并設(shè)計實現(xiàn)的系統(tǒng)吊宋。這個過程體會到了很多研發(fā)的樂趣纲辽,當時做這個系統(tǒng)時,查看了很多相關(guān)資料璃搜,了解了很多關(guān)于知識表達和語義分析的很有趣的理論研究拖吼,在那一段時間自己也完全沉浸在這個項目中,在學姓馕牵或公司實習上下班都在不停思考這些問題吊档,并且經(jīng)常會有一些異想天開的想法。從中體會到了很多搞科研的樂趣唾糯。

同時這個系統(tǒng)的開發(fā)過程也是一次高效率的學習過程怠硼,自己從對很多相關(guān)技術(shù)不甚了解到查閱各種資料探索不同技術(shù)實現(xiàn)方案再到設(shè)計架構(gòu)和最終實現(xiàn)鬼贱,在幾個月的時間內(nèi)學到了不少東西,并且完成了系統(tǒng)的 Demo香璃,收獲和成長還是相當大的这难,現(xiàn)在讀研期間以及以后走上工作崗位,估計就比較難有這樣既有強烈研發(fā)興趣又能高效率自我成長的開發(fā)經(jīng)歷了增显。

Answer 重構(gòu)

最后雁佳,我也會找時間對這個系統(tǒng)進行一次重構(gòu),以實現(xiàn)大數(shù)據(jù)量的搜索和問答同云。哪怕做不到對任意非結(jié)構(gòu)化文本的知識庫自動構(gòu)建和語義知識搜索糖权,至少也應該要實現(xiàn)對百度百科或維基百科這種半結(jié)構(gòu)化數(shù)據(jù)的語義知識搜索。

下一篇

IT 相關(guān)技術(shù)的學習很重要的一點就是先知整體再鉆細節(jié)(其他領(lǐng)域我覺得也應該是這樣)炸站,因為知識之間是相互關(guān)聯(lián)的星澳,并不存在一個絕對的線性學習路徑,知識更像是一張圖而不是一條線旱易。

比如閱讀一本書禁偎,在理解當前章節(jié)中的知識時,很多時候不僅僅和之前的章節(jié)知識有關(guān)阀坏,還和之后的章節(jié)知識有關(guān)如暖,甚至還和其他書有關(guān),遇到不理解的細節(jié)很正常忌堂,應該大膽往后看盒至,建立具有廣度的知識體系和了解整體的原理后再回頭看,很多細節(jié)難題就迎刃而解士修。

所以在講解系統(tǒng)的細節(jié)之前枷遂,下一篇會先對 Answer 系統(tǒng)的整體架構(gòu)、所用技術(shù)棋嘲、基本原理做一個基本介紹酒唉,這樣對系統(tǒng)就有了一個大體認識,然后再鉆入細節(jié)就會容易的多沸移。

項目源碼

Answer 服務(wù)端

Answer Web 客戶端

汪.

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末痪伦,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子雹锣,更是在濱河造成了極大的恐慌流妻,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,122評論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件笆制,死亡現(xiàn)場離奇詭異,居然都是意外死亡涣达,警方通過查閱死者的電腦和手機在辆,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,070評論 3 395
  • 文/潘曉璐 我一進店門证薇,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人匆篓,你說我怎么就攤上這事浑度。” “怎么了鸦概?”我有些...
    開封第一講書人閱讀 164,491評論 0 354
  • 文/不壞的土叔 我叫張陵箩张,是天一觀的道長。 經(jīng)常有香客問我窗市,道長先慷,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,636評論 1 293
  • 正文 為了忘掉前任咨察,我火速辦了婚禮论熙,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘摄狱。我一直安慰自己脓诡,他們只是感情好,可當我...
    茶點故事閱讀 67,676評論 6 392
  • 文/花漫 我一把揭開白布媒役。 她就那樣靜靜地躺著祝谚,像睡著了一般。 火紅的嫁衣襯著肌膚如雪酣衷。 梳的紋絲不亂的頭發(fā)上交惯,一...
    開封第一講書人閱讀 51,541評論 1 305
  • 那天,我揣著相機與錄音鸥诽,去河邊找鬼商玫。 笑死,一個胖子當著我的面吹牛牡借,可吹牛的內(nèi)容都是我干的拳昌。 我是一名探鬼主播,決...
    沈念sama閱讀 40,292評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼钠龙,長吁一口氣:“原來是場噩夢啊……” “哼炬藤!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起碴里,我...
    開封第一講書人閱讀 39,211評論 0 276
  • 序言:老撾萬榮一對情侶失蹤沈矿,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后咬腋,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體羹膳,經(jīng)...
    沈念sama閱讀 45,655評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,846評論 3 336
  • 正文 我和宋清朗相戀三年根竿,在試婚紗的時候發(fā)現(xiàn)自己被綠了陵像。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片就珠。...
    茶點故事閱讀 39,965評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖醒颖,靈堂內(nèi)的尸體忽然破棺而出妻怎,到底是詐尸還是另有隱情,我是刑警寧澤泞歉,帶...
    沈念sama閱讀 35,684評論 5 347
  • 正文 年R本政府宣布逼侦,位于F島的核電站,受9級特大地震影響腰耙,放射性物質(zhì)發(fā)生泄漏榛丢。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,295評論 3 329
  • 文/蒙蒙 一沟优、第九天 我趴在偏房一處隱蔽的房頂上張望涕滋。 院中可真熱鬧,春花似錦挠阁、人聲如沸宾肺。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,894評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽锨用。三九已至,卻和暖如春隘谣,著一層夾襖步出監(jiān)牢的瞬間增拥,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,012評論 1 269
  • 我被黑心中介騙來泰國打工寻歧, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留掌栅,地道東北人。 一個月前我還...
    沈念sama閱讀 48,126評論 3 370
  • 正文 我出身青樓码泛,卻偏偏與公主長得像猾封,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子噪珊,可洞房花燭夜當晚...
    茶點故事閱讀 44,914評論 2 355

推薦閱讀更多精彩內(nèi)容

  • Android 自定義View的各種姿勢1 Activity的顯示之ViewRootImpl詳解 Activity...
    passiontim閱讀 172,133評論 25 707
  • IO流(Input Output) IO技術(shù)主要的作用是解決設(shè)備與設(shè)備之間 的數(shù)據(jù)傳輸問題晌缘。硬盤 -> 內(nèi)存內(nèi)存的...
    奮斗的老王閱讀 4,275評論 1 48
  • 讀一本美好的書,可以讓自己的心情得到愉悅痢站,可以短暫的從煩惱中脫離磷箕,可以從自己雞飛狗跳的生活短暫的剝離,可以眺望詩和...
    妙妙的摩羯MAMA閱讀 272評論 0 0
  • 燈光柔和阵难, 此刻快樂無比岳枷, 衣裙飛揚, 在人群觸擁里醉倒, 慢慢感覺嫩舟, 生活如此豐富多彩氢烘, 跟著呼吸節(jié)奏強烈, 夜...
    夕木陽閱讀 252評論 0 0
  • 第36則:什么樣 ①大親友:你中意什么樣子的男生椎工。 ②魚大:中意有眼緣的男生饭于。 ③大親友:那具體是什么樣的男生。 ...
    我有第三只眼閱讀 231評論 0 0