Elasticsearch 創(chuàng)始人 Shay Banon:讓數(shù)據(jù)自己說話

摘要11 月 13 日稳捆,在 2017 杭州云棲大會上鸥印,Elasticsearch 與阿里云宣布達成戰(zhàn)略合作看尼,共同研發(fā)及發(fā)布阿里云上提供托管的 Elasticsearch,為中國市場提供嶄新的用戶體驗饼暑。Elasticsearch 挺進中國市場面臨的機遇和挑戰(zhàn)如何稳析?阿里云 Elasticsearch 為中國用戶提供了哪些新服務(wù)洗做?為此弓叛,InfoQ 采訪了 Elasticsearch 的創(chuàng)始人兼首席執(zhí)行官 Shay Banon彰居。

隨著互聯(lián)網(wǎng)數(shù)據(jù)規(guī)模的爆炸式增長,如何從海量的歷史撰筷、實時數(shù)據(jù)中快速獲取有用的信息陈惰,變得越來越具有挑戰(zhàn)性。而這其中毕籽,搜索作為獲取信息最高效的途徑之一抬闯,已經(jīng)越來越受到人們的青睞。

一款優(yōu)秀的搜索引擎关筒,它連接了普通用戶和網(wǎng)站網(wǎng)頁溶握,用戶可以輕而易舉且免費地搜索到想看的網(wǎng)站和內(nèi)容,而這些網(wǎng)站的內(nèi)容被搜索引擎檢索到蒸播,通過搜索引擎技術(shù)呈現(xiàn)給用戶睡榆。

11 月 13 日,在 2017 杭州云棲大會上袍榆,Elasticsearch 與阿里云宣布達成戰(zhàn)略合作胀屿,共同研發(fā)及發(fā)布阿里云上提供托管的 Elasticsearch,為中國市場提供嶄新的用戶體驗包雀。Elasticsearch 挺進中國市場面臨的機遇和挑戰(zhàn)如何宿崭?阿里云 Elasticsearch 為中國用戶提供了哪些新服務(wù)?為此才写,InfoQ 采訪了 Elasticsearch 的創(chuàng)始人兼首席執(zhí)行官 Shay Banon葡兑。

經(jīng)過短短一個小時的交流,能明顯感覺 ?Shay Banon 有著靈敏的商業(yè)嗅覺赞草。他在搜索的領(lǐng)域深耕了 18 年讹堤,差不多 8 年前創(chuàng)立了 Elasticsearch,他說房资,創(chuàng)業(yè)最重要的是找到自己擅長的地方蜕劝,并且保持激情和熱愛,創(chuàng)業(yè)轰异,意味著你要尋找生活中的問題岖沛,然后用創(chuàng)造性思維去解決它們。

Elasticsearch 源于一個食譜的應(yīng)用

在談及當(dāng)年接觸 Lucene 并開發(fā) Elasticsearch 的初衷的時候搭独, Shay Banon 認(rèn)為自己參與 Lucene 完全是一種偶然婴削,當(dāng)年他還是一個待業(yè)工程師,跟隨自己的新婚妻子來到倫敦牙肝,妻子想在倫敦學(xué)習(xí)做一名廚師唉俗,而自己則想為妻子開發(fā)一個方便搜索菜譜的應(yīng)用嗤朴,所以才接觸到 Lucene。直接使用 Lucene 構(gòu)建搜索有很多問題虫溜,包含大量重復(fù)性的工作雹姊,所以 Shay Banon 便在 Lucene 的基礎(chǔ)上不斷地進行抽象,讓 Java 程序嵌入搜索變得更容易衡楞,經(jīng)過一段時間的打磨便誕生了他的第一個開源作品“Compass”吱雏,中文即“指南針”的意思。之后瘾境,他找到了一份面對高性能分布式開發(fā)環(huán)境的新工作歧杏,在工作中他漸漸發(fā)現(xiàn)越來越需要一個易用的、高性能迷守、實時犬绒、分布式搜索服務(wù),于是決定重寫 Compass兑凿,將它從一個庫打造成了一個獨立的 server凯力,并創(chuàng)建了開源項目。

第一個公開版本出現(xiàn)在 2010 年 2 月急膀,在那之后 Elasticsearch 已經(jīng)成為 Github 上最受歡迎的項目之一沮协。

Elasticsearch 的成功源自開源

經(jīng)過八年,Elasticsearch 在中國也頗受廣大工程師歡迎卓嫂, Shay Banon 說 Elasticsearch 成功的關(guān)鍵因素就是開源還有除了搜索之外的不同用例慷暂,如 日志管理、安全和分析晨雳。

他認(rèn)為行瑞,開放源代碼搜索引擎為人們學(xué)習(xí)、研究并掌握搜索技術(shù)提供了極好的途徑與素材餐禁,推動了搜索技術(shù)的普及與發(fā)展血久,使越來越多的人開始了解并推廣使用搜索技術(shù)。使用開源搜索引擎帮非,可以大大縮短構(gòu)建搜索應(yīng)用的周期氧吐,并可根據(jù)應(yīng)用需求打造個性化搜索應(yīng)用,甚至構(gòu)建符合特定需求的搜索引擎系統(tǒng)末盔。搜索引擎的開源筑舅,無論是對技術(shù)人員還是普通用戶,都是一個福音陨舱。

Shay Banon 有一個愿景翠拣,使世界上每個開發(fā)人員能夠使用搜索作為基礎(chǔ)來簡單地解決他們最復(fù)雜的用例。通過實時和大規(guī)模提供數(shù)據(jù)游盲,Elastic 的產(chǎn)品已經(jīng)下載了超過 1.5 億次累積的時間误墓,用于構(gòu)建現(xiàn)代搜索蛮粮,日志記錄,安全性谜慌,指標(biāo)和分析應(yīng)用程序然想。

技術(shù)助推力量

當(dāng)今世界,技術(shù)的日新月異加劇了市場競爭力的此消彼漲過程畦娄,企業(yè)越來越重視技術(shù)創(chuàng)新所帶來的競爭力量的增強以及由此創(chuàng)造的短期和長期市場利益又沾,逐步形成以技術(shù)創(chuàng)新為核心的發(fā)展戰(zhàn)略弊仪。企業(yè)之間的競爭熙卡,不僅僅是規(guī)模上的競爭,更重要的是企業(yè)間的技術(shù)創(chuàng)新實力的較量励饵。

馬云在云棲大會上演講時驳癌,談到技術(shù)對于未來的重要性,“在未來面前我們都是孩子役听,未來沒有專家”颓鲜,他認(rèn)為未來發(fā)展得好的公司一定是能將互聯(lián)網(wǎng)技術(shù)用得最好的公司。

任何一種新興技術(shù)典予,都必然要經(jīng)歷螺旋式上升的發(fā)展軌跡甜滨,也必須符合技術(shù)生命周期的發(fā)展規(guī)律,即從概念提出瘤袖、泡沫衣摩、破滅、冷靜捂敌、成熟艾扮、應(yīng)用興起,再到重生與再創(chuàng)新占婉。對于企業(yè)來講泡嘴,在企業(yè)方向和研發(fā)戰(zhàn)略上,一定要把握和尊重技術(shù)產(chǎn)業(yè)領(lǐng)域的發(fā)展規(guī)律逆济。

Shay Banon 介紹了 Elasticsearch 里的幾項關(guān)鍵技術(shù)處于的趨勢酌予。

Elasticsearch 和阿里云合作 大步邁進中國市場

當(dāng)談及 Elasticsearch 挺進中國市場的戰(zhàn)略時, Shay Banon 表示:“中國對我們來說是一個不斷增長的市場奖慌,過去幾年間抛虫,我們看到 Elasticsearch 的社區(qū)版圖擴展至超過 5000 多位開發(fā)人員。中國也是全球最大的市場之一升薯,差不多有 1.9 億的開發(fā)者莱褒,希望這 1.9 億開發(fā)者都能用到開源的 Elasticsearch 的產(chǎn)品,并且取得成功涎劈。今天 Elasticsearch 選擇與阿里云合作广凸,并配合 Elasticsearch 的實時處理能力阅茶、強大的 X-Pack 功能,如 security谅海,alerting 和 machine learning脸哀,共同加快中國廣大開發(fā)者生態(tài)的創(chuàng)新步伐,構(gòu)建扭吁、托管及管理更多不同的應(yīng)用撞蜂。”除此之外侥袜,Shay Banon 認(rèn)為 Elasticsearch 接下來會針對中國市場蝌诡,大力推廣其商業(yè)化產(chǎn)品 X-Pack,讓越來越多的人了解與使用枫吧。

搜索引擎的數(shù)據(jù)挖掘優(yōu)勢

大數(shù)據(jù)時代浦旱,也是信息爆炸的時代,是否擁有信息已經(jīng)不再重要九杂,重要的是如何能夠快速的找到所需信息颁湖,而搜索引擎在這方面有著天然優(yōu)勢,搜索引擎的數(shù)據(jù)挖掘?qū)a(chǎn)生更加明顯的效果例隆。

很多搜索技術(shù)的改進都離不開大數(shù)據(jù)技術(shù)甥捺。搜索引擎從本質(zhì)上看,就是一種典型的大數(shù)據(jù)應(yīng)用镀层。目前镰禾,搜索在大數(shù)據(jù)領(lǐng)域已經(jīng)跨進了一大步,人們可以實時搜索到想要的信息鹿响。

根據(jù)最新的數(shù)據(jù)庫引擎排名顯示羡微,Elasticsearch,Solr 和 Splunk 分別占據(jù)了數(shù)據(jù)庫搜索引擎的前三位

從趨勢上來看惶我,Elasticsearch 和 Splunk 上升明顯妈倔,Elasticsearch 更是表現(xiàn)出了非常強勁的勢頭。

在生產(chǎn)環(huán)境記錄應(yīng)用的運行日志已經(jīng)成為慣例绸贡,但日志需要經(jīng)過處理和分析才有意義盯蝴,第三方日志管理工具的出現(xiàn)正旨在解決這個問題。當(dāng)下比較有代表性的日志管理工具有 Splunk 和 Logstash (注:Logstash 用途在于將數(shù)據(jù)插入到 Elasticsearch 和 Kibana 中可視化日志)听怕。

Shay Banon 表示在日志分析領(lǐng)域捧挺,Elasticsearch 最大的競爭對手就是 Splunk ,在商業(yè)軟件付錢與開源軟件免費之間選擇尿瞭,Elasticsearch 是全世界最受歡迎的開源解決方案闽烙,而且會以靈活性,實時能力和規(guī)模地處理大量數(shù)據(jù),所以如果你在內(nèi)地問開發(fā)者黑竞,大部分開發(fā)者傾向于 Elastic Stack捕发。

他舉例, 類似于 Netflix,F(xiàn)acebook很魂,Microsoft 以及 Linkedln 公司在日志基礎(chǔ)架構(gòu)上會選擇運行大型 Elasticsearch 集群扎酷。此外,Elastic Stack 能夠在不同范疇使用遏匆,比如欺詐檢測和特定領(lǐng)域的業(yè)務(wù)分析法挨,這將使 Elastic 不繼擴張。

機器學(xué)習(xí)賦能用戶解決復(fù)雜問題

云計算的發(fā)展幅聘,使得數(shù)據(jù)的采集凡纳、處理和分析都變得容易,大數(shù)據(jù)得以存在于各行各業(yè)各種數(shù)據(jù)體系中喊暖,人工智能因此成為了一個火爆的領(lǐng)域惫企。

而其中的機器學(xué)習(xí)就是基于搜索技術(shù)建立起來的,而搜索帶來的海量數(shù)據(jù)積累陵叽,又能夠構(gòu)建一套基于海量數(shù)據(jù)的數(shù)據(jù)統(tǒng)計分析,從而能夠為一些應(yīng)用場景下的關(guān)鍵決策帶來指導(dǎo)和支撐丛版。

Shay Banon 強調(diào)機器學(xué)習(xí)在數(shù)據(jù)搜索領(lǐng)域的重要價值:“以后不是跟數(shù)據(jù)講我們要什么巩掺,而是數(shù)據(jù)主動告訴我們這邊有什么,這就是機器學(xué)習(xí)的力量页畦。

一點小小的擔(dān)憂

搜索引擎知道我們的出行路線胖替、地理位置、工作信息豫缨、日常行為模式和交際圈子独令,它比任何保險公司或銀行都了解我們的風(fēng)險狀況,隨著可穿戴智能設(shè)備的興起好芭,它也可能比醫(yī)生更了解我們自身的身體狀況燃箭。或者說舍败,搜索引擎將變得比我們自己更了解自己招狸。

這是信息時代獨特的背景,對于效率的追求使我們不可避免的享受互聯(lián)網(wǎng)搜索引擎等服務(wù)帶給我們的信息服務(wù)邻薯,同時也不可避免的享受個人信息外泄的苦惱裙戏。搜索引擎的機器學(xué)習(xí)勢必需要越來越多的用戶信息,這與我們的隱私權(quán)存在本質(zhì)上的沖突厕诡±郯瘢或許,我們已經(jīng)意識到這一點灵嫌,但在效率面前對此無能為力壹罚。

給廣大工程師的建議:

計算機世界變化的速度是驚人的冀偶。程序員被認(rèn)為是最接近計算機世界的職業(yè),幾乎所有的科技新產(chǎn)品都得由程序員來寫代碼渔嚷。

Shay Banon 建議廣大程序員要不斷地學(xué)習(xí)新的技能进鸠,并且銘記在過往使用那些技能時得到的經(jīng)驗。有激情形病,并且熱愛這份職業(yè)客年,時刻站在終端用戶的角度去評估自己所編寫的軟件,而不是在封閉的空間里編寫代碼漠吻。

除此之外量瓜,程序員還要擅于借助工具,開發(fā)過程中選擇適合自己和項目開發(fā)所需要的工具途乃。正所謂工欲善其事, 必先利其器绍傲。

寫在最后:馬云說過的這句話,“幫助年輕人耍共,幫助弱小的人烫饼,因為小樹苗也可能成長為參天大樹。你將種子埋入這些年輕人的腦中试读,等他們成長起來杠纵,就可以改變世界」澈В”

Shay Banon很喜歡這句話比藻,幫助別人,讓別人強大倘屹,你才能更強大银亲。這才是生命的意義。

本文由北郵@愛可可-愛生活老師推薦纽匙,阿里云云棲社區(qū)組織翻譯务蝠。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市哄辣,隨后出現(xiàn)的幾起案子请梢,更是在濱河造成了極大的恐慌,老刑警劉巖力穗,帶你破解...
    沈念sama閱讀 218,941評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件毅弧,死亡現(xiàn)場離奇詭異,居然都是意外死亡当窗,警方通過查閱死者的電腦和手機够坐,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,397評論 3 395
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人元咙,你說我怎么就攤上這事梯影。” “怎么了庶香?”我有些...
    開封第一講書人閱讀 165,345評論 0 356
  • 文/不壞的土叔 我叫張陵甲棍,是天一觀的道長。 經(jīng)常有香客問我赶掖,道長感猛,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,851評論 1 295
  • 正文 為了忘掉前任奢赂,我火速辦了婚禮陪白,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘膳灶。我一直安慰自己咱士,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,868評論 6 392
  • 文/花漫 我一把揭開白布轧钓。 她就那樣靜靜地躺著序厉,像睡著了一般。 火紅的嫁衣襯著肌膚如雪聋迎。 梳的紋絲不亂的頭發(fā)上脂矫,一...
    開封第一講書人閱讀 51,688評論 1 305
  • 那天,我揣著相機與錄音霉晕,去河邊找鬼。 笑死捞奕,一個胖子當(dāng)著我的面吹牛牺堰,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播颅围,決...
    沈念sama閱讀 40,414評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼伟葫,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了院促?” 一聲冷哼從身側(cè)響起筏养,我...
    開封第一講書人閱讀 39,319評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎常拓,沒想到半個月后渐溶,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,775評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡弄抬,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,945評論 3 336
  • 正文 我和宋清朗相戀三年茎辐,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,096評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡拖陆,死狀恐怖弛槐,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情依啰,我是刑警寧澤乎串,帶...
    沈念sama閱讀 35,789評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站速警,受9級特大地震影響叹誉,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜坏瞄,卻給世界環(huán)境...
    茶點故事閱讀 41,437評論 3 331
  • 文/蒙蒙 一桂对、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧鸠匀,春花似錦蕉斜、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,993評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至爬范,卻和暖如春父腕,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背青瀑。 一陣腳步聲響...
    開封第一講書人閱讀 33,107評論 1 271
  • 我被黑心中介騙來泰國打工璧亮, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人斥难。 一個月前我還...
    沈念sama閱讀 48,308評論 3 372
  • 正文 我出身青樓枝嘶,卻偏偏與公主長得像,于是被迫代替她去往敵國和親哑诊。 傳聞我的和親對象是個殘疾皇子群扶,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,037評論 2 355

推薦閱讀更多精彩內(nèi)容