摘要:11 月 13 日稳捆,在 2017 杭州云棲大會上鸥印,Elasticsearch 與阿里云宣布達成戰(zhàn)略合作看尼,共同研發(fā)及發(fā)布阿里云上提供托管的 Elasticsearch,為中國市場提供嶄新的用戶體驗饼暑。Elasticsearch 挺進中國市場面臨的機遇和挑戰(zhàn)如何稳析?阿里云 Elasticsearch 為中國用戶提供了哪些新服務(wù)洗做?為此弓叛,InfoQ 采訪了 Elasticsearch 的創(chuàng)始人兼首席執(zhí)行官 Shay Banon彰居。
隨著互聯(lián)網(wǎng)數(shù)據(jù)規(guī)模的爆炸式增長,如何從海量的歷史撰筷、實時數(shù)據(jù)中快速獲取有用的信息陈惰,變得越來越具有挑戰(zhàn)性。而這其中毕籽,搜索作為獲取信息最高效的途徑之一抬闯,已經(jīng)越來越受到人們的青睞。
一款優(yōu)秀的搜索引擎关筒,它連接了普通用戶和網(wǎng)站網(wǎng)頁溶握,用戶可以輕而易舉且免費地搜索到想看的網(wǎng)站和內(nèi)容,而這些網(wǎng)站的內(nèi)容被搜索引擎檢索到蒸播,通過搜索引擎技術(shù)呈現(xiàn)給用戶睡榆。
11 月 13 日,在 2017 杭州云棲大會上袍榆,Elasticsearch 與阿里云宣布達成戰(zhàn)略合作胀屿,共同研發(fā)及發(fā)布阿里云上提供托管的 Elasticsearch,為中國市場提供嶄新的用戶體驗包雀。Elasticsearch 挺進中國市場面臨的機遇和挑戰(zhàn)如何宿崭?阿里云 Elasticsearch 為中國用戶提供了哪些新服務(wù)?為此才写,InfoQ 采訪了 Elasticsearch 的創(chuàng)始人兼首席執(zhí)行官 Shay Banon葡兑。
經(jīng)過短短一個小時的交流,能明顯感覺 ?Shay Banon 有著靈敏的商業(yè)嗅覺赞草。他在搜索的領(lǐng)域深耕了 18 年讹堤,差不多 8 年前創(chuàng)立了 Elasticsearch,他說房资,創(chuàng)業(yè)最重要的是找到自己擅長的地方蜕劝,并且保持激情和熱愛,創(chuàng)業(yè)轰异,意味著你要尋找生活中的問題岖沛,然后用創(chuàng)造性思維去解決它們。
Elasticsearch 源于一個食譜的應(yīng)用
在談及當(dāng)年接觸 Lucene 并開發(fā) Elasticsearch 的初衷的時候搭独, Shay Banon 認(rèn)為自己參與 Lucene 完全是一種偶然婴削,當(dāng)年他還是一個待業(yè)工程師,跟隨自己的新婚妻子來到倫敦牙肝,妻子想在倫敦學(xué)習(xí)做一名廚師唉俗,而自己則想為妻子開發(fā)一個方便搜索菜譜的應(yīng)用嗤朴,所以才接觸到 Lucene。直接使用 Lucene 構(gòu)建搜索有很多問題虫溜,包含大量重復(fù)性的工作雹姊,所以 Shay Banon 便在 Lucene 的基礎(chǔ)上不斷地進行抽象,讓 Java 程序嵌入搜索變得更容易衡楞,經(jīng)過一段時間的打磨便誕生了他的第一個開源作品“Compass”吱雏,中文即“指南針”的意思。之后瘾境,他找到了一份面對高性能分布式開發(fā)環(huán)境的新工作歧杏,在工作中他漸漸發(fā)現(xiàn)越來越需要一個易用的、高性能迷守、實時犬绒、分布式搜索服務(wù),于是決定重寫 Compass兑凿,將它從一個庫打造成了一個獨立的 server凯力,并創(chuàng)建了開源項目。
第一個公開版本出現(xiàn)在 2010 年 2 月急膀,在那之后 Elasticsearch 已經(jīng)成為 Github 上最受歡迎的項目之一沮协。
Elasticsearch 的成功源自開源
經(jīng)過八年,Elasticsearch 在中國也頗受廣大工程師歡迎卓嫂, Shay Banon 說 Elasticsearch 成功的關(guān)鍵因素就是開源還有除了搜索之外的不同用例慷暂,如 日志管理、安全和分析晨雳。
他認(rèn)為行瑞,開放源代碼搜索引擎為人們學(xué)習(xí)、研究并掌握搜索技術(shù)提供了極好的途徑與素材餐禁,推動了搜索技術(shù)的普及與發(fā)展血久,使越來越多的人開始了解并推廣使用搜索技術(shù)。使用開源搜索引擎帮非,可以大大縮短構(gòu)建搜索應(yīng)用的周期氧吐,并可根據(jù)應(yīng)用需求打造個性化搜索應(yīng)用,甚至構(gòu)建符合特定需求的搜索引擎系統(tǒng)末盔。搜索引擎的開源筑舅,無論是對技術(shù)人員還是普通用戶,都是一個福音陨舱。
Shay Banon 有一個愿景翠拣,使世界上每個開發(fā)人員能夠使用搜索作為基礎(chǔ)來簡單地解決他們最復(fù)雜的用例。通過實時和大規(guī)模提供數(shù)據(jù)游盲,Elastic 的產(chǎn)品已經(jīng)下載了超過 1.5 億次累積的時間误墓,用于構(gòu)建現(xiàn)代搜索蛮粮,日志記錄,安全性谜慌,指標(biāo)和分析應(yīng)用程序然想。
技術(shù)助推力量
當(dāng)今世界,技術(shù)的日新月異加劇了市場競爭力的此消彼漲過程畦娄,企業(yè)越來越重視技術(shù)創(chuàng)新所帶來的競爭力量的增強以及由此創(chuàng)造的短期和長期市場利益又沾,逐步形成以技術(shù)創(chuàng)新為核心的發(fā)展戰(zhàn)略弊仪。企業(yè)之間的競爭熙卡,不僅僅是規(guī)模上的競爭,更重要的是企業(yè)間的技術(shù)創(chuàng)新實力的較量励饵。
馬云在云棲大會上演講時驳癌,談到技術(shù)對于未來的重要性,“在未來面前我們都是孩子役听,未來沒有專家”颓鲜,他認(rèn)為未來發(fā)展得好的公司一定是能將互聯(lián)網(wǎng)技術(shù)用得最好的公司。
任何一種新興技術(shù)典予,都必然要經(jīng)歷螺旋式上升的發(fā)展軌跡甜滨,也必須符合技術(shù)生命周期的發(fā)展規(guī)律,即從概念提出瘤袖、泡沫衣摩、破滅、冷靜捂敌、成熟艾扮、應(yīng)用興起,再到重生與再創(chuàng)新占婉。對于企業(yè)來講泡嘴,在企業(yè)方向和研發(fā)戰(zhàn)略上,一定要把握和尊重技術(shù)產(chǎn)業(yè)領(lǐng)域的發(fā)展規(guī)律逆济。
Shay Banon 介紹了 Elasticsearch 里的幾項關(guān)鍵技術(shù)處于的趨勢酌予。
Elasticsearch 和阿里云合作 大步邁進中國市場
當(dāng)談及 Elasticsearch 挺進中國市場的戰(zhàn)略時, Shay Banon 表示:“中國對我們來說是一個不斷增長的市場奖慌,過去幾年間抛虫,我們看到 Elasticsearch 的社區(qū)版圖擴展至超過 5000 多位開發(fā)人員。中國也是全球最大的市場之一升薯,差不多有 1.9 億的開發(fā)者莱褒,希望這 1.9 億開發(fā)者都能用到開源的 Elasticsearch 的產(chǎn)品,并且取得成功涎劈。今天 Elasticsearch 選擇與阿里云合作广凸,并配合 Elasticsearch 的實時處理能力阅茶、強大的 X-Pack 功能,如 security谅海,alerting 和 machine learning脸哀,共同加快中國廣大開發(fā)者生態(tài)的創(chuàng)新步伐,構(gòu)建扭吁、托管及管理更多不同的應(yīng)用撞蜂。”除此之外侥袜,Shay Banon 認(rèn)為 Elasticsearch 接下來會針對中國市場蝌诡,大力推廣其商業(yè)化產(chǎn)品 X-Pack,讓越來越多的人了解與使用枫吧。
搜索引擎的數(shù)據(jù)挖掘優(yōu)勢
大數(shù)據(jù)時代浦旱,也是信息爆炸的時代,是否擁有信息已經(jīng)不再重要九杂,重要的是如何能夠快速的找到所需信息颁湖,而搜索引擎在這方面有著天然優(yōu)勢,搜索引擎的數(shù)據(jù)挖掘?qū)a(chǎn)生更加明顯的效果例隆。
很多搜索技術(shù)的改進都離不開大數(shù)據(jù)技術(shù)甥捺。搜索引擎從本質(zhì)上看,就是一種典型的大數(shù)據(jù)應(yīng)用镀层。目前镰禾,搜索在大數(shù)據(jù)領(lǐng)域已經(jīng)跨進了一大步,人們可以實時搜索到想要的信息鹿响。
根據(jù)最新的數(shù)據(jù)庫引擎排名顯示羡微,Elasticsearch,Solr 和 Splunk 分別占據(jù)了數(shù)據(jù)庫搜索引擎的前三位
在生產(chǎn)環(huán)境記錄應(yīng)用的運行日志已經(jīng)成為慣例绸贡,但日志需要經(jīng)過處理和分析才有意義盯蝴,第三方日志管理工具的出現(xiàn)正旨在解決這個問題。當(dāng)下比較有代表性的日志管理工具有 Splunk 和 Logstash (注:Logstash 用途在于將數(shù)據(jù)插入到 Elasticsearch 和 Kibana 中可視化日志)听怕。
Shay Banon 表示在日志分析領(lǐng)域捧挺,Elasticsearch 最大的競爭對手就是 Splunk ,在商業(yè)軟件付錢與開源軟件免費之間選擇尿瞭,Elasticsearch 是全世界最受歡迎的開源解決方案闽烙,而且會以靈活性,實時能力和規(guī)模地處理大量數(shù)據(jù),所以如果你在內(nèi)地問開發(fā)者黑竞,大部分開發(fā)者傾向于 Elastic Stack捕发。
他舉例, 類似于 Netflix,F(xiàn)acebook很魂,Microsoft 以及 Linkedln 公司在日志基礎(chǔ)架構(gòu)上會選擇運行大型 Elasticsearch 集群扎酷。此外,Elastic Stack 能夠在不同范疇使用遏匆,比如欺詐檢測和特定領(lǐng)域的業(yè)務(wù)分析法挨,這將使 Elastic 不繼擴張。
機器學(xué)習(xí)賦能用戶解決復(fù)雜問題
云計算的發(fā)展幅聘,使得數(shù)據(jù)的采集凡纳、處理和分析都變得容易,大數(shù)據(jù)得以存在于各行各業(yè)各種數(shù)據(jù)體系中喊暖,人工智能因此成為了一個火爆的領(lǐng)域惫企。
而其中的機器學(xué)習(xí)就是基于搜索技術(shù)建立起來的,而搜索帶來的海量數(shù)據(jù)積累陵叽,又能夠構(gòu)建一套基于海量數(shù)據(jù)的數(shù)據(jù)統(tǒng)計分析,從而能夠為一些應(yīng)用場景下的關(guān)鍵決策帶來指導(dǎo)和支撐丛版。
Shay Banon 強調(diào)機器學(xué)習(xí)在數(shù)據(jù)搜索領(lǐng)域的重要價值:“以后不是跟數(shù)據(jù)講我們要什么巩掺,而是數(shù)據(jù)主動告訴我們這邊有什么,這就是機器學(xué)習(xí)的力量页畦。
一點小小的擔(dān)憂
搜索引擎知道我們的出行路線胖替、地理位置、工作信息豫缨、日常行為模式和交際圈子独令,它比任何保險公司或銀行都了解我們的風(fēng)險狀況,隨著可穿戴智能設(shè)備的興起好芭,它也可能比醫(yī)生更了解我們自身的身體狀況燃箭。或者說舍败,搜索引擎將變得比我們自己更了解自己招狸。
這是信息時代獨特的背景,對于效率的追求使我們不可避免的享受互聯(lián)網(wǎng)搜索引擎等服務(wù)帶給我們的信息服務(wù)邻薯,同時也不可避免的享受個人信息外泄的苦惱裙戏。搜索引擎的機器學(xué)習(xí)勢必需要越來越多的用戶信息,這與我們的隱私權(quán)存在本質(zhì)上的沖突厕诡±郯瘢或許,我們已經(jīng)意識到這一點灵嫌,但在效率面前對此無能為力壹罚。
給廣大工程師的建議:
計算機世界變化的速度是驚人的冀偶。程序員被認(rèn)為是最接近計算機世界的職業(yè),幾乎所有的科技新產(chǎn)品都得由程序員來寫代碼渔嚷。
Shay Banon 建議廣大程序員要不斷地學(xué)習(xí)新的技能进鸠,并且銘記在過往使用那些技能時得到的經(jīng)驗。有激情形病,并且熱愛這份職業(yè)客年,時刻站在終端用戶的角度去評估自己所編寫的軟件,而不是在封閉的空間里編寫代碼漠吻。
除此之外量瓜,程序員還要擅于借助工具,開發(fā)過程中選擇適合自己和項目開發(fā)所需要的工具途乃。正所謂工欲善其事, 必先利其器绍傲。
寫在最后:馬云說過的這句話,“幫助年輕人耍共,幫助弱小的人烫饼,因為小樹苗也可能成長為參天大樹。你將種子埋入這些年輕人的腦中试读,等他們成長起來杠纵,就可以改變世界」澈В”
Shay Banon很喜歡這句話比藻,幫助別人,讓別人強大倘屹,你才能更強大银亲。這才是生命的意義。
本文由北郵@愛可可-愛生活老師推薦纽匙,阿里云云棲社區(qū)組織翻譯务蝠。