易企秀工程師

IP屬地：臺灣

針對結巴分詞Memory Error的兩種解決方式
針對結巴分詞Memory Error的兩種解決方式一、背景 ? 最近窖张，在使用Gensim Word2vec根據(jù)特定語料訓練近義詞模型诈胜，模型...

801 0 1
SparkML預測PV
背景公司需要根據(jù)過去一段時間內(nèi)每天網(wǎng)站的流量數(shù)據(jù)豹障，預測未來一段時間每日流量，這樣焦匈，在流量高峰到來前血公，可以提前警示相關的運營、運維提前準備缓熟。這...

0.1 285 0 2

短文本分類概述
一累魔、行業(yè)現(xiàn)狀 ? 隨著信息技術的發(fā)展，最稀缺的資源不再是信息本身够滑，而是對信息的處理能力垦写。且絕大多數(shù)信息表現(xiàn)為文本形式，如何在如此大量且復雜的...

1943 0 2
記錄Redis事故影響API性能-下篇
背景線上服務報大量的Redis彰触，相關依賴這個服務的其他產(chǎn)品線服務也報出同樣的日志梯投。截圖線上日志為什么要寫這篇文章在我的上篇文章中《記錄...

392 0 1
記錄Redis事故影響API性能-上篇
背景線上服務報大量的Redis，相關依賴這個服務的其他產(chǎn)品線服務也報出同樣的日志况毅。截圖線上日志image 解決方法：沒有上線/相關請求的服...

0.1 242 0 3
數(shù)據(jù)采集系統(tǒng)的優(yōu)化實戰(zhàn)
1 概述在歷時2個月的不斷優(yōu)化過程中分蓖，將數(shù)據(jù)采集系統(tǒng)的處理能力(kafka一個topic)從2.5萬提升到了10萬，基本符合對下一次峰值的要求...

718 0 2
Spark OLAP高階分析函數(shù)總結
我們經(jīng)常困惑在數(shù)據(jù)挖掘和報表分析場景中sql不會寫尔许，或者因為sql太長以至于可讀性降低; 今天我為大家總結了一些Spark SQL中的高階函數(shù)么鹤，...

196 0 1

使用ES的快速實現(xiàn)內(nèi)容相似性推薦
問答系統(tǒng)：通過用戶給出的一段描述性文本，通過相似度計算查找與用戶輸入接近的問題相似推薦：用戶在瀏覽當前文章時味廊，基于內(nèi)容相似性推薦與本篇文章相似的...

1164 0 1
仿京東淘寶搜索框實戰(zhàn)
搜索是很多內(nèi)容類app必不可少的功能蒸甜，而搜索框提示則為用戶關鍵詞輸入提供了一種引導，一個友好的搜索框提示不僅能提升用戶體驗余佛，還能幫助用戶節(jié)省觸達...

359 0 0