廣告點擊率預(yù)測 [離線部分] - quweiprotoss的日志 - 網(wǎng)易博客
http://quweiprotoss.blog.163.com/blog/static/4088288320144810567471?utm_source=tuicool&utm_medium=referral
Training
已經(jīng)說了是要一天做完pCTR,那顯然自己寫就有點不現(xiàn)實了,下載一下liblinear擂送,然后就可以開始訓(xùn)練了桑寨,當(dāng)然一般點擊率都很低的孝冒,F(xiàn)eeds蜈漓,搜索廣告高一些x%鳍征,展示廣告一般就0.x%,我做的產(chǎn)品點擊率就低的沒臉提了或详。按一切從簡一切從暴的原則,正例全保留郭计,負例按正例的倍數(shù)抽吧霸琴。
Liblinear的使用腳本百事通
http://www.csdn123.com/html/mycsdn20140110/1b/1b97de7c9ef9cc44570e58d1abbf68ab.html
以下為一位網(wǎng)友采用liblinear進行數(shù)據(jù)分類的實驗性能說明“
”今天試用了以下liblinear,速度很快(快到我沒有想到)昭伸,
我的實驗數(shù)據(jù):
訓(xùn)練集:21504 * 1500(1500是樣本的數(shù)量梧乘,21504是維度)
測試集:21504 * 2985
速度用秒來衡量,20次實驗總共不到2分鐘庐杨。
Libsvm和Liblinear的使用經(jīng)驗談 - sunlylorn的專欄 - 博客頻道 - CSDN.NET
http://blog.csdn.net/sunlylorn/article/details/7885586
Libsvm和Liblinear都是國立臺灣大學(xué)的Chih-Jen Lin博士開發(fā)的选调,Libsvm主要是用來進行非線性svm 分類器的生成,提出有一段時間了灵份,而Liblinear則是去年才創(chuàng)建的仁堪,主要是應(yīng)對large-scale的data classification,因為linear分類器的訓(xùn)練比非線性分類器的訓(xùn)練計算復(fù)雜度要低很多填渠,時間也少很多弦聂,而且在large scale data上的性能和非線性的分類器性能相當(dāng)鸟辅,所以Liblinear是針對大數(shù)據(jù)而生的莺葫。
兩者都是一個跨平臺的通用工具庫匪凉,支持windows/linux/mac os,代碼本身是c++寫的,同時也有matlab捺檬,Python再层,java,c/c++擴展接口欺冀,方便不同語言環(huán)境使用树绩,可以說是科研和企業(yè)人員的首選!像我這樣在學(xué)校的一般用matlab/c++隐轩,而我同學(xué)在百度則主要用的是python/c++饺饭,所以只是各自側(cè)重不一樣,但所使用的核心還是其svm庫职车。