2018.01.21.一周機器學習周記

時間:2018.01.21.一周


主要內容


1.整理前期關于決策樹的一個小型實踐項目文檔(實踐進行中)

2.搭建TensorFlow環(huán)境(進行中)

3.拓展:實踐Python的自動化模塊pyautogui模塊

4.后期承得前會長吳師兄的參考文檔,開始對騰訊算法大賽進行項目研究



內容摘要及相關概況


決策樹實踐項目

詳見項目文檔


搭建TensorFlow環(huán)境

1.通過pip安裝TensorFlow基本包

2.在cmd處import tensorflow

3.根據提示狮惜,在官網下載對應的CUDA版本缅叠,下載完成后進行安裝(安裝之前先卸載本地的舊版本)

4.下載cuDNN對應的壓縮包


pyautogui模塊

本周實踐了一系列pyautogui模塊的函數柔袁,這里主要摘要一個實踐:


功能

實時給出鼠標當前位置的x鞠绰、y坐標厢洞,也給出這個像素的RGB顏色


代碼



騰訊算法大賽

參考于前會長吳師兄的文檔

本周進度

由賽題屬于廣告學范疇绳锅,一開始通過對?轉化率預估此篇文章的閱讀西饵,對相關概念有所理解

隨后,閱讀理解了?騰訊算法大賽以及 FAQ 部分


賽題要求

官方提供17-30天移動 APP 的廣告鳞芙、用戶的轉化情況眷柔,及相關上下文, 根據這些數據預測第31天指定用戶和對應廣告的轉化率.


評估方式 (賽題中提供的計算公式)

通過Logarithmic Loss評估(越小越好),公式如下:

其中原朝,

N是測試樣本總數驯嘱,

yi是二值變量,取值0或1喳坠,表示第i個樣本的label鞠评,

pi為模型預測第i個樣本 label為1的概率。


示例代碼(Python語言實現):



項目目的

主要在于剖析和學習大賽中取得 第64 名大牛的分享壕鹉, 對其代碼進行理解和分析剃幌, 主要著重點在于特征工程。


機器學習的主要流程


機器學習流程


數據分析和清洗方法



關于數據分析御板,閱讀FAQ可知:

App 的激活定義為用戶下載后啟動了該App锥忿,即發(fā)生激活行為。從用戶點擊廣告到廣告系統(tǒng)得知用戶激活了App(如果有)怠肋,通常會有較長的時間間隔敬鬓,主要由以下兩方面原因導致:

1) 用戶可能在下載之后過了很久才啟動App;

2) 用戶啟動App的行為需要廣告主上報回傳給廣告系統(tǒng)笙各,通常會有一定的延時钉答。

這里回流時間表示了廣告主把App激活數據上報給廣告系統(tǒng)的時間,回流時間超過5天的數據會被系統(tǒng)忽略杈抢。

值得注意的是数尿,本次競賽的訓練數據提供的截止第31天0點的廣告日志,因此惶楼,對于最后幾天的訓練數據右蹦,某些label=0并不夠準確,可能廣告系統(tǒng)會在第31天之后得知label實際上為1歼捐。

某些app和用戶的記錄比較少

最后幾天有部分數據不準確

對于這個問題, 這里采用了比較暴力的方法, 將最后幾天這些可能會出現問題的數據刪除

?著作權歸作者所有,轉載或內容合作請聯系作者
  • 序言:七十年代末何陆,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子豹储,更是在濱河造成了極大的恐慌贷盲,老刑警劉巖,帶你破解...
    沈念sama閱讀 222,464評論 6 517
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件剥扣,死亡現場離奇詭異巩剖,居然都是意外死亡铝穷,警方通過查閱死者的電腦和手機,發(fā)現死者居然都...
    沈念sama閱讀 95,033評論 3 399
  • 文/潘曉璐 我一進店門佳魔,熙熙樓的掌柜王于貴愁眉苦臉地迎上來曙聂,“玉大人,你說我怎么就攤上這事吃引〕锪辏” “怎么了?”我有些...
    開封第一講書人閱讀 169,078評論 0 362
  • 文/不壞的土叔 我叫張陵镊尺,是天一觀的道長朦佩。 經常有香客問我,道長庐氮,這世上最難降的妖魔是什么语稠? 我笑而不...
    開封第一講書人閱讀 59,979評論 1 299
  • 正文 為了忘掉前任,我火速辦了婚禮弄砍,結果婚禮上仙畦,老公的妹妹穿的比我還像新娘。我一直安慰自己音婶,他們只是感情好慨畸,可當我...
    茶點故事閱讀 69,001評論 6 398
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著衣式,像睡著了一般寸士。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上碴卧,一...
    開封第一講書人閱讀 52,584評論 1 312
  • 那天弱卡,我揣著相機與錄音,去河邊找鬼住册。 笑死婶博,一個胖子當著我的面吹牛,可吹牛的內容都是我干的荧飞。 我是一名探鬼主播凡人,決...
    沈念sama閱讀 41,085評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼叹阔!你這毒婦竟也來了划栓?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 40,023評論 0 277
  • 序言:老撾萬榮一對情侶失蹤条获,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后蒋歌,有當地人在樹林里發(fā)現了一具尸體帅掘,經...
    沈念sama閱讀 46,555評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡委煤,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 38,626評論 3 342
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現自己被綠了修档。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片碧绞。...
    茶點故事閱讀 40,769評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖吱窝,靈堂內的尸體忽然破棺而出讥邻,到底是詐尸還是另有隱情,我是刑警寧澤院峡,帶...
    沈念sama閱讀 36,439評論 5 351
  • 正文 年R本政府宣布兴使,位于F島的核電站,受9級特大地震影響照激,放射性物質發(fā)生泄漏发魄。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 42,115評論 3 335
  • 文/蒙蒙 一俩垃、第九天 我趴在偏房一處隱蔽的房頂上張望励幼。 院中可真熱鬧,春花似錦口柳、人聲如沸苹粟。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,601評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽嵌削。三九已至,卻和暖如春辣卒,著一層夾襖步出監(jiān)牢的瞬間掷贾,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,702評論 1 274
  • 我被黑心中介騙來泰國打工荣茫, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留想帅,地道東北人。 一個月前我還...
    沈念sama閱讀 49,191評論 3 378
  • 正文 我出身青樓啡莉,卻偏偏與公主長得像港准,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子咧欣,可洞房花燭夜當晚...
    茶點故事閱讀 45,781評論 2 361

推薦閱讀更多精彩內容

  • Android 自定義View的各種姿勢1 Activity的顯示之ViewRootImpl詳解 Activity...
    passiontim閱讀 172,318評論 25 707
  • Spring Cloud為開發(fā)人員提供了快速構建分布式系統(tǒng)中一些常見模式的工具(例如配置管理浅缸,服務發(fā)現,斷路器魄咕,智...
    卡卡羅2017閱讀 134,714評論 18 139
  • 一句開火激怒了華夏兒女衩椒, 一面國旗揚起了愛國之風!
    微微一笑_lxpp閱讀 180評論 0 0
  • 越來越發(fā)現,生活就是吃喝拉撒睡毛萌,一地雞毛苟弛。 妹妹家里的一歲寶貝千金高燒三十九度,咳嗽阁将、流涕膏秫、不吃東西,看寶貝的是姥...
    百媚閱讀 249評論 0 0
  • 修習《醫(yī)道》的心得體會 講述/彭省忠醫(yī)師 整理/李錦標 我們做治療亭敢,首要先給他回神,神回來了腊尚,能量才能回來吨拗,能量回...
    慶兒閱讀 1,179評論 0 1