網(wǎng)站數(shù)據(jù)分析

參考:https://www.kuxiao.cn/course/pc-course-learning.html?cid=C59ad06e9a17eb456c650e896

一泰偿、商業(yè)理解

1署海、網(wǎng)絡(luò)數(shù)據(jù)分析的數(shù)據(jù)來源:Server保存的網(wǎng)絡(luò)日志
2聂宾、網(wǎng)絡(luò)數(shù)據(jù)分析的分類

  • 網(wǎng)站級別
    ? 對網(wǎng)站級別的數(shù)據(jù)挖掘,通常會將網(wǎng)站作為一個整體進行分析拇泣,主要任務(wù)包括:
    – 訪問網(wǎng)站的用戶識別奖磁;
    – 網(wǎng)站購買情況分析;
    – 網(wǎng)站銷售金額分析阳液;
    – 網(wǎng)站訪問的錯誤情況分析怕敬。
    ? 通常情況下,只需要根據(jù)網(wǎng)絡(luò)日志就可以進行網(wǎng)站級別的數(shù)據(jù)分析工作帘皿。
  • 頁面級別
    ? 對于頁面級別的數(shù)據(jù)挖掘东跪,還要關(guān)注各個頁面的訪問情況,主要回答如下問題:
    – 哪些網(wǎng)頁訪問量最大鹰溜;
    – 訪問者進入哪個網(wǎng)頁虽填;
    – 訪問者退出哪個網(wǎng)頁。
    ? 同樣曹动,只需要根據(jù)網(wǎng)絡(luò)日志就可以進行網(wǎng)頁級別的數(shù)據(jù)分析工作斋日。
  • 訪問級別
    ? 從訪問事件的角度進行數(shù)據(jù)分析工作,主要回答如下問題:
    – 網(wǎng)站訪問的逗留時間如何墓陈;
    – 哪些網(wǎng)站\網(wǎng)頁會在一次訪問中被依次訪問 恶守,訪問的次序如何;
    – 哪些網(wǎng)站\網(wǎng)頁的訪問容易最終導(dǎo)致購買行為發(fā)生跛蛋。
    ? 主要依賴于網(wǎng)絡(luò)日志數(shù)據(jù)熬的,結(jié)合Cookie數(shù)據(jù)效果會更好。
  • 訪問者級別
    ? 訪問者級別與訪問級別的網(wǎng)絡(luò)數(shù)據(jù)分析問題類似赊级,但它們針對的對象不同押框。主要任務(wù)包括:
    – 特定訪問者的網(wǎng)站訪問情況;
    – 識別不同的訪問是否由同一個訪問者發(fā)起理逊;
    – 對訪問者不同時間的訪問行為做進一步的分析與挖掘橡伞。
    ? 除了需要網(wǎng)絡(luò)日志數(shù)據(jù)和Cookie數(shù)據(jù)外,通常還需要網(wǎng)站注冊信息等數(shù)據(jù)晋被。

二兑徘、數(shù)據(jù)理解

三、數(shù)據(jù)準備

  • 識別訪問用戶
    根據(jù)日志識別不同的訪問(Visit)及訪問者(Visitor)羡洛,基本假設(shè):
    ? 同一訪問(Visit)
    – IP地址(IPAddress)相同
    – 瀏覽器(UserAgent)相同
    – 并且操作間隔不超過30分鐘(1800秒)
    ? 同一訪問者(Visitor)
    – Cookie相同
  • 提取用戶訪問習(xí)慣數(shù)據(jù)
    日志信息經(jīng)過整理提取出用戶訪問習(xí)慣數(shù)據(jù)
    用戶訪問習(xí)慣數(shù)據(jù)包括:
    1.用戶名(username)和訂單信息(order_no)
    2.訪問時間(visit_time)和每頁停留時間(time_per_page)
    3.訪問第1頁到第2頁之間(time_gap1)和第2頁到第3頁之間(time_gap2)的時間間隔
    4.頂級目錄信息(first_dir)
    5.訪問來源信息(Referer)
  • 合并網(wǎng)絡(luò)日志與相關(guān)數(shù)據(jù)

四挂脑、建立模型

4.1 訪問用戶購買行為預(yù)測 ——訪問級別數(shù)據(jù)分析
4.2 訪問者訪問網(wǎng)頁細分模型 ——訪問者級別數(shù)據(jù)分析
4.3 已購買產(chǎn)品特征模型
4.4?用聚類分析建立推薦模型

五、 模型應(yīng)用

使用聚類分析結(jié)果向用戶推薦產(chǎn)品

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市崭闲,隨后出現(xiàn)的幾起案子肋联,更是在濱河造成了極大的恐慌,老刑警劉巖刁俭,帶你破解...
    沈念sama閱讀 206,214評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件橄仍,死亡現(xiàn)場離奇詭異,居然都是意外死亡牍戚,警方通過查閱死者的電腦和手機侮繁,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,307評論 2 382
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來如孝,“玉大人宪哩,你說我怎么就攤上這事〉谖” “怎么了斋射?”我有些...
    開封第一講書人閱讀 152,543評論 0 341
  • 文/不壞的土叔 我叫張陵,是天一觀的道長但荤。 經(jīng)常有香客問我,道長涧至,這世上最難降的妖魔是什么腹躁? 我笑而不...
    開封第一講書人閱讀 55,221評論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮南蓬,結(jié)果婚禮上纺非,老公的妹妹穿的比我還像新娘。我一直安慰自己赘方,他們只是感情好烧颖,可當我...
    茶點故事閱讀 64,224評論 5 371
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著窄陡,像睡著了一般炕淮。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上跳夭,一...
    開封第一講書人閱讀 49,007評論 1 284
  • 那天涂圆,我揣著相機與錄音,去河邊找鬼币叹。 笑死润歉,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的颈抚。 我是一名探鬼主播踩衩,決...
    沈念sama閱讀 38,313評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了驱富?” 一聲冷哼從身側(cè)響起锚赤,我...
    開封第一講書人閱讀 36,956評論 0 259
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎萌朱,沒想到半個月后宴树,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,441評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡晶疼,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 35,925評論 2 323
  • 正文 我和宋清朗相戀三年酒贬,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片翠霍。...
    茶點故事閱讀 38,018評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡锭吨,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出寒匙,到底是詐尸還是另有隱情零如,我是刑警寧澤,帶...
    沈念sama閱讀 33,685評論 4 322
  • 正文 年R本政府宣布锄弱,位于F島的核電站考蕾,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏会宪。R本人自食惡果不足惜肖卧,卻給世界環(huán)境...
    茶點故事閱讀 39,234評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望掸鹅。 院中可真熱鬧塞帐,春花似錦、人聲如沸巍沙。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,240評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽句携。三九已至榔幸,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間矮嫉,已是汗流浹背牡辽。 一陣腳步聲響...
    開封第一講書人閱讀 31,464評論 1 261
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留敞临,地道東北人态辛。 一個月前我還...
    沈念sama閱讀 45,467評論 2 352
  • 正文 我出身青樓,卻偏偏與公主長得像挺尿,于是被迫代替她去往敵國和親奏黑。 傳聞我的和親對象是個殘疾皇子炊邦,可洞房花燭夜當晚...
    茶點故事閱讀 42,762評論 2 345

推薦閱讀更多精彩內(nèi)容