1.作品
? ? ? 關(guān)于作品本身翅楼,就簡單說幾個點尉剩。
(1)排版,格式很重要
? ? ? ? 排版工作可能會有些繁瑣毅臊,但是排版工作非常重要理茎。如果這沒有做好,即使有優(yōu)秀的內(nèi)容發(fā)也很可能被刷掉管嬉。所以希望大家注意細(xì)節(jié)皂林,多點耐心。
(2)語言精煉
? ? ? ? 作品對字?jǐn)?shù)有一定的要求蚯撩,大概不超過2.5w字础倍。但這一部分有時會有變動。如我第一次參加時胎挎,校賽的2.5w突然變成了省賽的1.5w沟启。但是個人認(rèn)為不必太被字?jǐn)?shù)所限制扰楼,但是一定要盡力精簡語言與段落。
(3) 溝通
? ? ? 在完成作品的過程中美浦,多主動和老師溝通吧。老師可能不會主動來找你项栏,但是學(xué)生多主動浦辨,多問的話也是可以得到很好的幫助的。
2.數(shù)據(jù)分析
? ? ? ? 這是很有趣的一個部分沼沈,但是也非常頭疼流酬。一般來說,數(shù)據(jù)分析方法與你的問卷設(shè)置以及目的都是吻合的列另,就是說根據(jù)你的目的和分析方法去設(shè)置你問卷的形式芽腾。有以下幾點需要注意。
(1) 不必太過于追求高級的方法
? ? ? ? 高級的統(tǒng)計方法總是讓人感覺非常炫酷的页衙,但是高級的方法不一定會適合你的數(shù)據(jù)摊滔,也不一定就能得到好的結(jié)果。就像經(jīng)濟(jì)學(xué)中的供求模型店乐,簡單的模型卻解釋了十分復(fù)雜的問題艰躺。用最簡單的模型得到最真實深刻的結(jié)論才應(yīng)該是我們追求的。Anyway眨八,適合的才是最好的腺兴。
(2) 市場細(xì)分是趨勢
? ? ? 更精細(xì)準(zhǔn)確的人群分類愈來愈成為分析的重心,在優(yōu)秀作品中這成為了常態(tài)廉侧。因此我們應(yīng)用聚類页响,PCA等方法試圖將人群分類。這里想說的是如果細(xì)分是大家的目的的話段誊,應(yīng)該對問卷的形式設(shè)計進(jìn)行考量闰蚕,比如分類題向定量題的轉(zhuǎn)變啥的。當(dāng)然枕扫,分類題也是可以進(jìn)行聚類的陪腌,但是相對定量題還是比較復(fù)雜一些。
? ? ? ? 即使考慮到上述問題烟瞧,有時問卷的結(jié)果可能還是不盡人意诗鸭。我們這次分析用因子分析合并卡方檢驗對人群進(jìn)行分類并畫像,盡管人群之間行為差異還是比較明顯参滴,但是基本特征卻幾乎沒有差異强岸。這樣的結(jié)果使得實際市場中細(xì)分的難度并沒有得到改善,精準(zhǔn)營銷依然大受阻礙砾赔。導(dǎo)致我們的分析成為了真正的“紙上談兵”蝌箍。針對這種情況青灼,大家還是在問卷的設(shè)置上多下功夫吧。
(3) 大數(shù)據(jù)的應(yīng)用更加普遍
? ? ? 越來越多的作品利用大數(shù)據(jù)與網(wǎng)絡(luò)爬蟲對作品進(jìn)行補充妓盲。我對這方面并不是太熟悉杂拨,但還是把我不太成熟地想法與大家分享。
a.搜索網(wǎng)頁及網(wǎng)站信息
? ? ? ? 經(jīng)過嘗試悯衬,這一部分工作還是有些用的弹沽。當(dāng)時我們?yōu)榱伺廊√詫毜男畔ⅲ銓@方面進(jìn)行了了解筋粗。主要來說就是兩種方法:一種是利用Python策橘,這需要一些技術(shù)。經(jīng)過了解娜亿,這部分的學(xué)習(xí)也不是很難丽已,但問題在于淘寶有比較嚴(yán)格反扒機制,所以我們需要做后續(xù)的工作买决,否則我們得到數(shù)據(jù)的穩(wěn)定性會較差沛婴。考慮到這些因素以及自身能力限制策州,我們放棄了這種方法瘸味。另一種是利用相關(guān)網(wǎng)站進(jìn)行搜索。這種方法對你爬取的內(nèi)容有一定的限制够挂,但是容易上手旁仿,感覺也還可以接受吧。具體的有店透視(插件)以及八爪魚(軟件)可以使用孽糖。更多的大家可以上知乎啥的搜一搜枯冈。
b.情感與文本分析
? ? ? 這一部分大家可以利用各大指數(shù)如百度指數(shù),微博指數(shù)等進(jìn)行分析办悟。具體的分析工具大家可以自行查詢尘奏。可以使用“大數(shù)據(jù)導(dǎo)航”網(wǎng)站進(jìn)行搜索病蛉。
(4)其他
? ? ? ? 數(shù)據(jù)分析其實是個比較嚴(yán)謹(jǐn)?shù)倪^程炫加,數(shù)據(jù)分析中的邏輯是一種美感。但是在分析過程中希望大家多思考铺然,不要太死板的套用模板啥的俗孝。比如嘗試著對數(shù)據(jù)進(jìn)行變形啥的以提升與數(shù)據(jù)方法的匹配度。當(dāng)然魄健,變形這一部分應(yīng)用的不是很多赋铝,只是舉個例子。
? ? ? ? 我影響比較深刻的是關(guān)于ROC曲線沽瘦。我們通常認(rèn)為ROC曲線下面積越大越好革骨,即預(yù)測的準(zhǔn)確度越高农尖。但面對實際問題,我們對于真陽性與真陰性的期望程度有時是不一樣的良哲。因此在ROC曲線下面積可能不是非常令人滿意的時候盛卡,可以多聯(lián)系實際問題進(jìn)行思考與解釋。遇到問題也可以查查文獻(xiàn)啥的筑凫。
(5)此次相關(guān)的分析方法
? ? ? ? 本來想像之前做一個流程圖窟扑,但是有點懶得弄了。這次實際應(yīng)用到了PLS-PM模型漏健、邏輯回歸、因子分析(人群畫像)這些方法橘霎,順便也了解了一些結(jié)構(gòu)方程模型(這個應(yīng)用率很高)蔫浆。針對數(shù)據(jù)分析,參考的數(shù)目是《R語言多元統(tǒng)計與建慕闳》瓦盛,個人感覺用來快速查找一些統(tǒng)計方法還是非常不錯的。
? ? ? ? 差不多到這里結(jié)束了外潜,具體分析方法沒時間寫了原环。Anyway,有機會一起交流好了处窥。