該學(xué)哪一門課?讓用戶評論數(shù)據(jù)告訴你趁啸!

為了保證每周找點事做(爭取每周寫一篇)强缘,我決定對我最近在學(xué)習(xí)數(shù)據(jù)分析的某在線平臺下手,研究分析下該平臺收費課程的質(zhì)量不傅。我是一個在線學(xué)習(xí)重度愛好者旅掂,哪個平臺都試過,也上了十幾門的課访娶,最大的感受就是線上課程的質(zhì)量很重要商虐,如果質(zhì)量差的話很容易半途而廢,我依稀記得在某平臺上上了一門老師講PPT的課(沒錯,就是某某大學(xué)的R語言課程)称龙,上著上著就睡著了......

那么留拾,用什么標準來衡量一門課程的好壞呢?判斷一門課程質(zhì)量好壞的方法有很多鲫尊,這一次我打算從用戶評分和評論入手痴柔。因為這次研究的對象是單一平臺,沒有涉及到其他平臺疫向,所以這次研究重點是該平臺內(nèi)課程的橫向?qū)Ρ瓤任担页霰容^受歡迎的課程和好評比較多的課程。

該平臺目前有13門收費課程搔驼,其中有10門課程可以在介紹頁面看到用戶的評論信息谈火,具體是長這個樣子的:

課程信息包括了平均打分,學(xué)習(xí)時長舌涨,技能要求

五星好評自然被放在第一頁

我先把這些評論信息全部抓取了下來糯耍,匯總成一個數(shù)據(jù)集,當(dāng)然了在抓取信息的時候遇到了不少困難囊嘉,比如這些數(shù)據(jù)是動態(tài)js生成的温技,好在最后都解決了。不過有一點值得吐槽扭粱。拿其中一門課舉例舵鳞,該課程頁面上說一共有1000多條評論,可以“view all reviews”琢蛤,但是我跑完數(shù)據(jù)發(fā)現(xiàn)總共才300多條蜓堕,然后我去頁面上又手動確認了下,的確普通用戶能看到公開評論也就三百多條博其。

評論信息

評論星級

每門課程評論打分直方圖

在這張圖表我們可以看到“android basics”和“front-end web developer”是最熱門的兩門課套才,評論數(shù)量相對其他課程比較多『氐欤“predictive analytics for business”由于是剛出的新課霜旧,所以評論人數(shù)相對較少。

星級百分比分布

第二張圖表是每個課程的每個星級所占的百分比儡率。比如某門課打一星的人數(shù)占了這門課程總?cè)藬?shù)的多少,然后我把所有的課程做了一個對比以清。整體我們可以清晰地看到儿普,大多數(shù)的人都打了五星,比重非常之高(當(dāng)然掷倔,不排除平臺本身為了證明課程的優(yōu)秀眉孩,所以篩選出了較多五星比重的課程,所以只有課程之間的比較才相對有意義)。四星三星兩星和一星比重相對遞減浪汪。根據(jù)觀察巴柿,我們可以發(fā)現(xiàn)幾個特殊值:在五星中,上過android basics這門課程的人死遭,打五星比重最高广恢,是所有課程中五星比重最高的。而predictive analytics這門課呀潭,打2星的人群所占比重相對其他課程較高钉迷,這個和這門課程評論里有蠻多反響不是很好的評論的現(xiàn)象是一致的。

評論情感分析

因為抓取下來所有課程合起來有三四千條評論钠署,我不可能每一條去看糠聪,所以我就采用了文本情感分析的方法。文本分析情感主要有字典匹配法和機器學(xué)習(xí)谐鼎,我采用了前者舰蟆,因為這些評論還是比較接近social dictionary的。具體的方法就是我先從unc下載了兩個數(shù)據(jù)集狸棍,分別是positive words(積極詞匯)和negative words(消極詞匯)集夭苗。再把現(xiàn)在有的每個評論拆成單獨的詞匯,對詞匯在positive words 和 negative words中進行匹配計數(shù)隔缀,最后計算得到每門課程評論中積極和消極詞匯所占的百分比题造。

積極情感詞匯率

我們可以看到,android basics在評論積極情感方面表現(xiàn)依舊突出猾瘸,積極情感詞匯所占的比重最高界赔,其次是machine learning,我們又看到了predictive analytics for business排在了最后牵触。

消極情感詞匯率

在消極情感方面淮悼,predictive analytics for business毫無意外的排名第一,看來差評的確有點多揽思。令人比較驚訝的是袜腥,machine learning出現(xiàn)在了第三的位置,說明這門課大家的感受有點兩集分化的趨勢钉汗。android basics的消極情感詞匯出現(xiàn)率是最低的羹令,再一次證明了大家對它的喜歡程度。

總結(jié)和展望

我通過對某平臺課程分析损痰,從評分和評論兩個方向研究了平臺上10門課程的情況福侈,發(fā)現(xiàn)android basics是表現(xiàn)最為優(yōu)異的課程,歡迎程度較高好卢未,好評率也高肪凛,而剛新上的predictive analytics for business反響則有些差強人意堰汉。

這次文本分析采用了字典匹配法,希望在未來能夠利用機器學(xué)習(xí)法更加精確的分析情感伟墙,希望接下來有機會多學(xué)習(xí)一下這方面的知識翘鸭。另外,對pandas的使用還是不夠熟練戳葵,雖然能通過搜索就乓,查閱文檔找到自己需要的操作方法,但是效率太低譬淳,后期還是要加強學(xué)習(xí)档址,特別是建立一個框架,能夠提高處理數(shù)據(jù)集的速度邻梆。最后守伸,因為這次數(shù)據(jù)集我覺得用戶主觀性比較大乘粒,而且可能有平臺本身的篩選干擾(為了更好的來表現(xiàn)課程好)反肋,不一定能夠反應(yīng)實際情況,僅作參考钉嘹。

參考文章

An introduction to text analysis with Python

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末剂娄,一起剝皮案震驚了整個濱河市蠢涝,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌阅懦,老刑警劉巖和二,帶你破解...
    沈念sama閱讀 210,914評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異耳胎,居然都是意外死亡惯吕,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 89,935評論 2 383
  • 文/潘曉璐 我一進店門怕午,熙熙樓的掌柜王于貴愁眉苦臉地迎上來废登,“玉大人,你說我怎么就攤上這事郁惜”ぞ啵” “怎么了?”我有些...
    開封第一講書人閱讀 156,531評論 0 345
  • 文/不壞的土叔 我叫張陵兆蕉,是天一觀的道長羽戒。 經(jīng)常有香客問我,道長恨樟,這世上最難降的妖魔是什么半醉? 我笑而不...
    開封第一講書人閱讀 56,309評論 1 282
  • 正文 為了忘掉前任,我火速辦了婚禮劝术,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己养晋,他們只是感情好衬吆,可當(dāng)我...
    茶點故事閱讀 65,381評論 5 384
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著绳泉,像睡著了一般逊抡。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上零酪,一...
    開封第一講書人閱讀 49,730評論 1 289
  • 那天冒嫡,我揣著相機與錄音,去河邊找鬼四苇。 笑死孝凌,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的月腋。 我是一名探鬼主播蟀架,決...
    沈念sama閱讀 38,882評論 3 404
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼榆骚!你這毒婦竟也來了片拍?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,643評論 0 266
  • 序言:老撾萬榮一對情侶失蹤妓肢,失蹤者是張志新(化名)和其女友劉穎捌省,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體碉钠,經(jīng)...
    沈念sama閱讀 44,095評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡纲缓,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,448評論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了放钦。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片色徘。...
    茶點故事閱讀 38,566評論 1 339
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖操禀,靈堂內(nèi)的尸體忽然破棺而出褂策,到底是詐尸還是另有隱情,我是刑警寧澤颓屑,帶...
    沈念sama閱讀 34,253評論 4 328
  • 正文 年R本政府宣布斤寂,位于F島的核電站,受9級特大地震影響揪惦,放射性物質(zhì)發(fā)生泄漏遍搞。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,829評論 3 312
  • 文/蒙蒙 一器腋、第九天 我趴在偏房一處隱蔽的房頂上張望溪猿。 院中可真熱鬧钩杰,春花似錦、人聲如沸诊县。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,715評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽依痊。三九已至避除,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間胸嘁,已是汗流浹背瓶摆。 一陣腳步聲響...
    開封第一講書人閱讀 31,945評論 1 264
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留性宏,地道東北人群井。 一個月前我還...
    沈念sama閱讀 46,248評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像衔沼,于是被迫代替她去往敵國和親蝌借。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,440評論 2 348

推薦閱讀更多精彩內(nèi)容