【Py大法系列--04】幾十行代碼讓你知道朋友圈都是什么樣的朋友

引言

在第一篇文章中【Py大法系列--01】20多行代碼生成你的微信聊天機器人中慢洋,我們通過Python第三方庫itchat實現(xiàn)了一個自動聊天的機器人,是不是覺得很有趣和很有用呢氏捞?在文章的結(jié)尾我們也提到了用itchat可以實現(xiàn)很多實用的功能,今天就結(jié)合幾大常用的Python數(shù)據(jù)分析包冒版,結(jié)合itchat的能力實現(xiàn)朋友圈的分析液茎。

從哪里做起

微信現(xiàn)在越來越融入到了我們每個人的生活,從簡單的聊天工具到衣食住行的服務辞嗡,再到傳播著豐富多彩信息的自媒體和涵蓋萬物的小程序捆等,微信儼然就是一個小的生態(tài)系統(tǒng)。而人续室,是整個微信生態(tài)的核心栋烤,每個人朋友圈就是自我小生態(tài)的核心。itchat為我們提供了獲取朋友信息的接口:

friends=itchat.get_friends(update=True)[0:]

通過debug可以看到每個friend的信息:
image

可以看到每個好友的信息還是很豐富的挺狰,從昵稱明郭、性別、到地域等她渴,好友列表按照通訊錄排列达址,第一個是用戶自己,接著是星標置頂?shù)暮糜殉煤模热玷谖业牧斜砝锱诺谝晃怀吝搿N覀兘裉焖械墓ぷ鞫紝暮糜训男畔⒆銎稹?/p>

統(tǒng)計好友性別分布

性別分布是最容易統(tǒng)計的數(shù)據(jù),通過查看我自己和幾個好友的數(shù)據(jù)苛败,得出sex和性別的對應關(guān)系為:

sex = 0: 未知sex = 1: 男生sex = 2: 女生

pyecharts 是一個用于生成 Echarts 圖表的類庫,而Echarts 是百度開源的一個數(shù)據(jù)可視化 JS 庫满葛。主要用于數(shù)據(jù)可視化径簿。利用pyecharts畫出好友性別分布:

from pyecharts import Pieboy=girl=nothing=0for i in friends[1:]:      sex =i["Sex"]      if sex==1:          boy+=1      elif sex==2:          girl+=1      else:          nothing+=1total=len(friends[1:])attr =["迷妹","迷弟" , "低調(diào)的匿名粉絲"]v1 =[boy,girl, nothing]pie = Pie("粉絲性別分布", title_pos='center')pie.add("", attr, v1, radius=[40, 75], label_text_color=None,is_label_show=True      ,is_legend_show=False)pie.show_config()pie.render("./sex_data.html")

運行結(jié)果如下:

image

沒想到我的微信上的迷妹竟然比迷弟都多了這么多,實在是吃鯨嘀韧,還希望瑾瑾不要打我篇亭。

好友地域分布

分析完好友的性別我們再來分析好友的地域分布,看看自己的好友是不是遍布天南地北:

from pyecharts import Mapimport pandas as pddef get_var(var):    variable=[]    for i in friends:        value=i[var]        variable.append(value)    return variableNickName=get_var("NickName")Sex=get_var("Sex")Province=get_var('Province')Signature=get_var('Signature')city=get_var('City')data={'NickName':NickName,'Sex':Sex,'Province':Province,'Signature':Signature,'city':city}frame=pd.DataFrame(data)result1=frame.groupby(['Province'],as_index=False).size()a1=list(result1)a2=result1.indexmap=Map("我的好友占了大半個中國俺译蒂!", "來自微信的朋友圈", title_pos="center",width=1200, height=600)map.add("", a2, a1, maptype='china', is_visualmap=True, visual_text_color='#000',visual_range=[1, 8],        is_label_show=True,        symbol="diamon",        label_pos="inside"        )map.show_config()map.render("./area_data.HTML")

最后的結(jié)果如下:

image

非常地準,作為一個飄過北谊却、上柔昼、杭的“浪里白條”,除了老家河南炎辨,我的好友基本集中在上海捕透、北京和杭州,什么時候也可以到廣深溜一波碴萧。

好友個性簽名詞云分析

微信簽名是了解一個人性格和態(tài)度的重要參考乙嘀,想看看我的朋友圈里的大神們都是走的文藝風,還是小清新破喻,還是大學霸… …話不多說虎谢,一試便知:jieba(結(jié)巴)是一個強大的分詞庫,完美支持中文分詞曹质;wordcloud是一個基于Python的詞云生成類庫,很好用嘉冒;matplotlib.pyplot是一些命令行風格函數(shù)的集合,使matplotlib以類似于MATLAB的方式工作咆繁。每個pyplot函數(shù)對一幅圖片(figure)做一些改動:比如創(chuàng)建新圖片讳推,在圖片創(chuàng)建一個新的作圖區(qū)域(plotting area),在一個作圖區(qū)域內(nèi)畫直線玩般,給圖添加標簽(label)等:

import reimport jiebaimport wordcloud as wcimport numpy as npimport PIL.Image as Imageimport matplotlib.pyplot as pltsiglist=[]for i in friends:    signature=i['Signature'].strip().replace("span","").replace("class","").replace("emoji","")    rep=re.compile("1f\d+\w*|[<>/=]")    signature=rep.sub("",signature)    siglist.append(signature)text="".join(siglist)wordlist=jieba.cut(text,cut_all=True)word_space_split=" ".join(wordlist)coloring = np.array(Image.open("./1.jpg"))  # 一張猴子圖片,試了很多照片银觅,還是這個好my_wordcloud = wc.WordCloud(background_color="white",  # 背景顏色                            mask=coloring,                            max_words=200,  # 最大詞數(shù)                            max_font_size=60,  # 字體最大值                            random_state=42,                            scale=4,  # 按照比例進行放大畫布,如設置為1.5坏为,則長和寬都是原來畫布的1.5倍究驴。                            font_path="./HYQiHei-25J.ttf",  # 字體,注意選擇合適的字體匀伏,否則可能會顯示亂碼洒忧。                            width=400, height=200  # 像素                            ).generate(word_space_split)image_colors = wc.ImageColorGenerator(coloring)# plt.imshow(my_wordcloud.recolor(color_func=image_colors))plt.imshow(my_wordcloud)plt.axis("off")  # 不顯示坐標軸plt.show()my_wordcloud.to_file('./test.jpg')

最后的結(jié)果如下:

image

對于詞云的分布也是有很多可以挖掘的信息,看起來我的朋友們比較偏向于文藝風够颠。愛自己熙侍、愛生活、有夢想、擁抱世界蛉抓。我還在右下角的角落里看到了低調(diào)的我交庆尘。

后記

微信是一個神奇的存在,它是一個國民級別的全民APP巷送,所以驶忌,微信的產(chǎn)品設計一直都是一個有趣的現(xiàn)象,從最初底部Tab的數(shù)目笑跛、每個Tab的名稱付魔、"發(fā)現(xiàn)"頁面的定制、小程序入口飞蹂、朋友圈入口到朋友圈評論等等一系列的設計細節(jié)抒抬,都是值得我們透過人性和心理去研究的。即使是被人們封神的"張小龍"晤柄,在面對結(jié)構(gòu)最為復雜的中國用戶群體的時候,他的瀟灑中依舊不免充滿無奈妖胀,從對朋友圈的置之不理就可以看出芥颈,這是一個怎么做都不會讓人滿意的功能,任何一個生態(tài)在面對巨大的用戶群體的時候赚抡,功能的增減就會變成一個難題爬坑。當然,上面一段是我抄的涂臣,太晚了盾计,沒時間寫感想,該睡覺了赁遗,相信我們已經(jīng)看到了itchat和Python的巨大生產(chǎn)力署辉,那么就關(guān)注博主的微信公眾號:“尼克毛的技術(shù)小站”,關(guān)注Py大法系列岩四,我們一起學Python吧哭尝。

Py大法系列文章

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市剖煌,隨后出現(xiàn)的幾起案子材鹦,更是在濱河造成了極大的恐慌,老刑警劉巖耕姊,帶你破解...
    沈念sama閱讀 223,002評論 6 519
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件桶唐,死亡現(xiàn)場離奇詭異,居然都是意外死亡茉兰,警方通過查閱死者的電腦和手機尤泽,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,357評論 3 400
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人安吁,你說我怎么就攤上這事醉蚁。” “怎么了鬼店?”我有些...
    開封第一講書人閱讀 169,787評論 0 365
  • 文/不壞的土叔 我叫張陵网棍,是天一觀的道長。 經(jīng)常有香客問我妇智,道長滥玷,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 60,237評論 1 300
  • 正文 為了忘掉前任巍棱,我火速辦了婚禮惑畴,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘航徙。我一直安慰自己如贷,他們只是感情好,可當我...
    茶點故事閱讀 69,237評論 6 398
  • 文/花漫 我一把揭開白布到踏。 她就那樣靜靜地躺著杠袱,像睡著了一般。 火紅的嫁衣襯著肌膚如雪窝稿。 梳的紋絲不亂的頭發(fā)上楣富,一...
    開封第一講書人閱讀 52,821評論 1 314
  • 那天,我揣著相機與錄音伴榔,去河邊找鬼纹蝴。 笑死,一個胖子當著我的面吹牛踪少,可吹牛的內(nèi)容都是我干的塘安。 我是一名探鬼主播,決...
    沈念sama閱讀 41,236評論 3 424
  • 文/蒼蘭香墨 我猛地睜開眼援奢,長吁一口氣:“原來是場噩夢啊……” “哼耙旦!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起萝究,我...
    開封第一講書人閱讀 40,196評論 0 277
  • 序言:老撾萬榮一對情侶失蹤免都,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后帆竹,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體绕娘,經(jīng)...
    沈念sama閱讀 46,716評論 1 320
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,794評論 3 343
  • 正文 我和宋清朗相戀三年栽连,在試婚紗的時候發(fā)現(xiàn)自己被綠了险领。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片侨舆。...
    茶點故事閱讀 40,928評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖绢陌,靈堂內(nèi)的尸體忽然破棺而出挨下,到底是詐尸還是另有隱情,我是刑警寧澤脐湾,帶...
    沈念sama閱讀 36,583評論 5 351
  • 正文 年R本政府宣布臭笆,位于F島的核電站,受9級特大地震影響秤掌,放射性物質(zhì)發(fā)生泄漏愁铺。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 42,264評論 3 336
  • 文/蒙蒙 一闻鉴、第九天 我趴在偏房一處隱蔽的房頂上張望茵乱。 院中可真熱鬧,春花似錦孟岛、人聲如沸瓶竭。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,755評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽斤贰。三九已至,卻和暖如春堵未,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背盏触。 一陣腳步聲響...
    開封第一講書人閱讀 33,869評論 1 274
  • 我被黑心中介騙來泰國打工渗蟹, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人赞辩。 一個月前我還...
    沈念sama閱讀 49,378評論 3 379
  • 正文 我出身青樓雌芽,卻偏偏與公主長得像,于是被迫代替她去往敵國和親辨嗽。 傳聞我的和親對象是個殘疾皇子世落,可洞房花燭夜當晚...
    茶點故事閱讀 45,937評論 2 361

推薦閱讀更多精彩內(nèi)容