數(shù)據(jù)分析實戰(zhàn)--保險公司客戶分類分析

小文 | 公眾號: 小文的數(shù)據(jù)之旅

五一假期過去了,不知道大家過得怎么樣呢世剖?假期的這幾天杆怕,小文沒有選擇出去旅游(不想成為人海中的一員-。-)攒盈,而是待在家里好好地閱讀了我的新書--陳哲老師的《活用數(shù)據(jù)抵拘,驅動業(yè)務的數(shù)據(jù)分析實戰(zhàn)》,可謂收獲滿滿型豁。當然說的不是spss的使用技巧僵蛛,而是分析的思路。書里的案例用的spss迎变,小文并不會充尉,因此小文用python實現(xiàn)了一下。
這個案例來自于第六章--甲保險公司客戶分類分析衣形。文中使用了stp法進行分析驼侠,即客戶細分,目標客戶選取谆吴,目標客戶定位倒源。

1.客戶細分

客戶細分根據(jù)客戶的分類維度進行細分,分類的維度包括5類句狼,分別是自然屬性因素笋熬、社會特征因素、行為特征因素鲜锚、態(tài)度偏好因素和生活狀態(tài)與個性因素突诬。
前三者是表露在外的因素,即通過接觸就可知道的因素芜繁,屬于事前分類維度旺隙;后兩者需要通過調研才能了解,是客戶內在本質的區(qū)別骏令,屬于事后分類維度蔬捷。因此,往往通過事后分類維度做客戶分類,以保證分類的深入性周拐,再通過事前分類維度進行描述與驗證铡俐,以保證分類客戶的差異性和可接觸性。

import pandas as pd
import prince  # 對應分析
from scipy.cluster import hierarchy  # 層次聚類
from statsmodels.formula.api import ols
from statsmodels.stats.anova import anova_lm  # 方差分析
import matplotlib.pyplot as plt
from factor_analyzer import FactorAnalyzer, calculate_kmo, calculate_bartlett_sphericity  # 因子分析
%matplotlib inline

# 讀取數(shù)據(jù)
X = pd.read_csv('./Desktop/第6章保險公司客戶分類數(shù)據(jù).csv', engine='python',
                encoding='utf-8-sig')            # 注意設置encoding參數(shù)妥粟,不然中文字體會亂碼
x = X.iloc[:, -9:]
x.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 712 entries, 0 to 711
Data columns (total 9 columns):
對自己的生活很滿意        712 non-null int64
為享受而產生的浪費是必要的    712 non-null int64
買房子前要先有車         712 non-null int64
不惜金錢和時間裝修房子      712 non-null int64
買衣服都買便宜的         712 non-null int64
休息時經常進行戶外活動      712 non-null int64
嘗試生活充滿變化         712 non-null int64
喜歡獨自享受安靜的生活      712 non-null int64
下班后盡快回家          712 non-null int64

讀取數(shù)據(jù)审丘,將事后分類維度取出來并查看類型,發(fā)現(xiàn)9個維度都是數(shù)字類型并且部分維度之間似乎存在一定的相關性勾给,這種相關性可能會造成重疊信息的擴大化滩报,增加分類偏差,因此先對這9個維度進行因子分析播急。

1.1 因子分析

因子分析是指通過少數(shù)不相關的因子反映多個具有相關性的原始信息脓钾,起到降維和剔除相關性的作用。
因子分析的前提是具有一定的相關性桩警,因此必須通過了kmo和bartlett球形度檢驗的數(shù)據(jù)才能進行因子分析可训。

#因子分析適用性檢驗
kmo = calculate_kmo(x)  # kmo值要大于0.7
bartlett = calculate_bartlett_sphericity(x)  # bartlett球形度檢驗p值要小于0.05
print('kmo:{},bartlett:{}'.format(kmo[1], bartlett[1]))
kmo:0.7164804529238993,bartlett:2.40899758533843e-221

通過了適用性檢驗后進行因子分析,格式為:FactorAnalyzer(rotation= None,n_factors=n,method='principal')
(1)rotation:旋轉的方式捶枢,包括None:不旋轉,'varimax':最大方差法,'promax':最優(yōu)斜交旋轉握截;
(2)n_factors:公因子的數(shù)量;
(3)method:因子分析的方法烂叔,包括'minres':最小殘差因子法,'principal':主成分分析法川蒙;

# 使用主成分分析法,9個因子維度擬合
fa = FactorAnalyzer(rotation=None, n_factors=9, method='principal')
fa.fit(x)
fa_9_sd = fa.get_factor_variance()
fa_9_df = pd.DataFrame(
    {'特征值': fa_9_sd[0], '方差貢獻率': fa_9_sd[1], '方差累計貢獻率': fa_9_sd[2]})

#各個因子的特征值以及方差貢獻率
print(fa_9_df)
    特征值   方差貢獻率 方差累計貢獻率
0  2.779391  0.308821  0.308821
1  1.302006  0.144667  0.453489
2  1.157716  0.128635  0.582124
3  1.034961  0.114996  0.697119
4  0.659054  0.073228  0.770348
5  0.597498  0.066389  0.836736
6  0.571816  0.063535  0.900271
7  0.486350  0.054039  0.954310
8  0.411207  0.045690  1.000000

查看9個公因子的特征值以及方差貢獻率长已,一般選擇方差累計貢獻率大于0.8的公因子,而文中選擇了特征值大于1的公因子昼牛,即方差累計貢獻率為0.697的前4個公因子。接著根據(jù)4個公因子重新擬合贰健。

#公因子數(shù)設為4個胞四,重新擬合
fa_4 = FactorAnalyzer(rotation=None, n_factors=4, method='principal')
fa_4.fit(x)

#查看公因子提取度
print(fa_4.get_communalities())
[0.74797278 0.67110816 0.74233283 0.73808703 0.66567718 0.77689271
 0.69607415 0.61523932 0.62069047]

查看公因子的提取度,發(fā)現(xiàn)當使用4個公因子時伶椿,4個公因子對9個維度的解釋率都超過0.6辜伟,說明提取的4個公因子對原始維度有一定的解釋力。
接著查看4個公因子的因子載荷脊另,看看是否需要旋轉导狡。因子載荷即公因子對原始維度的解釋力。

#查看因子載荷
print(fa_4.loadings_)
[[ 0.41758577 -0.04630919  0.69667789  0.29341146]
 [ 0.5458075  -0.36656161  0.20321007  0.44445539]
 [ 0.64142608 -0.2555359  -0.50646667  0.09538522]
 [ 0.65217692 -0.36074267 -0.3699891   0.21383425]
 [ 0.54104332  0.4901776  -0.28576184 -0.22586587]
 [ 0.58866609 -0.09674514  0.23956478 -0.60300418]
 [ 0.64268497 -0.19004547  0.23352467 -0.43861045]
 [ 0.48559443  0.56693683 -0.10335096  0.21757431]
 [ 0.42690002  0.60240529  0.18274222  0.20532898]]

以第一個維度為例偎痛,我們發(fā)現(xiàn)4個公因子對原始的第一個維度的解釋程度分別為:0.418旱捧,-0.046,0.697,0.293枚赡,表明公因子1與公因子3之間存在一定的相關性氓癌,達不到因子分析的既定效果,因此需要進行旋轉贫橙,使得各個公因子具有差異化的特征贪婉。

#使用最大方差法旋轉因子
fa_4_rotate = FactorAnalyzer(
    rotation='varimax', n_factors=4, method='principal')
fa_4_rotate.fit(x)

#查看z旋轉后的因子載荷
print(fa_4_rotate.loadings_)
[[-0.06853212  0.15285685  0.20333033  0.8237522 ]
 [ 0.4912233   0.00448056  0.05911173  0.6529116 ]
 [ 0.83076037  0.1490026   0.16448475 -0.05397252]
 [ 0.83463555  0.07159505  0.1317772   0.13776588]
 [ 0.21485233  0.67063434  0.31903511 -0.26073327]
 [ 0.08489552  0.09023972  0.87007017  0.06723208]
 [ 0.20807596  0.06273611  0.78272561  0.1902192 ]
 [ 0.15963168  0.76368161 -0.01467611  0.07957422]
 [-0.06747767  0.74047386  0.03975419  0.25740106]]

還是以第一個維度為例,我們發(fā)現(xiàn)經過最大方差法旋轉之后卢肃,4個公因子對原始的第一個維度的解釋程度分別為:-0.069,0.153,0.203,0.824疲迂,即公因子4對第一個維度的解釋力較大。旋轉后4個公因子在原始維度上被明顯的區(qū)別出來践剂,即4個公因子具有差異性的特征鬼譬。

# 以因子最大值的因子為因子類型
facotor_result = pd.DataFrame(
    fa_4_rotate.fit_transform(x), columns=list('1234'))
facotor_result['因子類型'] = facotor_result.idxmax(axis=1) 

#查看結果
print(facotor_result.head())
        1         2         3         4 因子類型
0 -0.011259  1.616764  1.398204  0.938451    2
1 -0.179805 -0.855833 -0.061380 -2.978798    3
2 -1.105833  0.729183 -0.664757 -0.664573    2
3  1.524168 -0.264195 -0.187541 -1.982722    1
4  0.437858 -0.520359 -0.091027 -0.654643    1

#將因子類型合并到原數(shù)據(jù)中
result = pd.concat([X.iloc[:, :-9], facotor_result['因子類型']], axis=1)

1.2 聚類分析

經過因子分析之后,我們把所有的客戶分成了具有差異性特征的4類客戶(代表了9個事后分類維度)逊脯,接著我們通過因子類型以及保費金額兩個維度進行聚類分析优质。常用的聚類分析方法有kmeans、DBSCAN以及層次聚類军洼,文中使用了層次聚類巩螃,因為層次聚類對數(shù)據(jù)的類型要求不高且事先不需要知道分為幾類,缺點在于計算量大匕争。

# 因子類型以及保費金額的量綱不一致避乏,需進行標準化處理
result['因子類型'] = result['因子類型'].astype('int64')
result['Z因子類型'] = (result['因子類型']-result['因子類型'].mean())/result['因子類型'].std()
result['Z保費金額'] = (result['保費金額']-result['保費金額'].mean())/result['保費金額'].std()
result = result.set_index(result['問卷編號'])
#層次聚類分析
Z = hierarchy.linkage(result[['Z保費金額', 'Z因子類型']],
                      method='ward', metric='euclidean')
hierarchy.dendrogram(Z, labels=result.index)
# 看效果圖,分為5類比較合適甘桑,即高度大概在13左右
label = hierarchy.cut_tree(Z, height=13)
label = label.reshape(label.size,)
result['細分類型'] = list(label)
聚類分析

通過層次聚類分析拍皮,我們將所有客戶分為了5類,那么分類的效果如何呢跑杭?接下來我們通過方法分析檢驗分類的效果铆帽。我們發(fā)現(xiàn)無論是保費金額還是因子類型,通過層次聚類分組后德谅,p值都小于0.05爹橱,即組間存在顯著性差異,聚類效果良好窄做。

#使用方差分析檢驗                                                                                                                                                                                                                                                                                                                                                                                                                                                                                              聚類效果
a = anova_lm(ols('保費金額~C(細分類型)', data=result[['保費金額', '細分類型']]).fit())[:1]
b = anova_lm(ols('因子類型~C(細分類型)', data=result[['因子類型', '細分類型']]).fit())[:1]
f_oneway_result = pd.concat([a.iloc[:, 3:], b.iloc[:, 3:]])
f_oneway_result['列名'] = ['保費金額', '因子類型']
print(f_oneway_result)
                  F         PR(>F)       列名
C(細分類型)  306.108565  1.157673e-152  保費金額
C(細分類型)  742.643495  1.999808e-251  因子類型

通過單因素方差分析愧驱,我們知道細分類型各組間存在顯著性差異,那么這種差異怎么表現(xiàn)出來呢椭盏?對于數(shù)值型數(shù)據(jù)我們用均值進行比較组砚,對于類別型數(shù)據(jù)我們用占比比較,然后根據(jù)保費金額以及因子類別對細分類型命名掏颊。

#保費金額使用均值比較惫确,因子類別使用占比比較
nor = pd.crosstab(result['細分類型'], result['因子類型'],
                  normalize=0)  # normalize = 0按行求占比
mean = result.groupby('細分類型')['保費金額'].mean()
result_xf = pd.concat([nor, mean], axis=1)
print(result_xf)
         1         2         3         4         保費金額
細分類型                                                     
0     0.000000  0.603774  0.396226  0.000000  1481.796226
1     0.657407  0.342593  0.000000  0.000000  2098.268056
2     0.000000  0.000000  0.578947  0.421053  2779.996241
3     0.000000  0.000000  0.000000  1.000000  1708.326829
4     0.530864  0.259259  0.197531  0.012346  3780.096296

#各細分類型命名
result['細分類型'] = result['細分類型'].map(
    {0: '低端居家型客戶', 1: '中端享受型客戶', 2: '中端外向型客戶', 3: '中端自信型客戶', 4: '高端享受型客戶'})

2. 目標客戶選取

細分客戶之后,要選取目標客戶。選取目標客戶主要從兩個維度度量改化,分別是客戶吸引力和企業(yè)競爭力掩蛤。客戶吸引力包括兩個方面陈肛,一是客戶規(guī)模揍鸟,二是保費金額,根據(jù)其公司需要句旱,按權重6:4進行計算阳藻,得出客戶吸引力。企業(yè)吸引力主要體現(xiàn)在各個保險公司擁有各個細分類型客戶的數(shù)量谈撒,即市場占有率腥泥。

#統(tǒng)計客戶吸引力和企業(yè)競爭力
result_final = pd.DataFrame()
result_final['客戶數(shù)量'] = result.groupby('細分類型')['問卷編號'].count()
result_final['保費金額'] = result.groupby('細分類型')['保費金額'].mean()
result_final['客戶規(guī)模'] = result_final['客戶數(shù)量']/result_final['客戶數(shù)量'].sum()
result_final['客戶規(guī)模標準化'] = (
    result_final['客戶規(guī)模']-result_final['客戶規(guī)模'].mean())/result_final['客戶規(guī)模'].std()
result_final['保費金額標準化'] = (
    result_final['保費金額']-result_final['保費金額'].mean())/result_final['保費金額'].std()
result_final['客戶吸引力'] = 0.6*result_final['客戶規(guī)模標準化']+0.4*result_final['保費金額標準化']
result2 = pd.crosstab(result['細分類型'], result['保險公司的選擇'], normalize=0)
result2.columns = ['甲', '乙', '丙', '丁']
result_final['企業(yè)競爭力'] = result2['甲']
print(result_final)

            客戶數(shù)量   保費金額   客戶規(guī)模   客戶規(guī)模標準化   保費金額標準化   客戶吸引力   企業(yè)競爭力
細分類型                                                                        
中端享受型客戶   216  2098.268056  0.303371  1.477388 -0.291968  0.769645  0.240741
中端外向型客戶   133  2779.996241  0.186798 -0.188688  0.441347  0.063326  0.458647
中端自信型客戶   123  1708.326829  0.172753 -0.389420 -0.711415 -0.518218  0.162602
低端居家型客戶   159  1481.796226  0.223315  0.333215 -0.955087 -0.182106  0.119497
高端享受型客戶    81  3780.096296  0.113764 -1.232494  1.517124 -0.132647  0.320988
#矩陣分析圖
plt.rcParams['font.sans-serif'] = 'Simhei'
plt.rcParams['axes.unicode_minus'] = False
plt.subplot(1, 1, 1)
plt.scatter(result_final['企業(yè)競爭力'],
            result_final['客戶吸引力'], s=200, c='r', marker='o')
plt.hlines(y=0, xmin=0, xmax=0.5)
plt.vlines(x=0.25, ymin=-1.2, ymax=1.2)
plt.xlabel('企業(yè)競爭力')
plt.ylabel('客戶吸引力')
for a, b, c in zip(result_final['企業(yè)競爭力'], result_final['客戶吸引力'], result_final.index):
    plt.text(a, b, c, ha='center', va='bottom', fontsize=10)
矩陣分析

由上圖可知,中端外向型客戶是甲公司的首選客戶啃匿,其次是中端享受型客戶和高端享受型客戶蛔外,而低端居家型客戶和中端自信型客戶在資源不足的情況下暫可放棄。

3. 目標客戶定位

目標客戶定位包括兩部分溯乒,一是目標客戶長什么樣夹厌,也就是用戶畫像,通過事前分類維度描述目標客戶畫像裆悄;二是目標客戶需求是什么矛纹,針對需求進行精準營銷。分析過程依然是先進行方差分析光稼,通過方差分析的維度用均值或者占比表現(xiàn)差異性或南,最后通過對應分析展示效果。

3.1 目標客戶畫像

事前分類維度一共由6個艾君,分別是性別迎献、年齡、城市腻贰、家庭月收入、汽車價格扒秸、學歷以及職業(yè)播演。通過方差分析發(fā)現(xiàn),學歷以及職業(yè)在細分類型組間沒有顯著性差異伴奥,故忽略這兩個維度繼續(xù)分析写烤。

#事前分類維度方差分析
result['職業(yè)'] = result['職業(yè)'].replace(' ', '6').astype('int64')
target_sd = []
for i in ['性別', '年齡', '城市', '家庭月收入', '汽車價格', '學歷', '職業(yè)']:
    formula = '(' + str(i) + '~' + 'C(' + '細分類型)' + ')'
    a = anova_lm(ols(formula, data=result[[i, '細分類型']]).fit())[:1]
    target_sd.append(pd.DataFrame(
        {'c': str(i), 'F': a['F'], 'PR(>F)': a['PR(>F)']}))

target_result = pd.concat(target_sd)
target_result = target_result[target_result['PR(>F)'] < 0.05]

#具有顯著性差異的維度結果展示
print(target_result)
                c            F         PR(>F)
C(細分類型)     性別    57.940193   2.614665e-42
C(細分類型)     年齡   553.274636  4.801252e-216
C(細分類型)     城市  3629.629395   0.000000e+00
C(細分類型)  家庭月收入   268.460859  3.193752e-140
C(細分類型)   汽車價格   901.193079  7.780527e-276
#具有顯著性差異的維度命名
Y = result[['性別', '年齡', '城市', '家庭月收入', '汽車價格', '細分類型']]
Y['性別'] = Y['性別'].map({1: '男', 2: '女'})
Y['年齡'] = Y['年齡'].map({1: '18-30歲', 2: '31-40歲', 3: '41歲以上'})
Y['城市'] = Y['城市'].map(
    {1: '北京', 2: '上海', 3: '武漢', 4: '沈陽', 5: '廣州', 6: '西安', 7: '成都'})
Y['家庭月收入'] = Y['家庭月收入'].map(
    {1: '小于7000元', 2: '7000-10000元', 3: '10000-15000元', 4: '15000-20000元', 5: '20000元以上'})
Y['汽車價格'] = Y['汽車價格'].map(
    {1: '10萬元以下', 2: '10-20萬元', 3: '20-30萬元', 4: '30萬元以上'})

# 多因子對應分析
mca = prince.MCA(n_components=2, n_iter=10, random_state=1)
mca = mca.fit(Y)
ax = mca.plot_coordinates(
    X=Y,
    ax=None,
    figsize=(10, 6),
    show_row_points=False,
    show_column_points=True,
    column_points_size=100,
    show_column_labels=True,
    legend_n_cols=1
)
對應分析

從對應分析效果圖可知,甲公司首選目標客戶中端外向型客戶拾徙,主要是在分布在北京洲炊,武漢的分布比例也比其他細分類型要高,年齡集中在31-40之間,性別為男暂衡,家庭月收入在15000到20000元之間询微,汽車價格在20-30萬元間。

3.2 目標客戶需求分析

依然是選定各細分類型客戶狂巢,然后對各個維度進行方差分析撑毛,通過方差分析檢驗后的維度用均值或者占比進行比較;而未通過方差分析的維度唧领,則直接用中端外向型客戶進行各個維度的比較藻雌,數(shù)值型用均值,類型型用占比斩个。

#方差分析
result['從什么渠道收集信息'] = result['從什么渠道收集信息'].replace(' ', '4').astype('int64')
target_demand_sd = []
for i in result.iloc[:, 9:21].columns.values:
    formula = '(' + str(i) + '~' + 'C(' + '細分類型)' + ')'
    a = anova_lm(ols(formula, data=result[[i, '細分類型']]).fit())[:1]
    target_demand_sd.append(pd.DataFrame(
        {'c': str(i), 'F': a['F'], 'PR(>F)': a['PR(>F)']}))

target_demand = pd.concat(target_demand_sd)
target_demand1 = target_demand[target_demand['PR(>F)'] < 0.05]
target_demand2 = target_demand[target_demand['PR(>F)'] > 0.05]
print('有顯著差異的維度:{}'.format(target_demand1['c'].values))
print('沒有顯著差異的維度:{}'.format(target_demand2['c'].values))

有顯著差異的維度:['保險公司的選擇' '保費金額' '一站式服務考慮程度' '網(wǎng)上投笨韬迹考慮程度' '產品個性化考慮程度' '選擇保險公司的考慮因素' '滿意度']
沒有顯著差異的維度:['決策時間' '是否收集信息' '從什么渠道收集信息' '投保渠道' '索賠經歷']

#保險公司的選擇
target_demand1_result1 = pd.crosstab(
    result['細分類型'], result['保險公司的選擇'], normalize=0)
target_demand1_result1.columns = list('甲乙丙丁')
print(target_demand1_result1)
                甲         乙         丙         丁
細分類型                                           
中端享受型客戶  0.240741  0.254630  0.259259  0.245370
中端外向型客戶  0.458647  0.142857  0.187970  0.210526
中端自信型客戶  0.162602  0.333333  0.268293  0.235772
低端居家型客戶  0.119497  0.283019  0.358491  0.238994
高端享受型客戶  0.320988  0.209877  0.098765  0.370370

#選擇保險公司的考慮因素分析
target_demand1_result2 = pd.crosstab(
    result['細分類型'], result['選擇保險公司的考慮因素'], normalize=0)
target_demand1_result2.columns = [
    '服務態(tài)度好', '公司知名度高', '產品價格便宜', '服務網(wǎng)點多', '親朋推薦', '信任銷售人員', '理賠服務效率高']
print(target_demand1_result2)
           服務態(tài)度好 公司知名度高 產品價格便宜 服務網(wǎng)點多 親朋推薦 信任銷售人員 理賠服務效率高
細分類型                                                                         
中端享受型客戶  0.013889  0.041667  0.125000  0.231481  0.273148  0.254630  0.060185
中端外向型客戶  0.052632  0.022556  0.112782  0.248120  0.323308  0.180451  0.060150
中端自信型客戶  0.081301  0.024390  0.146341  0.260163  0.178862  0.252033  0.056911
低端居家型客戶  0.056604  0.044025  0.163522  0.308176  0.238994  0.150943  0.037736
高端享受型客戶  0.024691  0.037037  0.061728  0.209877  0.296296  0.246914  0.123457

#滿意度分析
target_demand1_result3 = pd.crosstab(
    result['細分類型'], result['滿意度'], normalize=0)
target_demand1_result3.columns = ['滿意', '還可以', '不滿意']
print(target_demand1_result3)
               滿意       還可以      不滿意
細分類型                                 
中端享受型客戶  0.125000  0.509259  0.365741
中端外向型客戶  0.015038  0.360902  0.624060
中端自信型客戶  0.162602  0.626016  0.211382
低端居家型客戶  0.364780  0.591195  0.044025
高端享受型客戶  0.000000  0.024691  0.975309

#剩下的維度均值比較
target_demand1_result4 = pd.DataFrame()
target_demand1_result4['保費金額'] = result.groupby('細分類型')['保費金額'].mean()
target_demand1_result4['一站式服務考慮程度'] = result.groupby('細分類型')[
    '一站式服務考慮程度'].mean()
target_demand1_result4['網(wǎng)上投保考慮程度'] = result.groupby('細分類型')['網(wǎng)上投笔苌叮考慮程度'].mean()
target_demand1_result4['產品個性化考慮程度'] = result.groupby('細分類型')[
    '產品個性化考慮程度'].mean()
print(target_demand1_result4)
          保費金額  一站式服務考慮程度  網(wǎng)上投弊龈觯考慮程度  產品個性化考慮程度
細分類型                                                
中端享受型客戶  2098.268056   4.712963  4.717593   5.356481
中端外向型客戶  2779.996241   4.548872  4.729323   5.436090
中端自信型客戶  1708.326829   4.121951  4.373984   4.926829
低端居家型客戶  1481.796226   4.459119  4.572327   5.226415
高端享受型客戶  3780.096296   4.950617  5.000000   5.382716

由上面的分析可知:
甲公司的目標客戶中端外向型客戶在選擇保險公司考慮的因素中,比較關注服務網(wǎng)點多腔呜、親朋推薦和信任銷售人員叁温,其中尤其關注親朋的推薦。
在滿意度分析中核畴,發(fā)現(xiàn)中端外向型客戶對目前購買的車險并不滿意膝但,滿意度只有1.5%,不滿意的具體原因還需進一步調研谤草。
中端外向型客戶車險平均保費在2780元跟束,比其他細分客戶更注重產品個性化。
最后對細分類型間沒有顯著性差異的維度接著進行分析丑孩,都是類別數(shù)據(jù)冀宴,直接value_counts()就可以了,這里就不一一展示了温学。

#不具有顯著性差異的維度分析
target_demand2_result = result[result['細分類型'] == '中端外向型客戶'][[
    '決策時間', '是否收集信息', '從什么渠道收集信息', '投保渠道', '索賠經歷']]
target_demand2_result['決策時間'].value_counts()
target_demand2_result['是否收集信息'].value_counts()
target_demand2_result['從什么渠道收集信息'].value_counts()
target_demand2_result['投保渠道'].value_counts()
target_demand2_result['索賠經歷'].value_counts()

今天的分享到此結束略贮,希望各位看官有所收獲!仗岖!

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末逃延,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子轧拄,更是在濱河造成了極大的恐慌,老刑警劉巖檩电,帶你破解...
    沈念sama閱讀 217,542評論 6 504
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件拄丰,死亡現(xiàn)場離奇詭異府树,居然都是意外死亡,警方通過查閱死者的電腦和手機料按,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,822評論 3 394
  • 文/潘曉璐 我一進店門奄侠,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人站绪,你說我怎么就攤上這事遭铺。” “怎么了恢准?”我有些...
    開封第一講書人閱讀 163,912評論 0 354
  • 文/不壞的土叔 我叫張陵魂挂,是天一觀的道長。 經常有香客問我馁筐,道長涂召,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,449評論 1 293
  • 正文 為了忘掉前任敏沉,我火速辦了婚禮果正,結果婚禮上,老公的妹妹穿的比我還像新娘盟迟。我一直安慰自己秋泳,他們只是感情好,可當我...
    茶點故事閱讀 67,500評論 6 392
  • 文/花漫 我一把揭開白布攒菠。 她就那樣靜靜地躺著迫皱,像睡著了一般。 火紅的嫁衣襯著肌膚如雪辖众。 梳的紋絲不亂的頭發(fā)上卓起,一...
    開封第一講書人閱讀 51,370評論 1 302
  • 那天,我揣著相機與錄音凹炸,去河邊找鬼戏阅。 笑死,一個胖子當著我的面吹牛啤它,可吹牛的內容都是我干的奕筐。 我是一名探鬼主播,決...
    沈念sama閱讀 40,193評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼变骡,長吁一口氣:“原來是場噩夢啊……” “哼离赫!你這毒婦竟也來了?” 一聲冷哼從身側響起锣光,我...
    開封第一講書人閱讀 39,074評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎铝耻,沒想到半個月后誊爹,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體蹬刷,經...
    沈念sama閱讀 45,505評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 37,722評論 3 335
  • 正文 我和宋清朗相戀三年频丘,在試婚紗的時候發(fā)現(xiàn)自己被綠了办成。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,841評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡搂漠,死狀恐怖迂卢,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情桐汤,我是刑警寧澤而克,帶...
    沈念sama閱讀 35,569評論 5 345
  • 正文 年R本政府宣布,位于F島的核電站怔毛,受9級特大地震影響员萍,放射性物質發(fā)生泄漏。R本人自食惡果不足惜拣度,卻給世界環(huán)境...
    茶點故事閱讀 41,168評論 3 328
  • 文/蒙蒙 一碎绎、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧抗果,春花似錦筋帖、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,783評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至宿接,卻和暖如春赘淮,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背睦霎。 一陣腳步聲響...
    開封第一講書人閱讀 32,918評論 1 269
  • 我被黑心中介騙來泰國打工梢卸, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人副女。 一個月前我還...
    沈念sama閱讀 47,962評論 2 370
  • 正文 我出身青樓蛤高,卻偏偏與公主長得像,于是被迫代替她去往敵國和親碑幅。 傳聞我的和親對象是個殘疾皇子戴陡,可洞房花燭夜當晚...
    茶點故事閱讀 44,781評論 2 354

推薦閱讀更多精彩內容