很多業(yè)務(wù)場(chǎng)景中井辆,我們希望通過一個(gè)特定的函數(shù)來擬合業(yè)務(wù)數(shù)據(jù),以此來預(yù)測(cè)未來數(shù)據(jù)的變化趨勢(shì)溶握。(比如用戶的留存變化杯缺、付費(fèi)變化等)
本文主要介紹在 Python 中常用的兩種曲線擬合方法:多項(xiàng)式擬合 和 自定義函數(shù)擬合。
多項(xiàng)式擬合 np.polyfit
通過多項(xiàng)式擬合睡榆,我們只需要指定想要擬合的多項(xiàng)式的最高項(xiàng)次是多少即可萍肆。
import numpy as np
import matplotlib.pyplot as plt
x = [10,20,30,40,50,60,70,80]
x = np.array(x)
print('x is :\n',x)
num = [174,236,305,334,349,351,342,323]
y = np.array(num)
print('y is :\n',y)
# f1 為各項(xiàng)的系數(shù),3 表示想要擬合的最高次項(xiàng)是多少胀屿。
f1 = np.polyfit(x, y, 3)
# p1 為擬合的多項(xiàng)式表達(dá)式
p1 = np.poly1d(f1)
print('p1 is :\n',p1)
plt.plot(x, y, 's',label='original values')
yvals = p1(x) #擬合y值
plt.plot(x, yvals, 'r',label='polyfit values')
運(yùn)行結(jié)果:
image.png
自定義函數(shù)擬合 curve_fit
對(duì)于自定義函數(shù)擬合塘揣,不僅可以用于直線、二次曲線宿崭、三次曲線的擬合亲铡,它可以適用于任意形式的曲線的擬合,只要定義好合適的曲線方程即可葡兑。
from scipy.optimize import curve_fit
x = [20,30,40,50,60,70]
x = np.array(x)
num = [453,482,503,508,498,479]
y = np.array(num)
# 這里的函數(shù)可以自定義任意形式奖蔓。
def func(x, a, b,c):
return a*np.sqrt(x)*(b*np.square(x)+c)
# popt返回的是給定模型的最優(yōu)參數(shù)。我們可以使用pcov的值檢測(cè)擬合的質(zhì)量讹堤,其對(duì)角線元素值代表著每個(gè)參數(shù)的方差吆鹤。
popt, pcov = curve_fit(func, x, y)
a = popt[0]
b = popt[1]
c = popt[2]
yvals = func(x,a,b,c) #擬合y值
plot1 = plt.plot(x, y, 's',label='original values')
plot2 = plt.plot(x, yvals, 'r',label='polyfit values')
運(yùn)行結(jié)果:
image.png