聯(lián)合循環(huán)機(jī)組最大輸出功率預(yù)測(cè)
一孕惜、摘要
通過(guò)相關(guān)分析等一系列分析方法來(lái)探討自變量大氣溫度邀摆、大氣壓力怠肋、相對(duì)濕度和排氣壓力與因變量輸出功率之間的關(guān)系,并采用線性回歸算法對(duì)數(shù)據(jù)集進(jìn)行擬合串慰,得到用于預(yù)測(cè)輸出功率的模型偏塞。
分析最終得出結(jié)論:大氣溫度、排氣壓力邦鲫、相對(duì)濕度三個(gè)因素的增大會(huì)降低輸出功率灸叼,其中大氣溫度是影響最大的神汹,而大氣壓力增大則對(duì)輸出功率的提升有少許的促進(jìn)作用。
二古今、背景
隨著我國(guó)電力市場(chǎng)化改革的逐步推進(jìn)屁魏,市場(chǎng)各方需要越來(lái)越頻繁地參與各種電力交易,對(duì)于作為電力供給方的發(fā)電廠來(lái)說(shuō)捉腥,需要能夠定時(shí)定量地向購(gòu)電方供應(yīng)合同約定的電量氓拼,若生產(chǎn)電能無(wú)法滿足合同要求,則只能從電力市場(chǎng)中另外購(gòu)買電量以避免違約抵碟。如果在運(yùn)營(yíng)過(guò)程中桃漾,發(fā)電廠無(wú)法對(duì)自身的發(fā)電能力有一個(gè)較為準(zhǔn)確的估計(jì),那么就可能面臨較大的價(jià)格風(fēng)險(xiǎn)拟逮,因此撬统,通過(guò)對(duì)發(fā)電廠的各種環(huán)境因素對(duì)機(jī)組的最大輸出功率的影響程度進(jìn)行分析,并構(gòu)建相應(yīng)的線性回歸模型敦迄,希望能幫助發(fā)電廠對(duì)機(jī)組輸出功率有更為準(zhǔn)確的預(yù)測(cè)恋追。
三.分析過(guò)程
數(shù)據(jù)來(lái)源
該數(shù)據(jù)集來(lái)源于UCI大學(xué)公開的機(jī)器學(xué)習(xí)數(shù)據(jù),包含一個(gè)聯(lián)合循環(huán)發(fā)電廠在6年(2006-2011年)中采集的9568個(gè)數(shù)據(jù)罚屋,數(shù)據(jù)采集時(shí)機(jī)組為滿負(fù)荷運(yùn)行苦囱。數(shù)據(jù)集包含5個(gè)變量,包括大氣溫度(T)脾猛、大氣壓力(AP)撕彤、相對(duì)濕度(RH)和排氣真空(V),以及機(jī)組的輸出功率(EP)尖滚。
數(shù)據(jù)理解
大氣溫度(T):即環(huán)境溫度,單位為攝氏度瞧柔。
大氣壓力(AP):即環(huán)境大氣壓漆弄,單位為千帕。
相對(duì)濕度(RH):空氣中水蒸汽含量與相同大氣壓力下飽和蒸汽的比值的百分?jǐn)?shù)造锅。
排氣壓力(V):即燃機(jī)排氣的壓力撼唾,單位為千帕。
輸出功率(EP):機(jī)組的最大輸出功率(滿負(fù)荷)哥蔚,即在某一運(yùn)行條件下每小時(shí)所能輸出的最大電量倒谷,單位是兆瓦。
大氣溫度 排氣壓力 大氣壓力 相對(duì)濕度 輸出功率
14.96 41.76 1024.07 73.17 463.26
25.18 62.96 1020.04 59.08 444.37
5.11 39.4 1012.16 92.14 488.56
20.86 57.32 1010.24 76.64 446.48
數(shù)據(jù)處理
首先對(duì)數(shù)據(jù)進(jìn)行描述統(tǒng)計(jì)糙箍,從得出的表格可以看到渤愁,9568個(gè)記錄中所有變量值都是齊全的沒(méi)有空值,而且各個(gè)變量的范圍都是合理的深夯,與實(shí)際環(huán)境相符抖格,數(shù)據(jù)質(zhì)量很高因而不需要進(jìn)行數(shù)據(jù)清洗的處理诺苹。
特征分析
首先分別畫出四個(gè)自變量大氣溫度(T)、大氣壓力(AP)雹拄、相對(duì)濕度(RH)和排氣壓力(V)分別與輸出功率(EP)的分布散點(diǎn)圖收奔。從下方的四個(gè)散點(diǎn)圖可以看到只有左上方大氣溫度與輸出功率的散點(diǎn)圖,以及左下方排氣壓力與輸出功率的散點(diǎn)圖存在較為明顯的線性趨勢(shì)滓玖,另外兩個(gè)自變量與輸出功率則不明顯坪哄。
通過(guò)相關(guān)系數(shù)矩陣?yán)^續(xù)探究四個(gè)自變量與輸出功率的相關(guān)關(guān)系,從下方表格可以看到势篡,大氣溫度翩肌、排氣壓力與輸出功率的相關(guān)系數(shù)為-0.948和-0.870,均存在較強(qiáng)的負(fù)相關(guān)殊霞,而大氣壓力摧阅、相對(duì)濕度與輸出功率的相關(guān)系數(shù)為0.518和0.390,屬于弱相關(guān)绷蹲,分析結(jié)果與前面散點(diǎn)圖的分析結(jié)論一致棒卷。此外,大氣溫度與排氣壓力的相關(guān)性為0.844祝钢,自變量之間可能存在較強(qiáng)的共線性比规,具體共線性的強(qiáng)弱后續(xù)計(jì)算VIF進(jìn)一步確定。
為了識(shí)別某些與預(yù)測(cè)輸出功率沒(méi)有幫助的變量以簡(jiǎn)化模型拦英,對(duì)自變量進(jìn)行F檢驗(yàn)蜒什,從下方的檢驗(yàn)輸出結(jié)果可看到各個(gè)自變量的顯著性均為小于0.05,推翻預(yù)測(cè)模型加入該變量無(wú)統(tǒng)計(jì)學(xué)差異的零假設(shè)疤估,說(shuō)明各個(gè)因變量均對(duì)模型預(yù)測(cè)有幫助灾常。
構(gòu)建模型
線性回歸模型存在幾個(gè)適用條件,分別是:
? 預(yù)測(cè)殘差相互獨(dú)立钞瀑。
? 預(yù)測(cè)殘差滿足正態(tài)分布。
? 預(yù)測(cè)殘差滿足方差齊性雕什,即方差相等。
若模型預(yù)測(cè)殘差不滿足這幾個(gè)條件贷岸,則得到的線性回歸模型存在問(wèn)題,需要改進(jìn)偿警。
將四個(gè)自變量以及因變量用線性回歸算法進(jìn)行模型擬合,得到的線性回歸模型信息如下表所示:R2值為0.929户敬,模型擬合數(shù)據(jù)的程度很高落剪。Durbin-Watson為2.033尿庐,在0到4之間,說(shuō)明模型預(yù)測(cè)的殘差滿足線性回歸的殘差獨(dú)立性要求抄瑟。
得到的線性回歸模型系數(shù)如下表所示,可得模型公式:
非標(biāo)準(zhǔn)化公式:
EP_predict = 454.609 - 1.978T - 0.234V + 0.062AP-0.158RH
標(biāo)準(zhǔn)化公式:
EP_predict_std = -0.864T_std - 0174V_std + 0.022AP_std-0.135RH_std
此外皮假,各個(gè)自變量的VIF值均小于10鞋拟,說(shuō)明不存在嚴(yán)重的共線性,不需要專門對(duì)自變量進(jìn)行共線性處理惹资。
從下方模型預(yù)測(cè)結(jié)果的殘差直方圖以及PP圖來(lái)看贺纲,該線性模型的預(yù)測(cè)殘差非常接近正態(tài)分布,滿足線性回歸要求的殘差正態(tài)性要求褪测。
在下方線性回歸模型預(yù)測(cè)值與殘差的散點(diǎn)圖中猴誊,絕大部分殘差均在0兩側(cè)較為均勻地分布,且沒(méi)有明顯的變化趨勢(shì)侮措,滿足線性回歸模型殘差滿足方差齊性的要求懈叹,但有少數(shù)點(diǎn)超出了-3到3的范圍,我們將這些點(diǎn)視為離群點(diǎn)分扎,經(jīng)統(tǒng)計(jì)這些離群點(diǎn)對(duì)應(yīng)樣本的數(shù)量只占全部樣本的1%不到澄成,故可將這些樣本從數(shù)據(jù)集中剔除再重新擬合模型,避免對(duì)預(yù)測(cè)效果造成不良影響畏吓。
將上圖中標(biāo)準(zhǔn)化殘差超出了-3到3的范圍的離群點(diǎn)從數(shù)據(jù)集中剔除墨状,并重新擬合線性回歸模型,擬合出的模型結(jié)果如下菲饼,R2值為0.936肾砂,比之前的0.929有所提升,Durbin-Watson為2.024巴粪,滿足殘差獨(dú)立性要求通今。
新的線性回歸模型系數(shù)如下表所示粥谬,可得新模型公式:
非標(biāo)準(zhǔn)化公式:
EP_predict = 458.730 - 1.998T - 0.228V + 0.058AP-0.160RH
標(biāo)準(zhǔn)化公式:
EP_predict_std = -0.872T_std - 0170V_std + 0.020AP_std-0.137RH_std
新模型殘差也滿足正態(tài)分布以及方差齊性要求肛根。
四、分析總結(jié)
從相關(guān)分析以及擬合出來(lái)的模型可以看出:
? 大氣溫度是對(duì)聯(lián)合循環(huán)機(jī)組的最大輸出功率影響最大的因素漏策,且大氣溫度升高將導(dǎo)致最大輸出功率下降派哲,這與專業(yè)上大氣溫度升高導(dǎo)致空氣的比容下降,導(dǎo)致燃機(jī)吸入空氣的質(zhì)量流量下降而使得燃機(jī)輸出功率下降的結(jié)論是一致的掺喻,故寒冷地區(qū)的同類型機(jī)組在輸出功率方面是有優(yōu)勢(shì)的芭届。
? 排氣壓力升高也會(huì)降低燃機(jī)輸出功率储矩,主要是因?yàn)榕艢鈮毫ι呓档土巳紮C(jī)透平的膨脹比,使得透平的做功能力下降造成的褂乍,但對(duì)輸出功率的影響程度遠(yuǎn)不如大氣溫度持隧。
? 相對(duì)濕度升高同樣對(duì)燃機(jī)輸出功率起負(fù)面作用,原因在于水蒸汽比重低于空氣逃片,空氣中水蒸汽含量升高則質(zhì)量密度下降,則燃機(jī)吸入空氣的質(zhì)量流量下降呀狼,從而使得燃機(jī)輸出功率下降,其影響程度低于大氣溫度和排氣壓力哥艇。
? 大氣壓力升高則空氣密度升高貌踏,則燃機(jī)吸入空氣的質(zhì)量流量上升怎棱,因而大氣壓力升高對(duì)輸出功率的提升有一定的促進(jìn)作用拳恋,不過(guò)作用及其有限。
五隙赁、不足與改進(jìn)
由于SPSS的線性回歸無(wú)劃分測(cè)試集的功能伞访,應(yīng)后續(xù)在Python上進(jìn)行測(cè)試厚掷,以衡量得到模型的泛化能力级解。
可嘗試曲線擬合來(lái)構(gòu)建預(yù)測(cè)模型,探討自變量和因變量之間可能存在的非線性相關(guān)抡爹。
六冬竟、源數(shù)據(jù)
數(shù)據(jù)鏈接:http://archive.ics.uci.edu/ml/datasets/Combined+Cycle+Power+Plant
UE??W??:?