2023年數(shù)學建模美賽春季賽Y題—分析二手帆船價格——思路程序總結分享
使用的程序、中間數(shù)據(jù)、分析結果等資源的獲取方式:https://mbd.pub/o/bread/ZJeUl59s
1: 問題描述與要求
與許多奢侈品一樣,帆船的價值會隨著年齡和市場條件的變化而變化。隨附的 “2023_MCM_Problem_Y_Boats.xlsx” 文件包含約3500艘36至56英尺長的帆船的數(shù)據(jù)墨状,這些帆船于 2020 年 12 月在歐洲、加勒比海地區(qū)和美國進行了廣告銷售菲饼。一位劃船愛好者向 COMAP 提供了這些數(shù)據(jù)肾砂。 與大多數(shù)真實世界的數(shù)據(jù)集一樣,它可能存在數(shù)據(jù)缺失或其他問題宏悦,需要在分析之前進行一些數(shù)據(jù)清理镐确。
帆船經(jīng)常通過經(jīng)紀人出售。 為了更好地了解帆船市場饼煞,中國香港 (SAR) 的一位帆船經(jīng)紀人委托您的團隊準備一份關于二手帆船定價的報告源葫。 經(jīng)紀人希望您:
(1) 開發(fā)一個數(shù)學模型來解釋所提供電子表格中每艘帆船的標價。 包括您認為有用的任何預測因素砖瞧。 您可以利用其他來源來了解給定帆船的其他特征(例如橫梁息堂、吃水、排水量块促、索具荣堰、帆面積、船體材料褂乍、發(fā)動機小時數(shù)持隧、睡眠能力、凈空高度逃片、電子設備等)以及按年份的經(jīng)濟數(shù)據(jù)和地區(qū)屡拨。識別并描述所有使用的數(shù)據(jù)來源。 包括對每種帆船型號價格的估算精度的討論褥实。
(2) 使用您的模型來解釋區(qū)域對上市價格的影響(如果有的話)呀狼。討論在所有帆船變體中是否有任何區(qū)域效應是一致的。解決所指出的任何區(qū)域影響的實際和統(tǒng)計意義损离。
(3) 討論您對給定地理區(qū)域的建模如何在香港 (SAR) 市場中發(fā)揮作用哥艇。 從提供的電子表格中選擇一個信息豐富的帆船子集,分為單體船和雙體船僻澎。 從香港 (SAR) 市場中查找該子集的可比上市價格數(shù)據(jù)貌踏。 模擬香港 (SAR) 對您子集中帆船的每艘帆船價格的區(qū)域影響(如果有的話)十饥。 雙體船和單體帆船的效果是否相同?
(4) 確定并討論您的團隊從數(shù)據(jù)中得出的任何其他有趣且信息豐富的推論或結論祖乳。
(5) 為香港 (SAR) 帆船經(jīng)紀人準備一份一到兩頁的報告逗堵。 包括一些精心挑選的圖形,以幫助經(jīng)紀人理解您的結論眷昆。
2: 解題思路和分析結果(詳解版)
針對問題1
思路:該問題主要是預測價格的回歸模型預測問題蜒秤。而且可以使用的預測算法有很多種,例如:多元回歸分析亚斋、Lasso回歸作媚、決策樹回歸、隨機森林回歸帅刊、GBDT回歸纸泡、支持習那里感激回歸等模型。但是使用這些模型時和結合數(shù)據(jù)的特點進行分析赖瞒,并且還需要對原始的數(shù)據(jù)進行很多的預處理與變換操作弟灼,提取更有用的特征,方可建立較準確的回歸預測模型冒黑。如果能夠收集到更多的相關數(shù)據(jù)集田绑,可以增強預測精度。
所以該問題的解決路徑應該為:數(shù)據(jù)清洗——>數(shù)據(jù)可視化探索性分析——>數(shù)據(jù)特征工程(篩選與變換)——>建立回歸分析模型——>對結果進行分析.
經(jīng)過我對數(shù)據(jù)集的相關探索和分析抡爹,得出使用隨機森林回歸預測模型的預測效果較準確掩驱。相關數(shù)據(jù)集的預測效果如下圖:
針對問題2
該問題主要是要結合問題1的分析結果,進行進一步的分析冬竟。分析一些分類變量(例如區(qū)域欧穴、制造商、年份等)與價格之間的的關系泵殴′塘保可以使用定量分析與可視化分析相結合的方式,主要可參考的方法有:方差分析笑诅、卡方檢驗等调缨。經(jīng)過我對數(shù)據(jù)的探索和分析,一些可參考的結果如下圖:
針對問題3
該問題屬于一個數(shù)據(jù)相似性對比吆你,然后建立回歸模型進行預測的問題弦叶。例如:根據(jù)收集的而外GDP數(shù)據(jù),找到和香港GDP情況相似的地區(qū)妇多,然后根據(jù)區(qū)域找到數(shù)據(jù)子集伤哺,然后對自己進行建模與分析從而作為香港的售價參考模型。如果數(shù)據(jù)樣本較多,可使用聚類分析立莉,將找到的子集劃分為更細的子集绢彤,對數(shù)據(jù)進行詳細分組和分析。因為最終還是需要建立價格預測模型蜓耻,所以可以嘗試一些回歸模型的算法杖虾,對數(shù)據(jù)進行預測,然后作為香港的預測結果媒熊。經(jīng)過我的一些數(shù)據(jù)真理與分析,一些可參考的結果示例如下所示:
針對問題4
討論您的團隊從數(shù)據(jù)中得出的任何其他有趣且信息豐富的推論或結論坟比。該問題是一個開放性的問題芦鳍,可以進行一些數(shù)據(jù)可視化分析等,便于發(fā)現(xiàn)數(shù)據(jù)的關系葛账。并且可以結合前面的結果進行分析柠衅。下面真實一些發(fā)現(xiàn)的數(shù)據(jù)規(guī)律:
總結
前面的一些分析,都是本人使用Python籍琳,對數(shù)據(jù)一步步分析得出的一些經(jīng)驗菲宴,供大家參考。數(shù)學建模本身就是開放性問題趋急,這里只是拋磚引玉喝峦。
使用的程序、中間數(shù)據(jù)呜达、分析結果等資源的獲取方式:?https://mbd.pub/o/bread/ZJeUl59s
文章首發(fā)與:https://mp.weixin.qq.com/s?__biz=Mzg3MTM4NjI2MA==&mid=2247484826&idx=1&sn=5f49f4c3be56e01e4cb123e62c7e8cbe&chksm=cefe1861f9899177ebaacc490ec5102c56974f6f27fad215b870ca7908be2acf5db78d140564&token=957805254&lang=zh_CN#rd
今天的分享就到這里了谣蠢,敬請期待下一篇!
最后歡迎大家分享轉發(fā),您的點贊是對我的鼓勵和肯定查近!