需要金幣:![]() ![]() |
資料包括:完整論文 | ![]() |
![]() |
轉換比率:金額 X 10=金幣數量, 例100元=1000金幣 | 論文字數:10805 | ![]() | |
折扣與優惠:團購最低可5折優惠 - 了解詳情 | 論文格式:Word格式(*.doc) | ![]() |
摘要:房價一直當今時代的一個核心話題,通過房價預測模型可以幫助人們預測未來的房價,了解房產的實際價值,為政府相關部門制定房地產政策提供可靠依據。本研究使用機器學習算法作為研究方法來開發住房價格預測模型。 影響房價的因素眾多,如:地段,面積等因素。如何在眾多的因素中找出影響房價的關鍵因素,是構造房價預測模型的難點。傳統采用人工統計分類的方法效率低下,準確性不高。 本文采用機器學習來構建房價預測模型。并通過淘汰算法由機器自動篩選變量。實驗采用包含506個原始數據的房地產數據包。該數據包包含13個輸入變量,分別是(CRIM, ZN, INDUS, CHAS, NOX, RM, AGE, DIS, RAD, TAX, PTRATIO, B, LSTAT)。隨機抽取其中70%的數據作為訓練集,30%的數據作為測試集。 然后采用淘汰算法刪除不相關的輸入變量,對剩余的10個變量,再次進行建模。與未刪除輸入變量的建模結果相比,刪除變量后的測試集驗證均方根誤差變化在10%以內。說明剩余的十個變量是房價預測模型的高相關參數。 關鍵字:房價預測,機器學習,數據模型,變量淘汰
目錄 摘要 Abstract 1 引言-1 1.1研究背景及意義-1 1.2機器學習簡介-1 1.3關于機器學習的算法-2 2 數據的預處理-5 2.1導入標準庫-5 2.2導入數據集-6 2.3重復數據、缺失數據的處理以及數據的標準化-8 2.4劃分測試集和訓練集-9 3 變量分析-11 3.1字段CRIM分析-11 3.2字段ZN分析-12 3.3字段INDUS分析-12 3.4字段CHAS分析-13 3.5字段NOX分析-13 3.6字段RM分析-14 3.7字段AGE分析-15 3.8字段DIS分析-15 3.9字段RAD分析-16 3.10字段TAX分析-17 3.11字段PTRATIO分析-18 3.12字段B分析-18 3.13字段LSTAT分析-19 3.14本章總結-20 4 多元線性回歸-21 4.1建立模型-21 4.2自變量淘汰-21 4.3模型重構-24 4.4本章研究總結-25 5總結與結論-26 致謝-27 參考文獻-28 附錄-29 |