这两天刚好有些时间,于是跑了一些空间计量模型作为实战练习,使用的包是pysal,原教程该链接,主要是阐述了空间异质性、空间依赖的含义以及SLX,SAR,SEM这三个空间计量基本模型,其他的许多变体其实也就是这三个模型的两两结合或三个结合在一起。在本博客中不再阐述空间异质性和空间依赖了,只讲如何用pysal实现SLX,SAR,SEM这三个基本模型,希望了解全部内容的可以看原教程。此外,pysal这个包最好是要更新到最新版,要不然本博客代码跑起来会有bug。
1.数据情况及OLS回归
The Data: San Diego AirBnB,可以自己下载。数据是San Diego的airbnb的每晚房价数据,包括房价,这个也就是我们后续分析的因变量,还有一些连续的自变量,比如房间数量、卫生间数量、卧室数量、床数量等等,此外也有一些分类变量,比如neighborhood,此外,还有一些哑变量,比如pg_Apartment等。
import warnings warnings.filterwarnings("ignore") %matplotlib inline import pysal import spreg from libpysal import weights import esda from scipy import stats import statsmodels.formula.api as sm import numpy as np import pandas as pd import geopandas as gpd import matplotlib.pyplot as plt import seaborn as sns
db = gpd.read_file('regression_db.geojson') db.info()
<class 'geopandas.geodataframe.GeoDataFrame'> RangeIndex: 6110 entries, 0 to 6109 Data columns (total 20 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 accommodates 6110 non-null int64 1 bathrooms 6110 non-null float64 2 bedrooms 6110 non-null float64 3 beds 6110 non-null float64 4 neighborhood 6110 non-null object 5 pool 6110 non-null int64 6 d2balboa 6110 non-null float64 7 coastal 6110 non-null int64 8 price 6110 non-null float64 9 log_price 6110 non-null float64 10 id 6110 non-null int64 11 pg_Apartment 6110 non-null int64 12 pg_Condominium 6110 non-null int64 13 pg_House 6110 non-null int64 14 pg_Other 6110 non-null int64 15 pg_Townhouse 6110 non-null int64 16 rt_Entire_home/apt 6110 non-null int64 17 rt_Private_room 6110 non-null int64 18 rt_Shared_room 6110 non-null int64 19 geometry 6110 non-null geometry dtypes: float64(6), geometry(1), int64(12), object(1) memory usage: 954.8+ KB
db.head(2)
2024最新激活全家桶教程,稳定运行到2099年,请移步至置顶文章:https://sigusoft.com/99576.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。 文章由激活谷谷主-小谷整理,转载请注明出处:https://sigusoft.com/140012.html