ISSN 0798 1015

logo

Vol. 38 (Nº 18) Año 2017. Pág. 23

Tiempo necesario para rentar una vivienda: Una aplicación de Regresión Logística Geográficamente Ponderada

Time required to rent a house: An application of Geographically Weighted Logistic Regression

Gabriel Alberto AGUDELO Torres 1; Luis Ceferino FRANCO Arbeláez 2; Luis Eduardo FRANCO Ceballos 3

Recibido: 26/10/16 • Aprobado: 22/11/2016


Contenido

1. Introducción

2. Metodología

3. Caso de estudio

4. Resultados

5. Conclusiones

Referencias


RESUMEN:

El análisis del sector inmobiliario ha atraído desde hace varios años la atención de los investigadores suscitando una gran cantidad de estudios al respecto. En este artículo se utilizan modelos de regresión logística ponderada geográficamente, para analizar las probabilidades de que una vivienda ubicada en el barrio Boston (ubicado en Medellín, Colombia) logre alquilarse en menos de tres meses. El principal hallazgo en este estudio es que aspectos como el área de la vivienda, la distancia al parque del barrio, el número de inmuebles de la copropiedad en la que se encuentra la vivienda, y el mes en el que sale en oferta de arrendamiento, son factores determinantes en la probabilidad de alquilar el inmueble en menos de tres meses.
Palabras clave: Sector Inmobiliario, GWR, Regresión Logística Geográficamente Ponderada, Precios hedónicos.

ABSTRACT:

The analysis of the real estate industry has brought several years the attention of researchers raising a lot of studies. In this article, geographically weighted logistic regression models are used to analyze the probability that a house located in the Boston neighborhood of Medellin rented achieved in less than three months. The main finding in this study is that aspects such as the area of housing, the distance to the neighborhood park, the number of properties of joint ownership, and the month in which goes on sale lease are factors determining the probability of renting the property in less than three months.
Keywords: Real state, GWR, Geographically Weighted Logistic Regression, Hedonic prices.

1. Introducción

En el campo específico de los precios de la propiedad raíz se encuentran, desde el siglo pasado, diversos estudios que indagan sobre sus precios y rentabilidades. Algunos de ellos son los desarrollados por Dewey y DeTuro (1950) y Beaty (1952). Posteriormente, diversos investigadores comenzaron a involucrar en el análisis de inmuebles el estudio detallado de sus características; entre los pioneros en ese tipo de investigaciones se encuentra Lancaster (1966) y Rosen (1974). Esas investigaciones son precursoras en la valoración de la utilidad de los inmuebles a partir de sus características específicas.

Posteriormente, Can (1992), ampliando la investigación relacionada con las características de los inmuebles, realizó una división del tipo de características; definió como características estructurales las que son ajustadas al bien; y características del vecindario, correspondientes al entorno que rodea el inmueble.

Sumado a lo anterior, y con el fin de incluir las diversas variables que podrían afectar el precio de los inmuebles, Basu y Thibodeau (1998), clasificaron los atributos de los inmuebles incluyendo aspectos específicos relacionados con el terrero, el uso del suelo, las mejoras específicas, la accesibilidad, la cercanía a externalidades, y la época de recolección de datos. Lo anterior disminuye la probabilidad de no tener en cuenta variables sustanciales y significativas para la valoración.

Respecto a los datos para la valoración, en muchos casos no se encuentran disponibles, o su recolección es lenta y costosa, haciendo más complejo el desarrollo de este tipo de investigaciones. En este sentido, Sheppard (1999), destaca la importancia del estudio de precios hedónicos y plantea la utilización de variables proxy ante ausencia de datos referentes a alguna característica específica del inmueble.

Además de las complicaciones inherentes a cualquier modelo de econometría tradicional, los modelos de econometría espacial pueden presentar dificultades adicionales relacionadas con la dependencia espacial de los datos y con la heterogeneidad espacial, Anselin (1988). 

En la modelación espacial es normal encontrar que los parámetros y las formas funcionales no sean constantes en el espacio. En ese tipo de escenarios, caracterizados por datos dependientes y heterogéneos espacialmente, la regresión geográficamente ponderada, o GWR (por sus siglas en inglés), emerge como una alternativa que permite generar coeficientes de regresión que varían de acuerdo con la ubicación geografía del objeto de estudio.

Yu (2004), realizó un estudio en el mercado de la propiedad raíz en Milwaukee, Wisconsin (EEUU), y empleando técnicas de GWR, encontró que la cercanía de las propiedades al lago Michigan hace que sus precios sean mayores. A pesar de que este tipo de investigaciones no han sido masivamente abordadas, diversos estudios existentes como los desarrollados por Bitter, Mulligan y Dall´erba (2006), Selim (2009), Lu, Charlton y Fotheringham (2011), han encontrado que los modelos de precios hedónicos a partir de la técnica GWR tienen un alto poder explicativo para analizar el precio de los inmuebles y resaltan la importancia de este tipo de técnicas para profundizar sobre el comportamiento del sector inmobiliario.

Respecto al uso de modelos logísticos con un enfoque espacial, Carl y Kühn (2007) emplean modelos logísticos en un análisis espacial para evaluar la aplicación a conjuntos de datos bidimensionales macro ecológicos y biogeográficos que muestran autocorrelación espacial. En otro estudio, Augustin, Cummins y Frech (2001), analizan la dinámica de la vegetación en el noreste de Escocia, a partir del uso de regresiones logísticas y modelos logit multinomiales. 

Anas (1990), analiza diversas características espaciales de la estructura urbana a partir del uso de modelos logit multinomiales. Con otras perspectivas, Bhat y Sener (2009), utilizan un enfoque basado en cópulas con una estructura logit espacial, logrando obtener una herramienta técnica que corresponde a una expresión analítica en forma cerrada para el cálculo de la probabilidad conjunta de selección a través de las diversas unidades de observación, y se encuentra que esa herramienta es aplicable mediante un procedimiento estándar de inferencia de máxima verosimilitud.

Autant (2006), evalúa dónde las empresas ubican sus actividades de I+D. El autor encuentra que un gran tamaño del mercado, la gran cantidad de ideas, y un bajo nivel de competencia en la región objetivo, incrementan la probabilidad de la creación de laboratorios de I + D. Otros trabajos como los de Zhou y Kockelman (2008), empleando modelo logit multinomiales con relaciones espaciales, también encuentran que las condiciones del vecindario ofrecen un poder predictivo, e identifican diversas tendencias espaciales en el desarrollo del uso el suelo en Austin, Texas.

A partir de modelos logit espaciales, Lee y Cohen (1985), utilizan modelos logit multinominales y muestran su utilidad para la planificación y gestión eficaz de los sistemas de atención hospitalarias en una región. Por otro lado, Li, Wu y Deng (2013), realizaron un estudio sobre la identificación de factores de cambio de uso del suelo en China a partir de un modelo logit multinomial; los autores encontraron que el aumento del valor del suelo urbano fue el principal impulsor del desarrollo del cultivo de tierras, y que el aumento del ingreso rural fue el principal impulsor de la conversión de tierras para cultivo, a bosques y pastizales.

De acuerdo con lo anterior, se evidencia que son muy diversas las aplicaciones de modelos logit con un enfoque espacial. Entre ellas se encuentran análisis urbanos, evaluación de inversiones en I+D, análisis de sistemas hospitalarios, valor del suelo, análisis del vecindario, efectos ecológicos, valoración de la vegetación, precios de los inmuebles, entre otras.

Específicamente en este artículo, se utilizan modelos de regresión logística ponderada geográficamente, para analizar las probabilidades de que una vivienda ubicada en el barrio Boston (ubicado en Medellín, Colombia) se logre arrendar en menos de tres meses.  El objetivo es presentar un modelo para el mercado de arrendamientos del barrio Boston que permita predecir la probabilidad de que una vivienda usada se alquile en menos de 90 días, incluyendo en la modelación las características espaciales del inmueble. El modelo propuesto es replicable para evaluar la probabilidad de arriendo de un inmueble en un lugar específico de una ciudad, considerando sus características espaciales.

Después de esta introducción, en este artículo se presenta la metodología de modelos de regresión logística ponderada geográficamente. Luego se explican las características del caso de estudio y de los datos empleados; posteriormente se presentan los resultados del estudio, su interpretación, y algunas conclusiones relevantes.

2. Metodología

3. Caso de estudio

3.1 Contexto.

Boston es un barrio de estrato medio ubicado en la comuna La Candelaria, situada en el centro oriente de la ciudad de Medellín, Colombia, que según datos de la alcaldía de la ciudad para 2.010 contaba con 5.649 viviendas, de las cuales el 87% estaban catalogadas como estrato cuatro, el 12% como estrato tres y el restante porcentaje como estrato dos. Los datos más recientes indican que en la comuna 12, en donde se ubica el barrio, habitan 30.488 hogares, de los cuales  13.989 ocupan una vivienda en arriendo o subarriendo.

La estructura urbana del barrio es heterogénea y está conformada de viviendas bifamiliares y trifamiliares antiguas, así como por multifamiliares de construcción más reciente. De igual forma, por estar ubicado en el centro de la ciudad, el barrio cuenta con una cantidad importante de comercio en los primeros niveles de las edificaciones, aunque en su mayoría es comercio de barrio. El barrio limita al norte con el barrio Los Ángeles, al occidente con los barrios La Candelaria y Villanueva, al sur con el barrio Bomboná y al oriente con los barrios Enciso, Sucre y Caicedo.

El barrio Boston cuenta dentro de su entorno con una vía importante en la ciudad: la avenida Oriental, que permite una buena movilidad vehicular en el centro de la ciudad. Boston cuenta con una buena dotación de servicios, entre los cuales se incluyen colegios públicos, universidades,  zonas verdes, zonas deportivas, iglesias y zonas comerciales, entre otras, lo que favorece la demanda de vivienda para compra y alquiler; además, según la Lonja de Propiedad Raíz de Medellín y Antioquia, es una de las zonas en las que más rápidamente se alquila o vende una vivienda usada en la ciudad, con un promedio de tres meses.

La motivación del estudio radica en presentar un modelo de elección binaria espacial para el mercado de arrendamientos del barrio Boston, que permita predecir la probabilidad de que una vivienda usada se alquile en menos de 90 días, dadas las características básicas del inmueble como su área o distancia a una de las vías principales de la ciudad como la avenida oriental.

3.2 Datos utilizados

Para desarrollar el estudio se emplearon datos correspondientes a 125 cánones de arrendamiento de viviendas que se alquilaron durante el año 2015 en el barrio Boston. La muestra representa el 0.41% del total de viviendas del barrio, aunque no todas las viviendas del barrio estaban alquiladas y tampoco todas estaban en oferta de arrendamiento durante 2015.

Los datos utilizados en el trabajo fueron aportados por la Lonja de Propiedad Raíz de Medellín y Antioquia y fueron obtenidos a partir de un recorrido de campo que realiza la empresa en los principales barrios de la ciudad, dado que por la difícil situación de seguridad del país ni los propietarios ni los arrendatarios dan a conocer estas cifras. La metodología de recolección de los datos está basada en ese recorrido de campo que se hace mensualmente, detectando los anuncios de ofertas de venta y arrendamiento de vivienda. Cuando se tiene el dato, se contacta telefónicamente a la empresa o persona que ofrece el inmueble y se indaga por aspectos relacionados con el inmueble en oferta. Cada mes se verifica si el inmueble continúa en oferta o si ya ha sido comercializado. Esta metodología permite obtener datos primarios de buena calidad para realizar un seguimiento al mercado inmobiliario de la ciudad.

Gráfica 1. Plano de la zona


Fuente: elaboración propia con base en el software Mapinfo.

En la Gráfica 1 se observa el plano de la zona, resaltando en un color más oscuro las manzanas que hacen parte del barrio Boston. Cada punto representa un dato de un inmueble arrendado.

Las estadísticas descriptivas de la Tabla 1 muestran la diversidad de las viviendas en arrendamiento de la zona, que incluyen viviendas de entre 25 y 185 metros cuadrados, que estaban ubicadas en algunos casos dentro de copropiedades, las cuales tenían un máximo de 194 viviendas.

Tabla 1. Descripción de la muestra de viviendas.

 

Máximo

Mínimo

Promedio

Tiempo

1

0

N.a.

Inmueble

194

1

97

Área

185

25

105

Inicio Negocio

18

1

9

Distancia

491,9

44,3

259

Fuente: elaboración propia.

3.3  Definición de variables.

En concordancia con los estudios de Bitter, Mulligan y Dall´erba (2007); Lu, Charlton y Fotheringham (2011); Agudelo, Agudelo, Franco, Franco (2015), las variables utilizadas en la modelación son las siguientes:

Tiempo: Es una variable binaria, toma el valor de 1 si el inmueble se alquiló en menos de tres meses y el valor de cero si le tomó más de tres meses arrendarse.

Inmueble: Corresponde al número de inmuebles dentro de la copropiedad en la que se encuentra ubicado el inmueble. Mientras más grandes son las copropiedades mayor posibilidad hay de que pueda arrendarse rápidamente, debido a que las grandes copropiedades del centro tienen zonas comunes más generosas y cuotas de administración menores.

Área: Se refiere al número de metros cuadrados de la vivienda. Mientras mayor sea el área de la vivienda, se espera que tome más tiempo alquilarla.

Inicio Negocio: Hace referencia al mes en el que la vivienda salió en oferta de arrendamiento al mercado, tomando a mayo de 2014 como el primer mes y a noviembre como el último. Mientras más tiempo tenga en el mercado más posibilidades tiene de alquilarse el inmueble.

Distancia: Esta variable hace referencia a la distancia lineal que hay entre la vivienda y el parque del barrio Boston. Habitualmente los hogares prefieren ubicarse a cierta distancia del parque debido a que es una zona netamente comercial que genera ruido. Se espera que a mayor distancia del parque mayor posibilidad de arrendar la vivienda.

A continuación se presentan los resultados obtenidos empleando la metodología de regresiones ponderadas geográficamente, a partir de los cuales se realizan comparaciones y se obtienen las conclusiones.

4. Resultados

Al emplear datos espaciales es necesario verificar la existencia de autocorrelación espacial, para lo cual se utiliza el estadístico conocido como I de Moran. Como se presenta en la Gráfica 2, con un valor p de 0.001, es posible afirmar con un 95% de confianza, que no existe evidencia de la existencia de no autocorrelación espacial de los datos; es decir, deben tenerse en cuenta los efectos espaciales de los datos para realizar el análisis. Para ellos se emplea una matriz de pesos espaciales W, generada con el método K-Nearest neighborhood igual a 4, ya que se asume que cada vivienda considerada tiene cuatro viviendas vecinas, en la muestra, con características similares a ella.

Gráfica 2. Valor p y función de densidad de probabilidad

Fuente: elaboración propia con base en el software GeoDa.

Una vez verificada la existencia relaciones espaciales entre las variables utilizadas, se empleó el programa GWR3 para estimar una regresión logística ponderada geográficamente. Luego de siete iteraciones, como se presenta en la Tabla 2, se obtuvo el siguiente criterio de minimización de Akaike:

Tabla 2. Ancho de Banda

Iteración

Ancho de banda

AICc

1

60.66563152

163.1858901

2

79

159.1525626

3

97.33436848

158.3347626

4

108.6656314

157.29633

5

115.668737

156.6054328

6

119.9968943

156.2547027

7

122.6718427

155.7250369

A partir del modelo de regresión logística geográficamente ponderada se especificaron 125 ecuaciones, en las cuales el 76%, correspondientes a 95 casos, acertaron en los pronósticos de alquiler de la vivienda en menos de tres meses.

Gráfica 3. Resultados

resultados2

Fuente: elaboración propia con base en el software Mapinfo.

La Gráfica 3 muestra las predicciones correctas e incorrectas del modelo. De las 125 predicciones, 95 acertaron en predecir si una vivienda se alquilaba en un tiempo mayor o menor a los tres meses. Los puntos con colores más oscuros muestran las predicciones adecuadas de los modelos, mientras que los puntos más claros corresponden a predicciones incorrectas.

5. Conclusiones

En este trabajo se utilizaron regresiones logísticas geográficamente ponderadas para estudiar la probabilidad de que una vivienda pueda arrendarse en menos de tres meses en el barrio Boston (ubicado en la ciudad de Medellín, Colombia). En este contexto los modelos GWR permiten realizar análisis de datos espaciales, gracias a que permiten evitar los problemas derivados de la heterogeneidad y correlación espacial de los mismos.

Los modelos especificados resultaron ser relevantes en 95 de los 125 casos investigados, mostrando que variables como el número de inmuebles dentro de la copropiedad, la distancia al parque del Boston y la fecha de inicio del negocio, que corresponde al mes en el que la vivienda salió en oferta de arrendamiento al mercado, incrementan la probabilidad de que el inmueble se alquile en menos de tres meses, mientras que la mayor área de las viviendas reduce la probabilidad de que sea alquilado rápidamente.

Futuros trabajos relacionados con el tema, se podrían enfocar en la influencia que tiene sobre el canon de arrendamiento la cercanía a infraestructura pública como parques, metros, o vías muy transitadas.

Referencias

AGUDELO, J. E.; Agudelo, G. A.; Franco, L. C.; Franco, L. E. (2015). Efecto de un estadio deportivo en los precios de arrendamiento de viviendas: una aplicación de regresión ponderada geográficamente (GWR). Ecos de Economía, 19(40), 66-80.

ALCALDÍA DE MEDELLÍN. (2010). Viviendas residenciales estratificadas por comuna y barrio, según estrato. Recuperado de: https://www.medellin.gov.co

ANAS, A. (1990). Taste heterogeneity and urban spatial structure: The logit model and monocentric theory reconciled. Journal of Urban Economics, 28(3), 31 8-335.

AUGUSTIN, N. H.; Cummins, R. P.; French, D. D. (2001). Exploring spatial vegetation dynamics using logistic regression and a multinomial logit model. Journal of Applied Ecology, 38(5), 991-1006.

AUTANT-BERNARD, C. (2006). Where do firms choose to locate their R&D? A spatial conditional logit analysis on french data. European Planning Studies, 14(9), 1187-1208.

BHAT, C. R.; Sener, I. N. (2009). A copula-based closed-form binary logit choice model for accommodating spatial correlation across observational units. Journal of Geographical Systems, 11(3), 243-272.

BASU, S.; Thibodeau, TG. (1998). Analysis of spatial autocorrelation in house prices. The Journal of Real Estate Finance and Economics, 17:61-85.

BEATY, J. (1952). Rental real estate often a good investment. Med Econ. 5(6): 93 – 94.

BITTER, C.; Mulligan, G.; Dall'erba, S. (2007). Incorporating spatial variation in housing attribute prices: a comparison of geographically weighted regression and the spatial expansion method. Journal of Geographical Systems, 9(1): 7-27.

CARL, G., & Kühn, I. (2007). Analyzing spatial autocorrelation in species distributions using gaussian and logit models. Ecological Modelling, 207(2-4), 159-170.

DEWEY, L.; DeTuro, P. (1950). Should I invest in real estate? Med Econ. 28(3): 85 – 93.

LANCASTER, K. (1966). A new approach to consumer theory. Journal of Political Economy. 74(1):132 – 157.

LEE, H. L.; Cohen, M. A. (1985). A multinomial logit model for the spatial distribution of hospital utilization. Journal of Business and Economic Statistics, 3(2), 159-168.

LI, M.; Wu, J.; Deng, X. (2013). Identifying drivers of land use change in china: A spatial multinomial logit model analysis. Land Economics, 89(4), 632-654.

LU, B.; Charlton, M.; Fotheringham, A. S. (2011) Geographically Weighted Regression Using a Non-Euclidean Distance Metric with a Study on London House Price Data. Procedia Environmental Sciences, 7, 92-97.

ROSEN, S. (1974). Hedonic prices and implicit markets: product differentiation and pure competition. Journal of Political Economy. 82: 34 – 55.

SELIM, H. (2009). Determinants of house prices in Turkey: Hedonic regression. Expert Systems with Applications, 36 (2), pp. 2843–2845.

SHEPPARD, S. (1999). Hedonic analysis of housing markets. En: P.C. Cheshire, E.S. Mills (Eds.), Handbook of regional and Urban Economics, vol. 3, pp. 1595–1635 North Holland, Amsterdam.

VENEGAS-MARTÍNEZ, F.; Agudelo, G.A.; Franco, L.C.; Franco, L.E. (2016). Precio del dólar estadounidense en el mundo Procesos de Itô económicamente ponderados en un análisis espacial. Economía y Sociedad. 42 (20). 83-105. México.

YU, D. (2004). Modeling housing market dynamics in the city of Milwaukee: a geographically weighted regression approach. En internet: http://www.ucgis.org/ucgisfall2004/studentpapers/files/danlinyu.pdf

ZHOU, B.; Kockelman, K. M. (2008). Neighborhood impacts on land use change: A multinomial logit model of spatial relationships. Annals of Regional Science, 42(2), 321-340.


1. Departamento de Finanzas, Instituto Tecnológico Metropolitano – ITM. Correo electrónico: albertoagudelo@itm.edu.co

2. Departamento de Finanzas, Instituto Tecnológico Metropolitano – ITM. Correo electrónico: luisfranco@itm.edu.co

3. Departamento de Finanzas, Instituto Tecnológico Metropolitano – ITM. Correo electrónico: luisefranco@itm.edu.co


Revista ESPACIOS. ISSN 0798 1015
Vol. 38 (Nº 18) Año 2017

[Índice]

[En caso de encontrar algún error en este website favor enviar email a webmaster]

©2017. revistaESPACIOS.com • Derechos Reservados