· Panel de opciones

Cajamar University Hack 2018

El proyecto

El objetivo principal del proyecto es ofrecer una plataforma de visualización de datos que conforme una herramienta rápida y potente de extracción de información, que permita la obtención de conclusiones relevantes y que permita a sus usuarios una mejora significativa en su toma de decisiones.

¿Qué código postal acumula el mayor gasto en hipermercados?

¿Cuál es la distribución del gastos en las franjas horarias?

¿Qué consumen los diferentes grupos poblacionales?

¿A quién va dirigido?


Negocios

Realizar rápidos estudios de mercado, analizar el comportamiento de los comercios y clientes por zonas poblacionales y pudiendo segmentar el target mediante rentas, sexo o edad para permitir ajustar la toma de decisiones. De esta manera, se le ofrece a las empresas un método que les permite conocer de forma rápida los movimientos de sus potenciales clientes para reaccionar de forma ágil a posibles cambios de mercado.


Clientes

Proporciona una herramienta que actúe como guía para la elección de zonas de residencia en función de los intereses y del comportamiento de las zonas poblacionales en función de sus comercios.


Particulares

La elección de la zona donde situar tu comercio no es sencilla y es una decisión que puede influir en el éxito de un negocio. Con nuestra plataforma facilitamos el estudio y toma de decisiones a partir del estudio del comportamiento de la población dependiendo de las zonas en las que compran y la segmentación e estas compras dependiendo de variablas demográficas, del sector de gasto y de variables económicas.

¿Cómo se ha desarrollado esta herramienta?

La herramienta para el análisis de datos esta principalmente contruida sobre el lenguaje de programación R. Su desarrollo se ha realizado mediante Shiny. Para adecuación, segmentación y visualización de los datos se han utilizado diversos paquetes como son:

Equipo SenseIII

Alberto Oteo García

Graduado en Matemáticas y estudiante del Máster en Ciencia de Datos en la Universidad de Valencia. Alberto es un apasionado del estudio de los modelos de aprendizaje máquina y deep learning en el cual ha encontrado un campo donde la tecnología y las matemáticas se enlazan. Empezó en el mundo de los datos durante unas prácticas extracurriculares y hasta la fecha ha trabajado en múltiples proyectos con datos médicos y económicos.

Julián Ballesteros García

Graduado en Ingeniería Electrónica de Telecomunicación y estudiante del Máster en Ciencia de Datos en la Universidad de Valencia. Julián es un experto en visualización con un talento natural para encontrar la mejor manera de representar los datos. Un trabajador incansable que descubrió este mundo buscando algo que hacer un verano y donde ha encontrado un entorno en el que se desenvuelve con facilidad.

Visualiza información sobre la Región de Murcia

Información general sobre los codigos postales.

· Filtros

a

¿Quiéres saber más?

Despliega los gráficos que te interesen

¿Qué número de operaciones tienen esos comercios?

¿A dónde van a comprar esos clientes?

¿Cómo se comportan esos comercios en el tiempo?

¿Cómo se comportan esos clientes en el tiempo?

Pulsa para descargar!
Download

CONCLUSIONES

SENSEIII


Los estudios de mercado son habitualmente costosos y requieren un trabajo duro por parte de empleados para obtener conclusiones significativas. Mediante el uso de esta herramienta se ofrece y permite extraer resultados de relevancia en relación al comportamiento y flujo de las transacciones con trajeta de crédito de la entidad Cajamar. Estos resultados se obtienen de manera rápida, sencilla, interactiva y sobre todo flexible para adaptarse a las necesidades del usuario y sus segmentos de búsqueda.

A continuación se presentan algunos de los resultados que la herramienta diseñada por Sense III permite obtener a sus usuarios. Sin embargo, el verdadero potencial que ofrece la aplicación no solo es el variado catálogo de gráficas, algunas de las cuales se muestran a continuación, si no la capacidad de relacionarlas y su flexibilidad a la hora de buscar y encontrar los detalles que más le interesan al usuario de una manera interactiva.


RESULTADOS GENERALES

Mediante una primera exploración de los datos se pueden obtener resultados generales facilmente interpretables y de utilidad. La siguiente gráfica muestra el importe total de las transacciones realizadas por sector donde el tamaño de los círculos representa el importe total de las transacciones. Podemos observar un predominio de sector de ALIMENTACIÓN seguido por los sectores de MODA Y COMPLEMENTOS, HIPERMERCADOS y OTROS.
De la misma forma, una pasada rápida nos muestra resultados significativos sobre todo el el comportamiento y distibución de los ingresos de los códigos postales. El código postal 30009 es el código postal con un mayor número de ingresos acumulado y se diferencia del resto pricipalmente por la gran cantidad de ingresos en hipermercados que recibe. También se observa como la recepción mayoritaria de ingresos en el sector AUTOMOVILÍSTICO se produce en los códigos postales 30007 y 30100.

También podemos encontrar y clasificar a los diferentes códigos postales en función del gasto de sus clientes. Es una tarea relativamente fácil y rápida mediante el uso de la herramienta que el equipo de Sense III ha desarrollado. A continuación se muestra una comparación entre los 16 códigos postales de comercios y los 25 códigos postales de clientes que mayor gasto realizan. Aquí se puede observar como hay zonas de gran recepción de ingresos y donde sus residentes realizan un gran gasto. Sin embargo, hay zonas con una tendencia receptora como el CP 30001 con una cantidad notable de ingresos que en cambio tiene unos residentes con menor gasto ya sea porque es un código postal pequeño o porque sus residentes no realizan mucho gasto.


COMPORTAMIENTO DE LOS CLIENTES

La segmentación de la población y la elección del target es tan o más importante que la localización de tu negocio. Por ello, entender y estudiar el comportamiento de los potenciales clientes es un factor clave para el éxito. ¿A quién buscar dirigirte?, ¿Cuáles son sus intereses?, ¿En qué sector gastan su dinero tus potenciales clientes?. Mediante el uso de esta herramieta podemos encontrar las tendencias de los diferentes segmentos en la población, por ejemplo la tendencia entre el grupo de JOVENES y ADULTOS es similar aunque este segundo grupo tenga un mayor nivel adquisitivo.

NOTA: En los filtados por sexo, edad o renta se han eliminado para ajustar las transacciones a segmento poblacional correcto con absoluta precisión.

También podemos conocer cuales son las horas de mayor gasto, donde focalizar nuestros esfuerzos a la hora de atraer potenciales clientes ya que se observa una clara tendencia a realizar la mayoría de compras entre las 12-14h y las 18-20h.


¿A que segmento de la población tengo que dirigirme?, ¿Lo sabes y has decidido el perfil de tus clientes potenciales?, ¿Son los únicos?, ¿Existen segmentos o grupos diferentes con hábitos de consumo similares?
Esta plataforma implementa técnicas de machine learning para agrupar segmentos de poblacionales con los mismos hábitos de consumo. Se observan 4 grupos poblacionales distintos en función tanto de sus hábitos de consumo como de la cantidad de gasto que realizan. Los dos grupos dominantes tienen unos hábitos de consumo notablemente diferenciados con fuertes picos en algunos sectores. Se observa un comportamiento como consumidores claramente diferente asociados a una separación por sexo entre el grupo catalogado como adultos. Por otro lado identificamos 2 agrupaciones más caracterizadas por un menor gasto y con un comportamiento más estable entre todos los sectores, siendo los pensionistas el grupo mas equilibrado. También observamos como los jovenes se presentan como una agrupación itermedia entre adultos y pensionistas.




CLUSTER 1:

-Mujeres de renta media adultas
-Mujeres de renta baja adultas
-Mujeres de renta alta adultas


CLUSTER 3:

-Hombres de renta media adultos
-Hombres de renta alta adultos
-Hombres de renta baja adultos



CLUSTER 2:

-Hombres de renta media jovenes
-Hombres de renta baja jovenes
-Mujeres de renta media jovenes
-Mujeres de renta baja jovenes
-Mujeres de renta alta adultas


CLUSTER 4:

-Hombres de renta alta jovenes
-Hombres de renta media pensionistas
-Hombres de renta alta pensionistas
-Hombres de renta baja pensionistas
-Mujeres de renta alta jovenes
-Mujeres de renta baja pensionistas
-Mujeres de renta alta pensionistas
-Mujeres de renta media pensionistas


COMPORTAMIENTO DE LOS COMERCIOS

Otro de los factores a cosiderar es si un código postal es receptor o en cambio es emisor de clientes. Aunque el flujo de transacciones suele ser mayor en ingresos que es gastos debido a que el número de codigos postales de clientes que se estudian es mayor que el de comercios observamos diferencias significativas. Por ejemplo, el código postal 30007 tiene un fuerte carácter de foco receptor de clientes y no solo eso si no que los clientes residentes tiene tendencia a quedarse a comprar. Sin embargo el 30001 gasta casi tanto en su propia zona como en el CP 30009. Mediante el uso de esta herramienta tamién encontramos códigos postales principalmente emisores como el 30151 que realiza la mayor parte de sus compras fuera de su zona.


FUTURO DE LA APLICACIÓN

Desde SENSE III estamos convencidos que el potencial de crecimiento de esta aplicación es muy grande por la gran capacidad que tienen los lenguajes de programación utilizados como R y Python y por el potencial que tienen los datos. Hasta la fecha el proyecto se ha centrado en exprimir los datos para su visualización y poder obtener resultados significativos de las gráficas, pero también se han planteado otros objetivos que darían un salto de calidad al proyecto en muchos aspectos.

·PREDICCIÓN DE SERIES TEMPORALES·

Durante la realización del proyecto hemos podido observar comportamientos bastante regulares en el gasto en la mayoría de los sectores. Uno de los posibles caminos a tomar en un futuro sería predecir el comportamieto a futuro de los gastos en cada uno de los sectores mediante técnicas de machine learning que han demostrado ya su eficacia, véanse los XGBoost o incluso aplicando deep learning como puede ser el uso de redes neuronales recurrentes.
Poder predecir el comportamiento a futuro de los diferentes sectores supondría un factor clave y creemos que de éxito para la toma de decisiones de las empresas.

·RECOMENDADOR DE LOCALIZACIÓN·

Ya se ha hablado durante el proyecto sobre la importancia de la localización del negocio o la empresa, por ello desde SENSE III planteamos la idea de implementar un recomendador que tenga en cuenta variables como la evolución del mercado en el sector indicado, el numero de competidores por localización, el poder adquisitivo de los clientes y/o potenciales clientes, etc. Creemos que es otro de los objetivos alcanzables y que darían un salto de calida como herramienta de soporte en la toma de decisiones de los usuarios.

·GENERADOR DE INFORMES·

Otro de los puntos que consideramos claves es dar facilidad al usuario de poder generar un informe con todo aquella información que considere clave y que haya extraído a partir de nuestra herramienta. Para ello, a partir del compilador de R studio somos capaces de exportar nuestros informes a HTML, manteniendo las propiedades interactivas de los gráficos, a PDF o a WORD dependiendo de los gustos del usuario. Además, mediante CSS se puede ofrecer una gama de modelos de informes de manera que la herramienta diseñada sea lo más user friendly posible.