Análisis de datos: Aerolíneas y satisfacción

Este proyecto consiste en un análisis de datos centrado en la satisfacción de clientes de aerolíneas, desarrollado en Python mediante un notebook de Jupyter. Forma parte de una práctica académica para la asignatura de Inteligencia Artificial del grado en Ingeniería Informática.

El objetivo principal es explorar el dataset, procesarlo adecuadamente y aplicar técnicas de análisis y aprendizaje automático para extraer conclusiones relevantes.

📊 Contenido del proyecto

🔹 1. Carga y exploración de datos

  • Uso de librerías como pandas, numpy, matplotlib y seaborn.
  • Inspección inicial del dataset (info, conteo de valores nulos).
  • Identificación y limpieza de datos (NaN).

🔹 2. Preprocesamiento

  • Eliminación o tratamiento de valores faltantes.
  • Transformación de variables categóricas mediante Label Encoding.
  • Conversión de atributos como:
    • Clase del vuelo (Eco, Eco Plus, Business)
    • Género, tipo de cliente, etc.

🔹 3. Análisis Exploratorio (EDA)

  • Estudio de la distribución de variables.
  • Visualización de relaciones entre características.
  • Identificación de patrones en la satisfacción del cliente.

🔹 4. Normalización de datos

  • Uso de MinMaxScaler para escalar variables.
  • Preparación de los datos para algoritmos de clustering.

🔹 5. Modelado con Machine Learning

  • Aplicación de K-Means para segmentación de clientes.
  • Reducción de dimensionalidad con PCA (Análisis de Componentes Principales).
  • Visualización de clusters y análisis de resultados.

🧠 Tecnologías utilizadas

  • Python
  • Jupyter Notebook
  • Pandas y NumPy
  • Matplotlib y Seaborn
  • Scikit-learn (KMeans, PCA, preprocessing)

🎯 Objetivo

Analizar los factores que influyen en la satisfacción de los clientes de aerolíneas y agruparlos en diferentes segmentos mediante técnicas de clustering, facilitando la interpretación de patrones de comportamiento.