1️⃣ Introducción
En el presente trabajo se realizó un análisis exploratorio y de segmentación sobre un dataset que contiene información de distintos tipos de delitos en los estados de Estados Unidos.
El dataset incluye las siguientes variables:
El objetivo principal fue:
- Analizar los niveles de criminalidad.
- Identificar patrones entre estados.
- Aplicar técnicas de clustering (K-Means) para segmentar los estados según su perfil delictivo.
- Visualizar geográficamente los resultados.
2️⃣ Descripción del Dataset
Cada fila representa un estado de EE.UU. y contiene métricas relacionadas con delitos violentos. Las variables numéricas representan tasas o cantidades relativas de delitos.
| Estado | Asesinatos | Asaltos | Pob. Urbana | Violaciones |
|---|---|---|---|---|
| Alabama | 13.2 | 236 | 58 | 21.2 |
| Alaska | 10.0 | 263 | 48 | 44.5 |
| Arizona | 8.1 | 294 | 80 | 31.0 |
3️⃣ Metodología Aplicada
🔹 3.1 Selección de Variables
Para el clustering inicial se utilizaron:
Estas dos variables representan delitos violentos y permiten observar patrones claros de peligrosidad.
🔹 3.2 Determinación del Número Óptimo de Clusters
Se implementó una función para determinar el número ideal de clusters utilizando el método del codo (Elbow Method). Este método evalúa la variación intra-cluster (inercia) a medida que aumenta el número de clusters.
Resultado:
Se determinó que 3 clusters representan una segmentación adecuada del dataset.
🔹 3.3 Aplicación de K-Means
Se aplicó el algoritmo K-Means con:
- k: 3
- Variables: Asesinatos y Asaltos
El resultado permitió dividir los estados en tres grupos diferenciados según su nivel de criminalidad violenta.
4️⃣ Análisis de Resultados
Baja Criminalidad
- Estados con tasas relativamente bajas de asesinatos y asaltos.
- Representan zonas con menor nivel de violencia.
- Posible correlación con menor densidad urbana o mejores condiciones socioeconómicas.
Criminalidad Media
- Estados con valores intermedios.
- Perfil mixto: algunos delitos más elevados pero no extremos.
- Grupo de transición entre baja y alta peligrosidad.
Alta Criminalidad
- Estados con altos niveles de asesinatos y asaltos.
- Representan las regiones más violentas del dataset.
- Probablemente asociados a grandes centros urbanos o mayor desigualdad social.
5️⃣ Visualización Geográfica
Se realizó una representación mediante mapa, coloreando los estados según el cluster asignado. Esto permitió:
- Identificar patrones regionales.
- Detectar concentraciones geográficas de alta criminalidad.
- Visualizar cómo se distribuye la peligrosidad en el territorio estadounidense.
Insight importante:
La criminalidad no se distribuye uniformemente; existen zonas claramente más críticas que otras.
6️⃣ Procesamiento Adicional
Durante el análisis también se prepararon los datos de la siguiente manera:
- Incorporó el código de cada estado.
- Eliminó columnas irrelevantes para el análisis.
- Preparó el dataset para visualización geográfica.
7️⃣ Conclusiones y Recomendaciones
Conclusiones
- Es posible segmentar los estados según su perfil delictivo utilizando técnicas de clustering.
- Existen tres niveles bien diferenciados de criminalidad.
- Los delitos de asesinatos y asaltos son suficientes para detectar patrones estructurales.
- La visualización geográfica mejora significativamente la interpretación de los resultados.
- La técnica K-Means es adecuada para este tipo de análisis exploratorio.
Próximos Pasos
- Incluir más variables (por ejemplo, Violaciones y Población Urbana) para un clustering más completo.
- Normalizar todas las variables si se agregan más dimensiones.
- Aplicar PCA para reducción de dimensionalidad.
- Comparar con otros algoritmos (DBSCAN, Clustering Jerárquico).
- Realizar análisis temporal si se dispone de datos históricos.