Análisis de Criminalidad | Nicolás Guitlein

1️⃣ Introducción

En el presente trabajo se realizó un análisis exploratorio y de segmentación sobre un dataset que contiene información de distintos tipos de delitos en los estados de Estados Unidos.

El dataset incluye las siguientes variables:

Estado Asesinatos Asaltos Población Urbana (%) Violaciones

El objetivo principal fue:

Analizar los niveles de criminalidad.
Identificar patrones entre estados.
Aplicar técnicas de clustering (K-Means) para segmentar los estados según su perfil delictivo.
Visualizar geográficamente los resultados.

2️⃣ Descripción del Dataset

Cada fila representa un estado de EE.UU. y contiene métricas relacionadas con delitos violentos. Las variables numéricas representan tasas o cantidades relativas de delitos.

Ejemplo de estructura del dataset:
Estado	Asesinatos	Asaltos	Pob. Urbana	Violaciones
Alabama	13.2	236	58	21.2
Alaska	10.0	263	48	44.5
Arizona	8.1	294	80	31.0

3️⃣ Metodología Aplicada

🔹 3.1 Selección de Variables

Para el clustering inicial se utilizaron:

Asesinatos Asaltos

Estas dos variables representan delitos violentos y permiten observar patrones claros de peligrosidad.

🔹 3.2 Determinación del Número Óptimo de Clusters

Se implementó una función para determinar el número ideal de clusters utilizando el método del codo (Elbow Method). Este método evalúa la variación intra-cluster (inercia) a medida que aumenta el número de clusters.

Resultado:

Se determinó que 3 clusters representan una segmentación adecuada del dataset.

🔹 3.3 Aplicación de K-Means

Se aplicó el algoritmo K-Means con:

k: 3
Variables: Asesinatos y Asaltos

El resultado permitió dividir los estados en tres grupos diferenciados según su nivel de criminalidad violenta.

4️⃣ Análisis de Resultados

Baja Criminalidad

Estados con tasas relativamente bajas de asesinatos y asaltos.
Representan zonas con menor nivel de violencia.
Posible correlación con menor densidad urbana o mejores condiciones socioeconómicas.

Criminalidad Media

Estados con valores intermedios.
Perfil mixto: algunos delitos más elevados pero no extremos.
Grupo de transición entre baja y alta peligrosidad.

Alta Criminalidad

Estados con altos niveles de asesinatos y asaltos.
Representan las regiones más violentas del dataset.
Probablemente asociados a grandes centros urbanos o mayor desigualdad social.

5️⃣ Visualización Geográfica

Se realizó una representación mediante mapa, coloreando los estados según el cluster asignado. Esto permitió:

Identificar patrones regionales.
Detectar concentraciones geográficas de alta criminalidad.
Visualizar cómo se distribuye la peligrosidad en el territorio estadounidense.

Insight importante:

La criminalidad no se distribuye uniformemente; existen zonas claramente más críticas que otras.

6️⃣ Procesamiento Adicional

Durante el análisis también se prepararon los datos de la siguiente manera:

Incorporó el código de cada estado.
Eliminó columnas irrelevantes para el análisis.
Preparó el dataset para visualización geográfica.

7️⃣ Conclusiones y Recomendaciones

Conclusiones

Es posible segmentar los estados según su perfil delictivo utilizando técnicas de clustering.
Existen tres niveles bien diferenciados de criminalidad.
Los delitos de asesinatos y asaltos son suficientes para detectar patrones estructurales.
La visualización geográfica mejora significativamente la interpretación de los resultados.
La técnica K-Means es adecuada para este tipo de análisis exploratorio.

Próximos Pasos

Incluir más variables (por ejemplo, Violaciones y Población Urbana) para un clustering más completo.
Normalizar todas las variables si se agregan más dimensiones.
Aplicar PCA para reducción de dimensionalidad.
Comparar con otros algoritmos (DBSCAN, Clustering Jerárquico).
Realizar análisis temporal si se dispone de datos históricos.