La regresión nos ayuda a entender la relación entre variables y predecir el futuro. Regresión Lineal Simple
La ciencia de datos es un campo lleno de algoritmos complejos. Sin embargo, la base de todo el éxito real es la estadística. Muchos programadores aprenden a usar librerías de Python sin entender los datos. Esto es un error grave.
Cuando los datos no son normales o hay outliers, usamos pruebas como Mann-Whitney U o Kruskal-Wallis:
Bootstrap es una técnica de remuestreo muy útil: La regresión nos ayuda a entender la relación
tiempo_antes = [125, 130, 128, 132, 129, 127] tiempo_despues = [118, 115, 120, 119, 117, 116]
import statsmodels.api as sm import pandas as pd
Dos conjuntos de datos con la misma media y varianza pueden tener distribuciones visualmente opuestas (como lo demuestra el Cuarteto de Anscombe). Muchos programadores aprenden a usar librerías de Python
): Indica el porcentaje de la variabilidad de la variable dependiente que es explicado por el modelo.
scaler = StandardScaler() X_train_scaled = scaler.fit_transform(X_train) # Ajusta en train X_test_scaled = scaler.transform(X_test) # Solo transforma en test
print(f"MAE: mean_absolute_error(y_test, y_pred):.2f") print(f"R² en prueba: r2_score(y_test, y_pred):.3f") ): Indica el porcentaje de la variabilidad de
La visualización de datos es fundamental para comunicar hallazgos estadísticos. En 2026, el ecosistema de Python ha madurado, y la elección de la librería depende del objetivo.
The book " Estadística Práctica para Ciencia de Datos con R y Python
Saber qué tan dispersos están los datos es tan importante como conocer su centro.