Cómo construir tu primer modelo de machine learning en Python

La inteligencia artificial y el machine learning están revolucionando diversas industrias, y aprender a construir modelos de machine learning es una habilidad invaluable en la actualidad. En este artículo, te guiaré a través del proceso para crear tu primer modelo de machine learning utilizando Python. Cubriremos desde la instalación de las herramientas necesarias hasta la evaluación del modelo.

¿Qué es el Machine Learning?

El machine learning, o aprendizaje automático, es una rama de la inteligencia artificial que se enfoca en la creación de algoritmos que permiten a las computadoras aprender a partir de datos. Esto significa que, en lugar de programar una computadora para que realice una tarea específica, se le permite aprender de datos existentes y tomar decisiones basadas en patrones.

Requisitos previos

Antes de comenzar, asegúrate de tener instalado Python en tu sistema. También necesitarás un entorno de desarrollo como Jupyter Notebook o cualquier IDE que prefieras.

Instalación de Python

Puedes descargar Python desde su sitio oficial. Asegúrate de instalar la versión 3.x, ya que es la versión recomendada.

Instalación de bibliotecas necesarias

Para construir tu modelo de machine learning, necesitaremos algunas bibliotecas populares. Abre una terminal y ejecuta los siguientes comandos:

pip install numpy pandas scikit-learn matplotlib seaborn

Paso 1: Importar las bibliotecas

Una vez que tengas todo instalado, abre tu entorno de desarrollo y comienza importando las bibliotecas necesarias.

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score

Paso 2: Cargar el conjunto de datos

Para este tutorial, utilizaremos un conjunto de datos de muestra. Un clásico es el conjunto de datos de precios de viviendas de Boston. Puedes usar el siguiente código para cargarlo:

Lee también

¿Qué es Django Framework Python?

Automatización de tareas con Python Ejemplos prácticos

from sklearn.datasets import load_boston

data = load_boston()
boston = pd.DataFrame(data.data, columns=data.feature_names)
boston['MEDV'] = data.target

Explorando los datos

Es importante entender los datos antes de construir un modelo. Utiliza el siguiente código para explorar el conjunto de datos:

print(boston.head())
print(boston.describe())

Paso 3: Preprocesar los datos

La limpieza y preparación de los datos son cruciales para el éxito de tu modelo.

Manejo de datos faltantes

Verifica si hay datos faltantes y, si es necesario, realiza una imputación.

print(boston.isnull().sum())

Dividir el conjunto de datos

Divide el conjunto de datos en características (features) y etiquetas (target):

X = boston.drop('MEDV', axis=1)
y = boston['MEDV']

Separar datos de entrenamiento y prueba

Divide los datos en un conjunto de entrenamiento y un conjunto de prueba:

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

Paso 4: Construir el modelo

Ahora podemos construir nuestro modelo de regresión lineal:

model = LinearRegression()
model.fit(X_train, y_train)

Paso 5: Hacer predicciones

Una vez que el modelo está entrenado, podemos hacer predicciones sobre los datos de prueba:

y_pred = model.predict(X_test)

Paso 6: Evaluar el modelo

Es esencial evaluar el rendimiento del modelo utilizando métricas adecuadas. Usaremos el error cuadrático medio (MSE) y el coeficiente de determinación (R²) para evaluar nuestro modelo:

mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)

print(f'MSE: {mse}')
print(f'R²: {r2}')

Paso 7: Visualizar los resultados

Una buena visualización siempre ayuda. Utiliza el siguiente código para graficar las predicciones frente a los valores reales:

plt.scatter(y_test, y_pred)
plt.xlabel('Valores Reales')
plt.ylabel('Predicciones')
plt.title('Predicción vs Realidad')
plt.show()

Conclusión

Has completado tu primer modelo de machine learning en Python. Desde la instalación de las bibliotecas hasta la evaluación del modelo, has aprendido los pasos fundamentales para construir un modelo de machine learning.

Recuerda que la práctica es esencial, así que experimenta con diferentes conjuntos de datos y algoritmos para mejorar tus habilidades.