Cómo crear tu propio asistente virtual con Python y reconocimiento de voz

La creación de un asistente virtual personalizado puede ser un proyecto muy gratificante y educativo. Utilizando Python, un lenguaje de programación versátil y fácil de aprender, junto con técnicas de reconocimiento de voz, puedes diseñar un asistente que te ayude en tus tareas diarias. En este artículo, te guiaré a través de los pasos necesarios para crear tu propio asistente virtual con Python.

¿Qué es un asistente virtual?

Un asistente virtual es un software que puede realizar tareas específicas o servicios a través de comandos de voz. Estos asistentes utilizan tecnologías de procesamiento de lenguaje natural para entender y responder a las solicitudes del usuario. Algunos ejemplos conocidos son Siri, Google Assistant y Alexa.

Herramientas y bibliotecas necesarias

Para crear tu asistente virtual, necesitarás instalar algunas bibliotecas de Python. A continuación, se enumeran las herramientas que utilizarás en este proyecto:

1. Python

Asegúrate de tener Python instalado en tu sistema. Puedes descargarlo desde python.org.

2. Pip (gestor de paquetes de Python)

Asegúrate de tener pip instalado para gestionar las bibliotecas de Python. Viene instalado por defecto con las versiones recientes de Python.

3. Bibliotecas necesarias

Utilizaremos las siguientes bibliotecas:

SpeechRecognition: Para el reconocimiento de voz.
PyAudio: Para trabajar con audio.
gTTS (Google Text-to-Speech): Para la síntesis de voz.
datetime: Para gestionar fechas y horas.

Puedes instalar las bibliotecas necesarias ejecutando el siguiente comando en tu terminal:

Lee también

Cómo preparar tu entorno de desarrollo para Machine Learning con Python

¿Qué es la Programación? Guía para principiantes

pip install SpeechRecognition pyaudio gTTS

Creando el asistente virtual

Ahora que tienes todas las herramientas necesarias, es hora de empezar a programar tu asistente virtual. A continuación, te presento un ejemplo básico de código que puedes utilizar como punto de partida.

Código del Asistente Virtual

import speech_recognition as sr
import pyttsx3
from gtts import gTTS
import os
from datetime import datetime

# Inicializa el motor de síntesis de voz
engine = pyttsx3.init()

def speak(text):
    """Función para convertir texto a voz."""
    engine.say(text)
    engine.runAndWait()

def greet_user():
    """Función para saludar al usuario."""
    hour = datetime.now().hour
    if hour < 12:
        speak("Buenos días")
    elif hour < 18:
        speak("Buenas tardes")
    else:
        speak("Buenas noches")
    speak("Soy tu asistente virtual. ¿En qué puedo ayudarte hoy?")

def listen_command():
    """Función para escuchar el comando del usuario."""
    r = sr.Recognizer()
    with sr.Microphone() as source:
        r.adjust_for_ambient_noise(source)
        print("Escuchando...")
        audio = r.listen(source)

    try:
        command = r.recognize_google(audio, language='es-ES')
        print("Usuario:", command)
        return command.lower()
    except sr.UnknownValueError:
        speak("Lo siento, no entendí lo que dijiste.")
        return ""
    except sr.RequestError:
        speak("Error de conexión al servicio de reconocimiento de voz.")
        return ""

def process_command(command):
    """Función para procesar los comandos reconocidos."""
    if "hola" in command:
        greet_user()
    elif "hora" in command:
        current_time = datetime.now().strftime("%H:%M")
        speak(f"La hora actual es {current_time}.")
    elif "adiós" in command or "salir" in command:
        speak("Hasta luego, que tengas un buen día.")
        exit()
    else:
        speak("Lo siento, no puedo ayudar con eso.")

if __name__ == "__main__":
    greet_user()
    while True:
        command = listen_command()
        process_command(command)

Descripción del código

Función speak: Convierte texto a voz utilizando el motor de síntesis de voz.
Función greet_user: Saluda al usuario de acuerdo a la hora del día.
Función listen_command: Escucha el comando del usuario y lo convierte en texto.
Función process_command: Procesa el comando recibido y ejecuta la acción correspondiente.

Ejecución del asistente

Guarda el código en un archivo llamado asistente_virtual.py y ejecútalo con el siguiente comando en la terminal:

python asistente_virtual.py

Mejora tu asistente virtual

Una vez que tengas un asistente básico funcionando, puedes mejorar sus capacidades añadiendo más comandos y funcionalidades. Algunas ideas incluyen:

Responder preguntas sobre la actualidad.
Agregar recordatorios o alarmas.
Abrir aplicaciones en tu computadora.
Proporcionar información sobre el clima.

Conclusión

Crear tu propio asistente virtual con Python y reconocimiento de voz es un proyecto emocionante que te permite aprender sobre programación, procesamiento de voz y más. A medida que continúes mejorando tu asistente, podrás explorar nuevas tecnologías y expandir tus habilidades en programación. ¡No dudes en experimentar y agregar nuevas funcionalidades para hacerlo aún más útil!