VerifAI Source: IA con conocimiento verificable y trazabilidad documental

Sistema de inteligencia artificial basado en RAG que permite consultar documentos en lenguaje natural, generando respuestas con citas verificables y trazabilidad de la información.

#Inteligencia Artificial #NLP #RAG #Python
VerifAI Source: IA con conocimiento verificable y trazabilidad documental

Descripción del problema

Los modelos de lenguaje actuales presentan limitaciones críticas en entornos académicos y profesionales, como la falta de confiabilidad, la ausencia de citas verificables y la generación de información no trazable. Esto dificulta el uso de IA en contextos donde la precisión y la validación de la información son esenciales.

Solución propuesta

Se desarrolló VerifAI Source, un sistema de inteligencia artificial que permite consultar documentos en lenguaje natural y obtener respuestas con citas verificables (documento y página), garantizando trazabilidad y reduciendo el riesgo de desinformación. 

Arquitectura del sistema

El sistema sigue un enfoque basado en RAG (Retrieval-Augmented Generation), donde la IA no responde de forma generalista, sino que utiliza información recuperada de documentos del usuario.
El flujo principal incluye:
  •  Carga y procesamiento de documentos PDF 
  •  Fragmentación e indexación de contenido 
  •  Búsqueda de fragmentos relevantes 
  •  Generación de respuestas mediante IA 
  •  Inclusión de citas verificables 
Esta arquitectura permite mantener control sobre la información y mejorar la precisión de las respuestas. 

Funcionalidades principales

  •  Consulta de documentos mediante lenguaje natural 
  •  Generación de respuestas con citas verificables
  •  Detección de falta de evidencia (“Información insuficiente”
  •  Interfaz web tipo chat para interacción con el sistema 
  •  Procesamiento y análisis de múltiples documentos 

Metodología de desarrollo

El proyecto se desarrolló bajo un enfoque estructurado que integra:
  • Design Thinking para identificación del problema y necesidades del usuario 
  • Lean Startup para validación del MVP 
  • Scrum para organización del desarrollo en sprints 
Esto permitió iterar rápidamente y enfocar el desarrollo en funcionalidades clave del sistema.

Impacto

El sistema permite transformar colecciones de documentos en una base de conocimiento interactiva, aplicable en:
  •  Investigación académica 
  •  Consultoría profesional 
  •  Análisis documental especializado 
Contribuyendo a mejorar la confianza, precisión y trazabilidad en el uso de inteligencia artificial.

------------------------------------------------------------------------------------

Repositorio en GitHub: https://github.com/jangelmm/DecSpark-HackaTec-Regional-ITO-2025