Arquitectura Semántica Local de Alta Precisión - SuperAgente FAQ System

Blog
  • By-Sebastián Jaramillo

  • 3 weeks ago

Arquitectura Semántica Local de Alta Precisión - SuperAgente FAQ System

En un mundo donde la mayoría de los sistemas de IA dependen de la nube, Xerebria Technologies decidió tomar un camino distinto: crear inteligencia local.
El resultado fue SuperAgente, un sistema semántico capaz de comprender y responder preguntas humanas con precisión casi humana, sin depender de ningún servicio externo.


Esta arquitectura logra más de 97 % de exactitud en preguntas tipo FAQ institucionales, corriendo íntegramente sobre infraestructura propia.
Sí, sin GPUs gigantes en Silicon Valley. Solo buena ingeniería, limpieza de datos y una mente obsesionada con la precisión.


⚙️ Contexto y motivación


En la mayoría de entidades, los archivos FAQ son como un cuarto lleno de papeles desordenados: hay respuestas, pero nadie sabe dónde.
El desafío fue transformar ese caos textual en un cerebro consultable, donde cada pregunta se convierte en una unidad semántica limpia y entendible por IA.


🧪 Ingeniería de datos


1. Limpieza y normalización:
Separación de preguntas múltiples (de 358 → 1 022 filas), eliminación de duplicados y normalización para TTS con frases respirables.


2. Vectorización eficiente:
Embeddings (384 D) con consumo mínimo de CPU.
Motor en RAM (< 5 ms por consulta).


3. Hot Reindexing:
Un endpoint /reload permite regenerar el índice VECTORIAL sin reiniciar el sistema.
Todo gracias a Flask y conexiones persistentes HTTP 


4. Reranking cognitivo:
IA revisa el Top 3 de VECTORES y elige la coincidencia exacta, usando umbrales dinámicos de confianza y verificación de acrónimos (SOAT, RUNT, SIMIT).



🚀 Innovaciones clave


  • Hot Re-Indexing: recarga dinámica de VECTORES vía /reload sin downtime.

  • Cognitive Confidence Layer: mezcla del score coseno con validación lógica de IA.

  • TTS-Ready Cleaning: respuestas limpias para voz natural en tiempo real.

  • Self-Contained Stack: 100 % local, sin nube ni dependencias externas.

  • Low-Latency Reasoning: < 150 ms promedio por respuesta.


    🧘 Conclusión


    SuperAgente demuestra que la IA local, bien diseñada, puede igualar o superar las arquitecturas en la nube.
    Cuando los datos se limpian, se vectorizan y se combinan con un reranker cognitivo, el resultado es magia pura: una inteligencia que obedece.


    En Xerebria no entrenamos máquinas; domamos conocimiento.
    Transformamos información institucional en un cerebro digital consultable, escalable y 100 % soberano.


    🔮 Próximos pasos


    • Implementar VECTOR-distributed para +100 k preguntas.

    • Añadir aprendizaje incremental con feedback de usuarios.


    • Publicar el paper técnico:
      “Local RAG Architecture for Semantic Governmental Knowledge Systems”.


      💬 Frase del autor

      “La IA no se entrena.
      No se estudia.
      Se doma.
      Y cuando domas los datos,
      la inteligencia obedece.
      — Sebastián Jaramillo, fundador de Xerebria Technologies



Tags: Arquitectura Semántica Local de Alta Precisión - SuperAgente FAQ System