Arquitectura de un Agente Cognitivo Autónomo: qué hay detrás de Aliee para el CTO que necesita entender la tecnología

Escrito por Andrés Lozada | May 10, 2025 9:00:00 AM

Cuando un CTO o un arquitecto de soluciones escucha hablar de "agentes cognitivos autónomos", la pregunta inmediata no es filosófica: es técnica. ¿Cómo funciona realmente? ¿Cómo se integra con lo que tenemos? ¿Cómo garantizamos que no va a hacer algo que no queremos que haga? Esas son las preguntas correctas, y este artículo las responde con la precisión que un líder técnico necesita para tomar una decisión informada.

Los tres planos de un agente cognitivo

Para entender la arquitectura de Aliee, es útil comenzar con un marco conceptual que clarifique qué hace un agente en cada nivel. Aliee opera simultáneamente en tres planos:

Plano de Percepción: Aliee ingiere información del entorno —datos estructurados y no estructurados, mensajes de sistemas, documentos, interacciones de usuario— y los convierte en representaciones internas que puede procesar. Este es el nivel donde operan las capacidades de comprensión de lenguaje natural, análisis documental y extracción de entidades.

Plano de Razonamiento: Aliee procesa las representaciones internas del entorno para construir un modelo del estado actual, compararlo contra los objetivos definidos y determinar la secuencia de acciones óptima para avanzar hacia esos objetivos. Este es el nivel donde opera el motor de razonamiento de cadena de pensamiento.

Plano de Ejecución: Aliee ejecuta las acciones determinadas en el plano de razonamiento a través de herramientas y conectores: actualiza registros en sistemas externos, genera documentos, envía notificaciones, desencadena flujos de trabajo, consulta APIs. Este es el nivel donde Aliee tiene impacto real en los sistemas y procesos del cliente.

La arquitectura técnica de Aliee: seis capas

Capa 1: Ingesta y Procesamiento de Contexto

Aliee puede ingerir información de múltiples fuentes simultáneamente:

Mensajes de texto, voz (transcrita en tiempo real) y documentos en múltiples formatos (PDF, DOCX, XLSX, imágenes, formularios escaneados).
Datos estructurados de bases de datos relacionales y no relacionales vía APIs REST o conectores directos.
Flujos de eventos en tiempo real (mensajes de sensores IoT, logs de sistema, alertas de monitoreo).
Contenido de sistemas empresariales: CRM, ERP, core bancario, DMS, HRMS.

Todo este input es procesado por el SLM Document Engine, que normaliza, clasifica y extrae entidades antes de pasarlo al motor de razonamiento. El SLM Document Engine utiliza técnicas combinadas de OCR cognitivo, Named Entity Recognition (NER) y comprensión semántica para extraer no solo el texto, sino el significado de negocio del contenido.

Capa 2: Memoria y Estado

Una de las limitaciones fundamentales de los chatbots tradicionales era su falta de memoria persistente. Aliee resuelve esto con tres tipos de memoria que operan en paralelo:

Memoria de trabajo (corto plazo): El estado de la conversación o proceso actual. Aliee sabe en qué punto del flujo está, qué información ya recopiló y qué falta.
Memoria episódica (mediano plazo): El historial de interacciones con el usuario o entidad específica. Aliee recuerda que este cliente llamó la semana pasada, que su expediente tiene un documento pendiente y que la última interacción terminó con un compromiso no resuelto.
Memoria semántica (largo plazo): El conocimiento de negocio, reglas, procedimientos y datos de referencia. Aliee "sabe" qué es una CLABE, qué documentos requiere un expediente KYC nivel 2 y cuáles son los umbrales de alerta PLD configurados.

Gartner identifica la gestión de memoria persistente multi-nivel como una de las cinco capacidades críticas que distinguen a los agentes verdaderamente autónomos de los asistentes avanzados (Gartner, "Key Capabilities of Agentic AI Systems", 2024). Aliee las implementa las cinco.

Capa 3: Motor de Razonamiento y Planificación

Este es el núcleo diferencial de Aliee. El motor de razonamiento opera con un paradigma de Cadena de Pensamiento Estructurada (Structured Chain-of-Thought): ante un objetivo, Aliee no busca la respuesta inmediata. Descompone el objetivo en sub-tareas, evalúa las dependencias entre ellas, determina el orden de ejecución y construye un plan de acción verificable.

Por ejemplo, ante el objetivo "completar el onboarding de este prospecto": Aliee evalúa qué documentos están presentes, cuáles faltan, cuáles requieren validación, en qué orden deben procesarse, qué acciones en sistemas externos son necesarias y en qué secuencia. Ese plan es transparente: puede ser auditado, explicado y —en casos que lo requieran— revisado por un humano antes de ejecutarse.

Esta transparencia es fundamental para entornos regulados. No es una caja negra: es un agente cuyo razonamiento puede ser auditado.

Capa 4: Herramientas y Conectores

La capacidad de Aliee de actuar en el mundo real depende de su ecosistema de herramientas. A través del SLM Integration Layer, Aliee puede interactuar con:

APIs REST de sistemas empresariales (cualquier sistema con API expuesta).
Bases de datos relacionales y documentales (lectura y escritura con permisos controlados).
Servicios de validación externos: SAT, RENAPO, OFAC, buró de crédito.
Sistemas de mensajería: correo electrónico, WhatsApp Business, SMS, canales internos.
Plataformas de firma electrónica y gestión documental.
Flujos de trabajo y sistemas de ticketing.

Cada herramienta tiene permisos definidos explícitamente: Aliee solo puede ejecutar las acciones para las que fue autorizado. La arquitectura de permisos es granular y auditable.

Capa 5: Guardrails y Control de Seguridad

Una preocupación legítima de los arquitectos de soluciones es el control sobre las acciones de un agente autónomo. ¿Qué pasa si Aliee hace algo que no debería? La respuesta está en la capa de Guardrails del SLM Security Suite:

Límites de acción configurables: Se define explícitamente qué puede y qué no puede hacer Aliee en cada entorno. Puede consultar un registro, pero no eliminarlo. Puede generar un borrador de ROS, pero no enviarlo sin aprobación humana.
Punto de control humano (Human-in-the-loop): Para acciones de alto impacto, Aliee puede configurarse para requerir aprobación humana antes de ejecutar. Este control es granular por tipo de acción, monto, perfil de cliente o nivel de riesgo.
Trazabilidad completa: Cada acción de Aliee genera un registro inmutable con: quién la solicitó, qué razonamiento condujo a ella, qué datos se utilizaron y cuál fue el resultado. Este registro es la base de la auditoría regulatoria.
Detección de anomalías en el propio agente: Si Aliee detecta que está operando fuera de sus parámetros normales —por ejemplo, si recibe instrucciones contradictorias o fuera de contexto— escala automáticamente a supervisión humana en lugar de intentar resolver la ambigüedad de forma autónoma.

Capa 6: Aprendizaje y Actualización

Aliee no es un sistema estático. Opera con un ciclo de mejora continua que incluye:

Feedback loop supervisado: Cuando un analista humano corrige o ajusta una acción de Aliee, esa corrección retroalimenta el modelo.
Actualización de reglas de negocio: Los cambios regulatorios, nuevos productos o modificaciones de proceso se incorporan al modelo sin requerir reentrenamiento completo.
Monitoreo de drift: El sistema detecta cuando el rendimiento del agente se degrada respecto a la línea base y genera alertas para revisión.

Consideraciones de integración para el CTO

La pregunta más práctica que recibo de CTOs es siempre la misma: "¿Qué tan difícil es integrarlo con lo que ya tenemos?"

La respuesta honesta: depende de la calidad de las APIs y la documentación de sus sistemas existentes, no de Aliee. El SLM Integration Layer puede conectarse a cualquier sistema que exponga una API REST documentada en un período de días a semanas. Para sistemas sin API (algunos sistemas legados), SLM Sistemas tiene experiencia con conectores de capa de datos que leen directamente de las bases de datos del sistema.

IDC calcula que el tiempo promedio de integración técnica de una plataforma de agentes cognitivos en una empresa con 3 a 5 sistemas core es de 6 a 12 semanas, asumiendo que los sistemas tienen APIs documentadas y que el cliente tiene un equipo técnico disponible para colaborar (IDC, "Enterprise AI Integration Benchmarks", 2024). Ese es el parámetro que SLM Sistemas utiliza para planear los proyectos de implementación de Aliee.

La arquitectura de Aliee fue diseñada con la integración como principio, no como característica adicional. Porque un agente cognitivo que no puede actuar sobre los sistemas reales de la empresa no es un agente: es un asistente conversacional sofisticado. Y eso ya no es suficiente.

— Andrés Lozada, Director Ejecutivo | Sumato

Ver post completo