La explosión de información que presenta hoy en día internet plantea la necesidad de emplear nuevas herramientas que nos ayuden en la búsqueda y recuperación de información en la web. El empleo de técnicas de Procesamiento de Lenguaje Natural o PLN en dominios restringidos son empleadas por los asistentes virtuales para lograr una mayor y mejor comunicación entre la organización y su cliente. 

No todos los asistentes virtuales utilizan técnicas de Procesamiento de Lenguaje Natural. . Por ejemplo, aplicaciones web del tipo chatter bots como ALICE, Hal, Max y Nicole  son capaces de aceptar la entrada del usuario y dar alguna respuesta inteligente pero no utilizan procesamiento del lenguaje. Al contrario, para generar estas respuestas disponen de una base de patrones de preguntas con respuestas predefinidas asociadas. Sin embargo, no son capaces de incluir información del contexto ni conocimiento relacionado con el tema del diálogo.

Más información sobre PLN en Wikipedia y en Youtube

Análisis intencional del lenguaje

El objetivo de cualquier herramienta de procesamiento de lenguaje natural es identificar y transmitir el contenido y conocer la intencionalidad del usuario o cliente. A continuación podemos ver las diferentes etapas del análisis semántico-pragmático para llevarlo a cabo que ha esbozado Martínez Fernández.

Análisis del corpus

Se trata de conocer el sublenguaje de la organización que representa el asistente virtual. Incluye la terminología de ese dominio y las relaciones entre esos términos. La abstracción de los mismos hacia un modelo conceptual de dominio configura la ontología de ese dominio al que se añaden patroñes de frases.

Análisis semántico-pragmático

En esta etapa se trata de conocer la intención y extraer datos concretos que estén incluídos en las frases. Así se divide en seis tipos diferentes de actos comunicativos:

  1. Aportando información: inform
  2. Solicitando información: request
  3. Cambiando de iniciativa: authorize
  4. Dando órdenes: command
  5. Siendo educados: actos de cortesía
  6. Nada que decir: Null

Gramática semántica

Obtenidos los patrones de frases se etiqueta cada patrón con los actos comunicativos que se deberían obtener de su análisis. Esta etapa presenta un grave problema pues por muy extenso que sea el corpus analizado siempre será posible encontrar frases no conocidas que no encajen en el patrón establecido. Para solventarlo se utilizan técnicas de relajación de las reglas de la gramática aún perdiendo precisión en la respuesta a la búsqueda y recuperación de información.

Gestión del diálogo

La información extraída del análisis de la información proporcionada por el cliente es tratada de tres modos. Primero, generando información contextual de carácter estático que perdura mientras dure la conversación o más allá de la misma y que se vincula al modelo de usuario. Segundo, generando información contextual de carácter dinámico que indica cómo se está desarrollando el diálogo. Y por último, estudiando el hilo de la conversación de modo que el asistente virtual pueda respoder adecuadamente a la pregunta del usuario.

Generación del lenguaje

La respuesta del asistente virtual se basa en el análisis de la interacción y el hilo del diálogo. Genera así una variedad de actos comunicativos basados en unas plantillas de frases que se completan con la información estática proporcionada.