Conversando con Hal

La Inteligencia Artificial es una combinación de la ciencia del computador, fisiología y filosofía, tan general y amplio como eso. Es que reúne varios campos -robótica, sistemas expertos, etc.-, todos los cuales tienen en común la creación de máquinas que pueden ¿pensar? Como Hal, la supercomputadora de “2001 Odisea del Espacio”

pag.4 aPensar, ¿es esa una virtud estrictamente humana, una función limitada sólo a la fisiología del cerebro? ¿O se trata de un sistema supercomplejo de conexiones eléctricas que es difícil pero no imposible de descubrir, producir, sintetizar? Esta pregunta hace cinco siglos hubiera costado la hoguera por herejía; hace un siglo podía ser argumento de film de ciencia ficción; hoy se plantea libre y seriamente en cualquier foro científico especializado, y existen trabajos concretos que avanzan en darle a los ordenadores y los robots funciones y libertades cada vez más humanas.

Es así como los sistemas de administración de base de datos cada vez más sofisticados, la estructura de datos y el desarrollo de algoritmos de inserción, borrado y locación de datos, así como el intento de crear máquinas capaces de realizar tareas que son pensadas como típicas del ámbito de la inteligencia humana, acuñaron el término Inteligencia Artificial en 1956.

De hecho hay quienes están trabajando en máquinas contestadoras que perciben nuestro “estado de ánimo” y eligen las respuestas que aplaquen nuestro eventual enojo. Parece una locura, pero es un hecho, y para que nos lo cuente llamamos a David Griol, miembro del grupo de “Inteligencia Artificial Aplicada” y también del de “Sistemas de Diálogo Hablado Multimodal”.

 

“Puede haber un buen reconocedor para el español de España, pero con problemas para el español argentino o colombiano”.

David Griol

Noticias & Protagonistas: ¿Cómo es este tipo de software de empatía entre la máquina y el individuo, que parecen estar en el límite entre la realidad y la ficción?

David Griol: En los grupos de la Universidad Carlos IIIº de Madrid y la de Granada desarrollamos estos programas: a todos nos ha pasado llamar por teléfono, que nos atienda una máquina y no entendernos, o que nos pidan varias veces lo mismo. Entonces, nosotros pretendemos crear máquinas que funcionen más como un ser humano, tratando de enfocarnos en una comunicación parecida a la que tendríamos con otra persona, que nos deje intercambiar.

 

N&P: ¿Es decir, algo más natural que “Apriete 1”, “Apriete 2”…?

DG: Claro, que haya frases más naturales. La línea, además, tiene idea de la emoción que se percibe en cada frase; nos centramos en las emociones negativas, las que nos ponen nerviosos cuando interactuamos con una máquina. El usuario puede estar apurado, enojado, aburrido. Depende de la emoción, la máquina se comporta de manera diferente. A medida que la máquina vaya aprendiendo y se vaya adaptando a nosotros, cada vez que el usuario interactúa varias veces, verá que se comporta de mejor forma, que no ofrece la misma forma de interactuar con cualquiera de las actuales, sino que se adapta específicamente a cada usuario.

 

N&P: Realmente increíble. Necesitan más de una línea de trabajo, con una capacidad del software para reconocer tonos, formatos de emisión, y articular la respuesta justa. ¿Es inteligencia artificial?

DG: Sí, de hecho la comunicación persona-máquina es una de las líneas fundamentales en la IA, que ya se aplica desde los años ´50. Una de las teorías va a fondo con la idea de que las máquinas pueden ser indistinguibles de las personas a la hora de comunicarse. En cuando al desarrollo con emociones, detectar el estado del usuario, en nuestra investigación ésa es la principal novedad.

 

N&P: ¿Y cuál es el indicador?

DG: La detección suele hacerse a través de la señal de voz, de la onda de voz que se corresponde con las palabras: se obtienen caracteres, estadísticas que se usan para la probabilidad de determinar cómo está el interlocutor, si se encuentra enojado, aburrido, etc. Nosotros, a estos rasgos acústicos, añadimos el contexto del diálogo; dentro de cada llamada del usuario, vemos qué indicios hay si el sistema le pide dos veces lo mismo, o si notamos que a la hora de hablar está dando muchas interjecciones, como por ejemplo “ehh”, o  “pues”; eso está dando señales de que duda sobre lo que pide la máquina. A la hora de detectar, lo principal es ver las pistas de las señales de voz.

 

“La onda de voz permite a la máquina detectar si estamos enojados o aburridos”.

David Griol

N&P: ¿El software está a un paso de ser operativo en el circuito comercial, o falta un tiempo?

DG: Está disponible. En nuestra universidad existe un departamento que se encarga del contacto entre ella y la empresa. Nosotros investigamos para que no se quede en ese ámbito. Queremos ofrecer al conjunto de empresas fuera de la universidad como oferta tecnológica en el catálogo; además es accesible, varias empresas en Gran Bretaña y alguna en Pakistán nos han comentado su interés. Una vez que las cosas se lleven a la práctica, hay que tener en cuenta que los sistemas de diálogo son difíciles de elaborar para hablar de cualquier cosa; se hacen para dominios o  tareas específicas, acotado a lo que puede preguntar el usuario; por ejemplo para informar sobre profesores, tutorías, trámites de estudio, matriculación, horarios, esto dentro de la universidad. Habría que ver con las empresas qué tareas específicas serían las adecuadas.

 

N&P: Usted mencionó las interjecciones. ¿Cómo hacen con las diferencias idiomáticas, sin ir más lejos, entre España y la Argentina?

DG: No sólo dependen del idioma, sino del reconocimiento del que habla. Hay indicadores muy buenos en inglés pero no para el castellano. Puede haber un buen reconocedor para el español de España, pero con problemas para el español argentino o colombiano. No sólo interjecciones sino palabras nuevas, es un tema importante. De momento lo desarrollamos para una versión neutra del español, pero habrá que adaptarlo a cada idioma; es un trabajo adicional que permitirá mejorar lo actual. Para que el sistema sea verdaderamente amigable, hay que conocer los tics propios de cada cultura.

N&P: Claro, porque entre nosotros, además de la española, tenemos una inmigración italiana que en Argentina creó una forma de lenguaje  propia luego castellanizada. Pero el código es diferente, puede ser inentendible para una máquina.

DG: Es verdad, tenemos una base común, pero estas cosas existen. No es fácil en absoluto la adaptación, son muchas variantes a contemplar. Hay que ver los modelos que usa la máquina en relación a las personas que lo utilicen, adaptar el reconocimiento para cada caso. Siempre hay que aprender y reentrenarse teniendo en cuenta estas cuestiones. Pero ya estamos más cerca de sentirnos más amigos de las máquinas.

 

Hotel Costa Galana

Disco