viernes, 17 de julio de 2009

¿Herramientas de Análisis Emocional en Skype?


Por la tarde del día de ayer me encontraba enchulando my apreciado Skype!, Todo partió por lograr introducir una característica similar a la ofrecida por Google Voice en lo que respecta al buzón de voz. Luego continuó con la posibilidad de enviar fax vía Skype, lo cual nunca esta demás ya que mandar un fax desde aquí (USA) a otra ciudad u otro lugar del mundo sale un tanto caro. Finalmente en mi búsqueda de herramientas me tope con una llamada "Attitude and Emotion Detector / 1.1", no hubo que pensarlo mucho (más allá de leer las políticas y condiciones para la instalación :P) y procedí con la instalación. A modo general, les cuento que el software analiza conversaciones por chat almacenadas en el historial del usuario.
Luego de la instalación empecé con algunas pruebas y fue ahí cuando me tope con la primera gran limitación de esta pieza de software, me refiero al idioma :(.... El programa soporta sólo Inglés y dado que la mayor parte de mis conversaciones son con personas de mi lengua natal (Español por si no lo habían notado) el análisis simplemente fracaso.
Dadas las circunstancias recurrí a mi Plan B, recuperar todas las conversaciones históricas con mis contactos internacionales con los que chateo en Inglés. Partí con los análisis y debo decir que solo en algunos casos la aplicación se acerco medianamente al tono emocional que se sostuvo durante las conversaciones, en otros sencillamente no anduvo ni cerca. Esto según mi punto de vista, ya que para ser mas objetivo definitivamente necesitaría otros evaluadores de las mismas a fin de llegar a un consenso.
Según leí en un comentario del software, los análisis se realizan en base a un análisis basado en los tipos de palabras. Un tipo de clasificación bastante usada hoy en día en algunas investigaciones que apunta a descubrir el tono emocional de los Blogs. Las técnicas usadas por supuesto son diversas y en ocasiones ligeras variaciones muestran mejoras sustanciales. En el caso del complemento arriba comentado, desconozco completamente el tipo de técnica empleada. Podría ser algo muy simple basado solo en listas de palabras asociadas a temas como amor, amistad y negocios, y luego básicamente hacer una evaluación porcentual sobre la presencia de éstas en el texto. De hecho hace unos años atrás me tope con un software que clasificaba noticias en categorías como violencia y humor, basándose en un procedimiento como el descrito.
Ahora bien, más allá del tipo de técnica empleada, nos encontramos frente a un gran problema cuando se trata de elicitar emociones basado en análisis del lenguaje, sea este escrito u oral. Primero que nada tenemos la gran barrera del idioma, pues dado que no existe un idioma universal (aunque algunos pretendan serlo), nos vemos en la obligación de hacer diversos ajustes a los sistemas a fin de que el sistema pueda soportar una gran variedad de idiomas. Si consideramos la técnica descrita anteriormente, bastaría solo con agregar los conjuntos de palabras en los distintos idiomas, a cada una de las categorías sobre las cuales se pretende clasificar. Aun cuando esto podría presentarse como una solución, se nos presenta un problema aun mayor, que es el complejo proceso de programar sistemas capaces de “enteder” o “comprender” el lenguaje natural (el lenguaje con el que habitualmente nos comunicamos). Es decir, más allá de hacer simples análisis léxicos y sintácticos, debemos pensar en profundos análisis semánticos. Digo profundos, pues estamos tratando de descubrir emociones en un texto y contexto, las que muchas veces no son explicitas, pero que probablemente un ser humano podría llegar a identificar. A modo de ejemplo, pensemos en una situación en la que queremos ser ironicos a través del texto; ésta a veces no es facilmente comprendida por el receptor del mensaje lo que podría terminar en algun mal entendido.

Particularmente ahora estoy bastante interesante en el estudio de emociones a través de la voz, considerando tono y contenido de los mensajes. Esto, viendo en la multimodalidad una vía potencialmente adecuada para obtener altos niveles de precisión en la detección de emociones. Importante considerar que en este caso, igualmente se hace presente la barrera idiomática y en ese sentido la “universalidad” de las expresiones del rostro como diría el Dr. Paul Ekman y otros autores, se me viene a la mente como una componente poderosa que necesariamente debería ser incluida para completar este enfoque multimodal.

Mientras escribía este post, me encontré con otro componente extra para Skype, este se llama “Voice Analysis Love Detector”. Aun no lo pruebo, pero creo que ya encontraré la instancia para hacerlo :P. En cuanto haga la revisión expondré mis comentarios, de momento solo espero que sea mucho mejor que el detector de mentiras de Skype (KishKish Lie Detector). Y bueno, veremos si me da el tiempo para hacer una adaptación para Skype del reconocedor de emociones que construí hace un tiempo (gran parte de los creditos claramente para Robert Mottram, quien ya había desarrollado el imitador facial).



Hasta la próxima!