Menu
in

Microsoft busca «detectar emociones» en fotografías

En mayo pasado, el gigante de Redmond presentó a How-Old.net, un portal que nos permite evaluar la capacidad de sus algoritmos en Microsoft Azure para calcular la edad de una persona. Ahora, nos encontramos con un componente del llamado «Proyecto Oxford», que tiene como objetivo reconocer las emociones de todas las personas que aparecen en una fotografía. La tecnología involucrada es sin lugar a dudas experimental, pero sus resultados son bastante precisos…

Aprendizaje de máquinas, inteligencia artificial, redes neurales… las grandes compañías están invirtiendo mucho tiempo y dinero en estas tecnologías. Se supone que los avances acumulados permitirán el desarrollo de servicios y dispositivos más inteligentes, con la capacidad de adaptarse por completo a las demandas de cada usuario. Por supuesto, el proceso es significativamente lento, y todos los elementos involucrados tienden a cometer errores serios, pero el tiempo está a su favor, y con cada nueva generación los resultados son mucho más certeros que antes.

Nada mal para lo que es una imagen clásica

Hoy nos encontramos con uno de los módulos disponibles en el Proyecto Oxford de Microsoft, enfocado en el reconocimiento de emociones. La página oficial no brinda ningún detalle técnico sobre el funcionamiento del módulo, aunque destaca que los números son generados por el API conocido como «Emotion», cuando aplica técnicas de aprendizaje de máquinas. El sistema puede reconocer hasta un máximo de 64 rostros en una misma imagen, y si quieres hacer la prueba con una foto personal, recuerda que su tamaño debe ser inferior a cuatro megabytes, con una resolución mínima de 36 por 36 píxeles. Entre los formatos soportados aparecen JPG, BMP, PNG y GIF (solo su primer cuadro).

Microsoft lo explica desde el comienzo: La tecnología vinculada al módulo para reconocer emociones es experimental, y se esperan muchos resultados disparatados. De todos modos, en nuestras pruebas no le fue nada mal. Los números se dividen en ocho categorías (sorpresa, miedo, felicidad, tristeza, ira, desprecio, asco y neutral), y un reconocimiento perfecto equivale a 1, pero lo más común es encontrar varios decimales detrás de cada valor. El plan de Microsoft es que los desarrolladores utilicen sin cargo en sus proyectos a este y otros módulos que forman parte del Proyecto Oxford, incluyendo reconocimiento facial, voz a texto (y viceversa) y detección de texto en imágenes, entre otras cosas.

Escrito por Lisandro Pardo

Leave a Reply