Menu
in

CaptionBot: Descripciones automáticas para tus fotos

Aquí en NeoTeo llevamos un tiempo siguiendo los esfuerzos de Microsoft en materia de inteligencia artificial. Desde la detección de edad y el reconocimiento de emociones hasta un chatbot que se volvió psicótico y racista en menos de 24 horas, la gente de Redmond está definitivamente decidida a mejorar su tecnología con la ayuda de múltiples proyectos en línea. Ahora es el turno de CaptionBot, un sistema en el que sólo debes cargar una fotografía, y dejar que el algoritmo haga una descripción automática sobre ella.

Hace poco hablé sobre Seeing AI, una plataforma de inteligencia artificial que posee como función principal asistir a personas ciegas. Uno de los puntos más críticos de esta tecnología es su capacidad de describir el entorno del usuario con precisión. En el vídeo de presentación vemos una prueba cuando identifica a un joven haciendo un truco con una patineta, pero eso es apenas una pizca de su potencial. De más está decirlo, todos los desarrollos de inteligencia artificial (pertenezcan a Microsoft o no) tienen un enorme trabajo por delante. El gigante de Redmond aprendió una cosa o dos con Tay, su ex chatbot amante del fascismo y el incesto, en especial que necesita buenos maestros en vez de «la Web», y decidió regresar a experimentos un poco más contenidos, como es el caso de CaptionBot.

La descripción es muy básica, pero correcta
CaptionBot no logró llegar a una conclusión completa, pero sí detectó a Tay como sorprendida

Básicamente, todo lo que puedes hacer en CaptionBot es cargar una foto o pegar una dirección URL que lleve a una imagen compatible, y dejar que la inteligencia artificial de turno genere una descripción automática sobre ella. CaptionBot anuncia desde el comienzo que conservará la foto por un tiempo para mejorar sus habilidades, pero eso no incluye información personal. Durante mis pruebas he notado que algunas de sus descripciones pueden ser muy superficiales (aunque técnicamente correctas), pero no es muy complicado llevarla hacia un camino en el que cometerá varios errores al hilo. Cuando los parámetros de identificación no son los ideales, CaptionBot introducirá frases en su descripción como «I’m not really confident».

Esta vez, su error fue total. No hay traje, ni corbata.

En resumen: Lejos… pero se está acercando. Si combinamos a todas las plataformas de detección y reconocimiento que Microsoft está desarrollando con lo que representa el HoloLens, definitivamente es posible visualizar un futuro más que interesante.

Escrito por Lisandro Pardo

Leave a Reply