in

Deep Learning: Inteligencia Artificial para análisis de vídeos

La agencia norteamericana DARPA está teniendo serios problemas para procesar la enorme cantidad de datos que recogen sus vehículos robóticos espías. En efecto, cada día se recogen petabytes de datos de vídeo que deben ser analizados para que tengan alguna utilidad, por lo que están analizando el desarrollo de alguna clase de Inteligencia Artificial que haga el trabajo por ellos. Imagina que pones algunos cientos de cámaras de video robóticas a volar por el mundo, para encontrar una persona determinada. Estas cámaras envían sus datos, recogidos en las atestadas calles de las ciudades más importantes del mundo, a tu cuartel central secreto. Todo funciona de maravilla, salvo por un problema: necesitas un humano por cada cámara, para que analice las imágenes que llegan, y así ver si en alguna de ellas aparece la persona buscada. Es más, si en los vídeos aparecen muchas personas moviéndose (algo muy común en una calle), posiblemente tus operadores ni siquiera puedan analizarlas en tiempo real. Rápidamente comenzarán a amontonarse datos sin procesar. Bien, algo parecido le está ocurriendo a la Defense Advanced Research Projects Agency (DARPA) de los Estados Unidos.

En efecto, la agencia mantiene en funcionamiento una gran cantidad de vehículos robóticos voladores, a los que genéricamente denominan UAV (Unmanned Aerial Vehicle o Vehículo aéreo no tripulado), equipados con cámaras de vídeo que registran zonas de conflicto buscando enemigos agazapados debajo de las piedras, terroristas o armas de destrucción masivas (esas que resultan especialmente difíciles de encontrar, sobre todo si no existen). Cada día “cosechan” miles de horas de grabaciones de vídeo que alguien –en realidad un verdadero ejército de “alguienes”- tiene que revisar concienzudamente para que resulten de alguna utilidad. El 99% del tiempo estos operadores miran vídeos en los que se ven inofensivas vacas y caballos viviendo sus apacibles vidas, ajenas a los dramas existenciales de DARPA. Pero si hay algo que no le falta a la agencia gubernamental de marras son fondos, así que han anunciado con bombos y platillos sus planes para crear una inteligencia artificial que mire vídeos todo el día y haga el trabajo que a los humanos les demanda tanto tiempo. Se supone que diariamente los centros de procesamiento de las imágenes recogidas por los aparatos espías de la agencia supera el petabyte. La Inteligencia Artificial encargada de analizar esas imágenes se llamará “Deep Learning” (“Aprendizaje Profundo”) y debería tener, como mínimo, la inteligencia de la solterona del piso de arriba que pasa el día mirando culebrones en la tele, algo que en principio no parece tan difícil.

El cerebrito de Deep Learning será entrenado viendo videos de animales. La idea es que aprenda a diferenciar, por ejemplo, los caballos de las vacas. Para eso, debe ser capaz de reconocer la silueta de un equino con un 100% de efectividad. Es un problema bastante difícil, por que los muy taimados tienen la costumbre de adoptar poses muy diferentes –de frente, costado, parados, echados o de espaldas, por ejemplo- lo que complica bastante la cuestión. Además, a la hora de “explicarle” a una máquina qué cosa es un caballo no basta decirle “un caballo es algo grande, peludo y con cuatro patas”, por que hay otros animales que podrían entrar en esa categoría. Los amiguitos de DARPA están muy entusiasmados con este nuevo desafío, y apuestan a que si son capaces de contar el número de caballos que se ven en esos cientos de miles de horas de videos que recogen cada día, en el futuro podrían distinguir a Bin Laden de un camello, o a un terrorista de un inocente turista.

No es un problema sencillo, pero si logran construir algo que funcione bien -y creemos que es muy posible que lo logren- podríamos tener entre manos un sistema que sirva para recuperar niños perdidos, personas extraviadas o un montón de cosas pacificas y útiles. Al fin y al cabo, Deep Learning sería algo así como un “Big Brother” cibernético, al que no se le puede ocultar nada. Más o menos como los espías voladores de Dark Angel, pero sin Jessica Alba dando patadas y puñetazos. Por supuesto, antes debemos encontrar la manera de evitar que algún gobierno utilice este tipo de software para violar nuestra intimidad.

Reportar

¿Qué te pareció?

Escrito por Ariel Palazzesi

4 Comments

Leave a Reply
  1. "…un Petabyte viene a ser un millón de Gigabytes, el equivalente a unos 2 millones de horas de porno en DivX"
    Buffff… gracias por la aclaración!! Siempre se dice que para poder entender nuevas medidas se debe comparar con cosas conocidas. Ésta vez lo habeis hecho estupendamente 🙂
    Lo que uno se pregunta es: para que desperdiciar tanta capacidad grabando "nada" puediendo estar almacenando porno? xD

    La verdad que es un tipo de tecnología interesante, y que igual sirve para reconocer coches, armas cortas y demás, pero identificación facial de una calle llena de gente y todo en tiempo real.. me parece demasiado. Y no creo que los de la agencia quieran saber que "hacer 2 semanas que un conocido terrorista pasó por esta calle", pero en fin. Todo por la ciencia.

  2. felicidades por el articulo, creo que sera una tarea deificil ya que ahy infinidad de siluetas en un pasiaje normal y para detectar a alguien por tecnologia biometrica va a estar muy dificil

  3. El tema es que incluso las piedras o ramas caídas pueden hacer una silueta de algo como una persona o un animal xD… lo veo muy dificil, la verdad…

Responder a FJS Cancelar la respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Latitude ayuda a las víctimas

Juego online de la semana – Toki