in

NELL: Un sistema que “aprende” semántica

En ocasiones pasadas hemos mencionado la importancia que está adquiriendo la semántica en la Web, especialmente a la hora de realizar búsquedas y entregar resultados. El avance de la tecnología ha permitido la exploración y el desarrollo de la interpretación semántica por parte de los sistemas, pero aún así, lograr que un ordenador lea y entienda como un humano lo hace no es tan sencillo. Sin embargo, NELL tiene una ventaja muy importante: Cuanta más información tiene disponible, puede corregirse a sí mismo, aprender e incrementar su habilidad semántica.

La interacción de un ser humano con un idioma determinado se hace más precisa y eficiente con el paso del tiempo. Los primeros logros se alcanzan a partir de imitación, asociación y repetición (las primeras palabras de algunos niños pueden ser muy curiosas y/o escandalosas), pero incluso aquellos que han aprendido un nuevo idioma pierden habilidad si no "mantienen el contacto" con dicho idioma, hablando, leyendo, escribiendo, practicando. Los ordenadores tienen la ventaja de no olvidar (salvo una falla catastrófica de hardware o la típica pérdida de datos), aunque deben luchar con un proceso de aprendizaje mucho más lento y complicado. Cualquier sistema puede repetir una palabra o una frase, pero comprender el significado que tiene detrás es algo muy diferente. Uno de los mejores ejemplos que se pueden encontrar hoy sobre esto son los traductores en línea. Algunos resultados pueden ser tan lineales y literales, que hacen parecer a Tarzán como un universitario.

NELL adopta una postura diferente. En vez de recurrir a unas pocas funciones para entregar un resultado adecuado, trabaja de forma constante para ampliar su base de datos, y al mismo tiempo, su razonamiento semántico. Uno de los ejemplos utilizados por Tom Mitchell, líder del equipo que desarrolla a NELL (Never-Ending Language Learner), es el de "Maratón en la ciudad de New York". En combinación con otras palabras y sentencias, NELL ha aprendido que dicha frase es una carrera y un evento deportivo. NELL ha estado funcionando desde enero pasado, y cuenta con el apoyo financiero y tecnológico de gigantes como Google, Yahoo (quien aportó el acceso al hardware para el proyecto), y nada menos que nuestros amigos de DARPA. Aún así, el sistema está lejos de ser perfecto. Uno de los errores más llamativos ha sido el de considerar a las "cookies de Internet" como "algo que se hornea", por lo que la asistencia humana en su aprendizaje sigue siendo necesaria en determinados casos.

Puedes seguir el progreso en el aprendizaje de NELL por Twitter, en donde publica sus creencias. Algunos de sus aciertos son que la "yugular" es una vena, y que el "Departamento de Defensa" es parte del gobierno estadounidense, pero algunos de sus deslices son más sutiles, como por ejemplo que Clint Eastwood actuó en la película "Changeling", cuando en realidad fue director y productor de la misma. En el futuro, su sitio oficial planea integrar una función a través de la cual los visitantes podrán indicar potenciales errores por parte de NELL. Sólo esperamos que no sea una víctima del vandalismo, como suele suceder en algunas wikis, pero lo más probable es que los interesados deban registrarse para poder ser tutores de este sistema en pleno aprendizaje.

Reportar

¿Qué te pareció?

Escrito por Lisandro Pardo

2 Comments

Leave a Reply

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

GoldenEye 007

Battlefield Play4Free gratis (Trailer)