To bit or not to bit: ¡Descifran el ADN de las mentiras!(*)

por Gianni Sabbione 11 mayo, 2013, 1:29 am 18 Comments

¡Feliz sábado, Neoteos! Continuando con nuestra serie dedicada a los engaños, hoy vamos a revelar lo que descubrieron los expertos en algoritmos generativos. Parece ser que, si queremos descubrir si alguien nos miente, el secreto no es ver lo que hace sino analizar lo que dice. Para probarlo, desarrollaron un software capaz de detectar un engaño con un 90% de efectividad. Además, contamos cómo otro de los estudios incluyó una emisión por TV de verdades y mentiras frente a millones de televidentes.

¡Y como bonus, incluímos desafíos para que tú mismo te ejercites en la detección de textos fake! ^(*)No olvidar que esta es la sección troll de NeoTeo.

En las últimas entregas de TBONTB hablamos acerca de los elementos físicos que pueden indicar un engaño: los relacionados con el lenguaje corporal, y de la dificultad de detectarlos. ¿Pero qué sucede con respecto a la información contenida en las palabras? Los resultados de las investigaciones parecen confirmar que es allí, en los textos, en donde está la clave para identificar la mentira.

Un ámbito interesante donde pueden encontrarse muchísimos textos reales y ficticios para llevar a cabo experimentos son las opiniones acerca de distintos servicios que diferentes personas suben a los sitios web. Restaurantes, compras en línea, transportes, hoteles: los online reviews se cuentan por millones, y no es novedad que muchas empresas pagan a personas para que escriban opiniones falsas, por supuesto favorables de los servicios que brindan.

Es allí, y particularmente en los posts con opiniones acerca de servicios de hotelería, en donde un grupo de especialistas de la Universidad de Cornell, del Departamento de Ciencias de la Computación y Ciencias de la Información, desarrollaron lo que ellos llaman un “Modelo generativo de detección de engaños”. Algo así como descifrar el ADN que conforma una mentira. Su trabajo se llama Estimating the Prevalence of Deception in Online Review Communities. Lo pueden ver aquí.

Para el desarrollo del trabajo, los especialistas tuvieron en cuenta lo que comentábamos en notas pasadas, acerca de que nuestra capacidad natural de detectar una mentira es cercana a cero. Con esto en mente se desarrolló un algoritmo muy complejo, que cruza gran cantidad de información extraída de cerca de 25.000 reseñas online. Los datos se extrajeron de diferentes sitios, como Expedia, Orbitz, TripAdvisor, etc.

Los autores proponen inicialmente este pequeño ejercicio: imagina que planeas un viaje y estás eligiendo un hotel en donde alojarte. Ves uno que te gusta y empiezas a leer los comentarios de los huéspedes. Aquí debajo verás dos ejemplos (tomados de casos reales). El desafío es evaluar cuál fue escrito por un huésped real y cuál por una persona contratada por el propio hotel (persona que, por cierto, nunca se alojó allí). La solución, más abajo en la nota:

1) “¡Mi marido y yo nos alojamos en el hotel [nombre] y tuvimos una hermosa estadía! Las habitaciones son amplias y confortables. Desde nuestro cuarto, la vista del lago Michigan era hermosa. El servicio de habitación fue realmente bueno y rápido; comer desde la habitación, y con esa vista, ¡fue increíble! La piscina era hermosa pero no tuvimos oportunidad de usarla. Muy buena ubicación cercana a todas las atracciones del centro de Chicago, como teatros y museos. El personal fue muy amigable e informado; no puedes pasarla mal si te alojas allí.”

2) “Nos encantó el hotel. Cuando veo otras reseñas acerca de que le faltaba mantenimiento, no sé de qué están hablando. Las habitaciones son grandes, con DOS cuartos de baño; el recibidor es fabuloso, la piscina es grande, con dos tinas de agua caliente, y un gran gimnasio, el personasl fue cortés. La ubicación era excelente, justo enfrente del Parque Grant, con una hermosa vista de la Fuente de Buckingham y cerca de todos los museos y teatros. Estoy seguro que otros preferirían estar en la parte norte del río, pero nosotros disfrutamos de la ubicación más tranquila. Lo conseguimos por $105 en [sitio web]. Una ganga para un hotel tan hermoso.”

Actualmente, la precisión del algoritmo es cercana al 90%. En forma cíclica e detectaron diferentes grupos de indicadores de engaño o predictores (fuertes o débiles). Por ejemplo, quienes mienten en las reseñas en la web suelen enfoncarse más en hablar de ellos mismos, usar más adverbios y signos de admiración.

(Espacio dejado intencionalmente)

Mega estudio a través del éter

Otro análisis que se enfocó en el lenguaje se llevó a cabo en la década de 1990 en Londres. Fue parte de un estudio más aplio orientado a evaluar masivamente si la gente es capaz o no de detectar un engaño. Richard Wiseman (de quien ya hemos hablado en To bit), realizó dos breves entrevistas a un legendario entrevistador político, Sir Robin Day, que luego se emitieron por la cadena de televisión, en el programa Tomorrow´s World, uno de los de mayor audiencia de la TV británica, que se emite desde el año 1965. Lo más interesante del estudio fue que, potencialmente, todos los televidentes podían participar.

En cada una de las dos entrevistas, Wiseman le pedía a Sir Robin que le contara acerca de la película que más le había gustado. Los espectadores debían llamar al canal y votar por la entrevista que creían que era falsa. Aquí tenemos la transcripción del texto. ¿Cuál crees que la entrevista verdadera? (extraído del libro Rarología).

Entrevista 1:

“RW: —Dígame, ¿cuál es su película favorita?

SR: —Lo que el Viento se Llevó.

RW: —¿Por qué?

SR: —Oh, es, es, es un clásico. Grandes personajes; una gran estrella, Clark Gable; una gran actriz, Vivien Leigh. Muy conmovedora.

RW: —¿Y cuál es su personaje favorito en la película?

SR: —Oh, Gable.

RW: —¿Y cuántas veces la ha visto?

SR: —Hum… (pausa) Creo que una media docena de veces.

RW: —¿Cuándo fue que la vio por primera vez?

SR: —Cuando se estrenó. Creo que fue en 1939.

Entrevista 2:

RW: —Dígame, SR, ¿cuál es su película favorita?

SR: —Ah… (pausa), eh, Con Faldas y a lo Loco.

RW: —¿Y por qué le gusta ésa?

SR: —Oh, porque la encuentro más graciosa cada vez. Hay en ella toda clase de situaciones que me encantan. Y me gusta más cada vez que la veo.

RW: —¿Cuál es su personaje favorito en ella?

SR: —Oh, creo que Tony Curtis. Él es tan elegante… (breve pausa) y es tan ingenioso e imita tan bien a Cary Grant y es tan cómica la forma en que trata de resistirse a los intentos de seducción de Marilyn Monroe.

RW: —¿Cuándo fue la primera vez que la vio?

SR: — Creo que fue cuando se estrenó, y ya no recuerdo cuándo fue eso.”

Se recibieron cerca de 30.000 llamados telefónicos. Cuanto terminó el conteo, lo resultados fueron coincidentes con todos los estudios hechos hasta el momento, de los cuales hemos hablado ampliamente en esta sección: casi nadie fue capaz de descubrir la verdad. Presumiblemente, debido a que los televidentes se centraron más en el lenguaje corporal que en el texto,

¿Y tú?¿Votas por la 1 o por la 2? ¡Pon tu voto en los comentarios!

¡La solución, el próximo sábado!

Reflexión final

Hoy no hay reflexión: después de una extensa reunión “de trabajo” con el Sr. Max Ferzzola, debo confesar que mi cerebro no quedó en condiciones de analizar nada. ¡Lo bueno es que parece que él consiguió subir sus mega enlaces de la semana!

Hasta el próximo To bit.

Reportar

Off-Topic

¿Qué te pareció?

0 Points

Voto Positivo Voto Negativo

Escrito por Gianni Sabbione

Gianni Sabbione es editor literario, científico y músico. Como editor trabajó y trabaja en editoriales y medios internacionales de EE.UU., España y Latinoamérica. Es asesor en reorganización y automatización de áreas de IT e investigó en IA y redes neuronales.
Es cantante de sus bandas de hard rock solista y de Color Púrpura, y aprovecha su perfil en Neoteo para promocionarlas. Al menos hasta que se de cuenta el Sr. Director del sitio.