Microsoft se acerca al reconocimiento y traducción instantánea de voz

Nico Varonas . Vista 10918 veces

Que cunda el pánico entre los traductores públicos, pues la barrera del lenguaje está cediendo cada vez más ante los abnegados intentos de la modernidad por superar la rutinaria incomunicación entre los idiomas. En la última presentación pública, Microsoft acaba de mostrar una tecnología en la que viene trabajando desde hace años: la traducción instantánea. Tomando como musa al Traductor Universal de Star Trek, Microsoft mostró avances impresionantes en cuanto a reconocimiento de voz y traducción instantánea, usando la misma voz del interlocutor, pero hablando en un idioma diferente.


  • Los aplausos repiquetearon y reverberaron durante largo rato en el salón de conferencias en donde se llevó a cabo la Microsoft Research Asia’s 21st Century Computing, en Tianjin, China. Allí, conversando en el más correcto y pausado de los acentos en inglés, Rick Rashid, el Oficial en Jefe de Investigación de Microsoft, abrió la presentación haciendo un poco de historia sobre cómo su compañía ha ido asistiendo en la evolución del speech-to-speech. Es decir, de la tecnología que logra reconocer el habla y traducirla instantáneamente a otro idioma, en el mismo formato. En ella dijo que los últimos 60 años los investigadores se han encargado de construir sistema que puedan interpretar lo que una persona está hablando. Con diferentes resultados y enfoques, hasta hace muy poco los sistemas de reconocimiento de voz tenían un margen de error del 20-25% pero Microsoft logró superar esta tecnología con el descubrimiento de la técnica Deep Neural Networks.


    Presentación de Rick Rashid en China (IMPERDIBLE)

    Esta técnica permite que los sistemas de reconocimiento puedan predecir mejor basándose en patrones de conducta cerebral humana, adelantándose a las palabras y no sólo equivocándose muy poco, sino también haciendo rápido su trabajo. Con este método, Microsoft logró reducir la tasa de error de palabra en un 30% en comparación con los métodos anteriores. Esto significa que en lugar de tener un error entre 4 o 5 correctas, ahora la tasa de error es una palabra en 7 u 8. Para tener una pista de cómo trabaja, mientras Rashid hablaba, el sistema de reconocimiento de voz iba subtitulando la conferencia con una eficiencia inaudita hasta el momento. Pero eso era sólo la primera parte del descubrimiento.


    ¿Te acuerdas del Traductor Universal de Star Trek? Rick Rashid dijo que no tendremos que esperar al siglo 22 para tener algo parecido.

    Cuando ya tenía al público chino en sus manos, Rashid pasó a la presentación de la nueva tecnología de traducción instantánea de Microsoft y la no estuvo ni cerca de defraudar. Mientras hablaba en inglés, la pantalla lateral a la principal comenzó a mostrar cómo funcionaba la traducción instantánea al chino en sus tres pasos. El primero era el reconocimiento de la voz del interlocutor y el pasaje a texto. Luego, el sistema busca equivalentes en chino de las dos primeras palabras de la frase. La última parte procesa los resultados y reordena las palabras para que sean apropiadas a una frase con sentido en chino. Con algunos errores obvios del estado en el que se encuentra, la traducción era de una efectividad inaudita.

    Si al ver lo bien que funciona esto ya podemos decir que Rashid nos tiene en sus manos, la demostración de la traducción instantánea de inglés a chino usando voces es impactante. A través de un complejo modelo que recopila tonos y modelos de voz de cientos de interlocutores de cada idioma, el motor de voz y traducción pudo traducir a Rashid del inglés al chino con una delación de sólo 5-10 segundos a través de una voz sintetizada con un tono similar al suyo. Cuando de los altavoces de la conferencia salió la voz de Rashid hablando en chino, el público explotó en aplausos. Y -debo decirlo- yo también. 

    Fuente:  Technet

¿Y tú, qué opinas?

  • #1 demente
    demente lunes, 12 de noviembre de 2012, 18:03

    acaso con las computadoras desaparecieron los matematicos?

    Responder >> Attention Minus Plus Votos: -23 de 33
  • #2 Diego
    Diego lunes, 12 de noviembre de 2012, 19:00

    al parecer el publico ignoraba cuales partes del proceso que se muestra en el video son difíciles de lograr y cuales más fáciles, la parte en la que más debieron aplaudir es en la de reconocimiento de voz, en dificultad le sigue la traducción y por ultimo el sintetizador que de las tres por supuesto es la más fácil pero la que impresiona más aun publico ignorante en el tema.

    me gustaría que desarrollaran un sistema de reconocimiento de expresiones matemáticas, me seria también muy util!

    Responder >> Attention Minus Plus Votos: -12 de 18
  • #3 paulguitar
    paulguitar lunes, 12 de noviembre de 2012, 20:44

    mmm, según yo el reconocimiento de voz esta super bien en IOS a través de siri, cualquier cosa que dictes el lo escribe, por otro lado google y su traductor traducen el texto escrito automáticamente y tienen la posibilidad de hablar lo que esta escrito, ahora juntar esas dos funciones no creo que sea algo del otro mundo.

    Responder >> Attention Minus Plus Votos: -13 de 17
  • #4 carpincho
    carpincho lunes, 12 de noviembre de 2012, 21:24

    #1, #2, #3 hablaron los sabios...

    Responder >> Attention Minus Plus Votos: 16 de 26
  • #5 daniel
    daniel lunes, 12 de noviembre de 2012, 21:26

    #3, estas hablando desde una supina ignorancia. Hace años que estoy trabajando en temas relacionados y te puedo asegurar que lo que estas viendo es único.
    El reconocimiento de vos es un área en pleno desarrollo, y esto luce como un paso enorme en la dirección correcta.
    No conozco Siri por lo que no voy a opinar de algo que no conozco, pero comparar esto con google translator, es como comparar una rueda de piedra con la rueda de un F1: si las dos ruedan.

    Responder >> Attention Minus Plus Votos: 14 de 16
  • #6 ignorante
    ignorante lunes, 12 de noviembre de 2012, 21:35

    #5

    estas hablando de reconocimiento de VOZ, o de reconocerte tu mismo VOS!!!

    Responder >> Attention Minus Plus Votos: 0 de 16
  • #7 paulguitar
    paulguitar lunes, 12 de noviembre de 2012, 21:48

    #4 #5 jajajaja, esto me parece muy chistoso, es solo una simple opinión, porque se ponen a pelear, solo veo puro fanatismo como si microsoft les tomara en cuenta que lo defienden. no comparo este traductor con google traslate, si no con la funcion de traducir de google, solo escribes algo y automaticamente te lo traduce al idioma que quieras y si le das al boton hablar, te dictara todo lo traducido. acaso no es eso lo que hace el super traductor de micrisot. ahora la otra funcion de reconocer el la vos, siri hace eso desde hace mas de un año e incluso puedes interactuar con siri, preguntarle cosas y el te contesta en tiempo real. siri: http://www.youtube.com/watch?v=_WTflodhNWU

    Responder >> Attention Minus Plus Votos: -9 de 9
  • #8 paulguitar
    paulguitar lunes, 12 de noviembre de 2012, 21:54

    esta mejor este otro video http://www.youtube.com/watch?v=cgfkXlRa2vw

    Responder >> Attention Minus Plus Votos: 0 de 0
  • #9 Emiliano
    Emiliano lunes, 12 de noviembre de 2012, 22:40

    Se nota que no conoces el idioma al que traducis, sino te darías cuenta de los problemas que tiene el traductor de google al traducir algo...
    Es acertado para determinadas fraces, pero hay otras que no se entiende un carajo lo que quiso traducir.

    Si haces una prueba de traducir algo a un idioma que sepas te vas a dar cuenta de lo que te digo.

    Es un gran paso el de Microsoft, y no es fanatismo... O acaso es necesario ser fanático para reconocerle algo a una empresa?

    Responder >> Attention Minus Plus Votos: 14 de 16
  • #10 paulguitar
    paulguitar lunes, 12 de noviembre de 2012, 23:32

    en eso si tienes razon, olvidaba que el articulo es sobre el traductor. jejejeje.

    se supone que este traductor es mucho mejor que cualquier otro.

    pero escribir lo que escribes, y traducir casi en tiempo real y hablar lo que esta escrito, eso si que es viejo.

    Responder >> Attention Minus Plus Votos: -2 de 4
  • #11 Abel
    Abel lunes, 12 de noviembre de 2012, 23:35

    Y dios pensó que nos había ganado porque nos cambió el idioma ;). Ahora hay que construir una nueva Torre de Babel, el ascensor espacial.

    Hablando en serio es realmente impresionante, es sólo para mi o Microsoft mejoró bastante en los últimos años?

    Responder >> Attention Minus Plus Votos: 11 de 13
  • #12 mariano
    mariano martes, 13 de noviembre de 2012, 01:24

    Ahora vamos a poder saber que hablan los chinos en el super, si insultan o estan pidiendo mercaderia cuando estamos en la caja. ;)

    Responder >> Attention Minus Plus Votos: 5 de 5
  • #14 ralph
    ralph martes, 13 de noviembre de 2012, 02:33

    hola me llamo ralph

    Responder >> Attention Minus Plus Votos: 4 de 10
  • #15 luis manuel
    luis manuel martes, 13 de noviembre de 2012, 02:40

    se esta hablando en el tema sobre la traducción de voz y no de palabras escritas, que despues de estar escritas en la computadora , resulta mucho mas facil para el sistema traducirlas, ves la gran diferencia , asi que si es un gran logro lo del reconocimiento y traduccion de la voz, representada en palabras escritas y marcan una gran diferencia en comparacion a los grandes errores del obsoleto traductor de google #3

    Responder >> Attention Minus Plus Votos: 1 de 5
  • #16 luis manuel
    luis manuel martes, 13 de noviembre de 2012, 02:45

    y por favor no metan a Dios en estos temas, cuando se refieran a El háganlo de manera apropiada y no para hacer comparaciones absurdas, mas respeto por favor, que por mas avanzada que este la tecnología , no se le compara a sus grandes y majestuosas obras. saludos

    Responder >> Attention Minus Plus Votos: -20 de 20
  • #17 paulguitar
    paulguitar martes, 13 de noviembre de 2012, 04:42

    #15 corrijanme si me equivoco, según el video la traducción se logra en tres pasos. 1 reconocimiento de voz el cual es convertido a texto (eso es lo que digo que es viejo ya programas como dragon naturaly speaking hace tiempo lo hacen, igual que siri, y muchos otros mas). 2 traducción del texto, eso es lo que microsoft mejoro logrando menos errores y logrando una traducción mejorada y casi perfecta (he aquí el merito). 3 un sintetizador simplemente habla lo que esta escrito. (eso es viejo, recuerdo que desde en secundaria como era chistoso escribir en esos programas sisntetisadores de unos cuantos megas y luego darles play modulando la voz haciendo voces chistosas).

    #11 eso mism...
    Leer más

    Responder >> Attention Minus Plus Votos: 1 de 3
  • #18 Sebastian
    Sebastian martes, 13 de noviembre de 2012, 12:58

    Me parece genial el avance de la tecnología, ya me puedo imaginar en un futuro no muy lejano aplicaciones para el celular que traduzcan en tiempo real lo que uno habla pero lógicamente de forma correcta ya que existen intentos de hacer esto pero son un desastre. El único "problema" seria que uno tendría que hablar modulando muy bien (oomo locutor de radio) y no usar modismos.

    Responder >> Attention Minus Plus Votos: 3 de 3
  • #19 M.A. Baracus
    M.A. Baracus martes, 13 de noviembre de 2012, 22:42

    #16 Calla loco.

    Responder >> Attention Minus Plus Votos: 5 de 7
  • #20 aerial
    aerial miércoles, 14 de noviembre de 2012, 03:42

    15 Si, es mas innovador y meritorio el Iphone 5...

    Responder >> Attention Minus Plus Votos: -1 de 3
  • #21 Carolo
    Carolo miércoles, 14 de noviembre de 2012, 12:53

    Es impresionante lo que han logrado, pero hubiera deseado que este gran paso lo hubiera dado otra compañía. Microsoft solo retrasa el avance al buscar sacar ganancias de sus productos, una pena.

    Responder >> Attention Minus Plus Votos: -1 de 5
  • « «« Anterior12Siguiente »» »
    Cargando...Cargando...

  • nuevo comentario
    Nombre

    Campo obligatorio

    Email

    Escriba una dirección de correo electrónico con el formato sunombre@ejemplo.com.

    Campo obligatorio

 
Ir arriba