El reconocimiento de voz es algo complicado, aunque ha avanzado a pasos agigantados en las últimas décadas, el mejor software aún dista de ser tan bueno como el oído humano. Sin embargo, el software más reciente de IBM solo tiene un porcentaje de error del 5,5 por ciento, batiendo su propia marca, que estaba anteriormente en el 6,9 por ciento.

Otras empresas, como Microsoft, han conseguido recientemente porcentajes de error del 5,9 por ciento, lo cual indicaron que estaba a la par que el oído humano. Sin embargo, desde IBM consideran que el porcentaje logrado puede aún mejorarse, habiendo determinado que el oído humano tiene un porcentaje de error aún más bajo, del 5,1 por ciento.

IBM ha conseguido este bajo porcentaje de error empleando redes neutrales artificiales y modelos de lenguaje WaveNet con tres modelos acústicos fuertes. Para validar los resultados han empleando las muestras de conversaciones teléfonicas SWITCHBOARD, que llevan años empleándose con este propósito, incluso aunque no sea el estándar de la industria para hacer la comparación de la fiabilidad del software con respecto al oído humano.

Vía: EnGadget.