Es un tema al que llevo tiempo dándole vueltas. Obviamente, debido a la naturaleza de Yakki y lo que estamos intentando hacer. Hablando de Yakki el otro día, me plantearon la pregunta: "¿Por qué le pedimos al usuario que cambie su comportamiento, aparentemente?". Una pregunta muy buena. ¿Qué ganan ellos con esto? ¿Por qué es importante y cómo nos ayuda esto a avanzar hacia el futuro?

Una Herramienta Para Cada Labor

La comodidad de dictar en lugar de teclear es evidente, aunque no es aplicable universalmente. En algunas situaciones, escribir puede ser más eficiente o adecuado para la tarea.

Pienso en el ejemplo del ascensor. En el ascensor, podrías decir en voz alta a qué planta quieres ir, los sistemas del ascensor "escucharían" y te llevarían a la planta. O podrías pulsar el botón del piso al que quieres ir, y eso sería mucho más rápido y eficiente.

Cuando Tiene Mas Sentido Dictar Que Escribir

En otros escenarios, es mucho más eficiente dictar. Por ejemplo, en lugar de tener que escribir un correo electrónico, dictarlo es probablemente mucho más eficaz. Es más rápido, pero también conlleva su propia serie de retos.

Tu cerebro procesa la información de forma diferente cuando tienes que pensar en lo que estás escribiendo comparado con cuando tienes que dictarlo. ¿Existe una equivalencia directa (uno a uno) entre escribir y dictar donde el dictado sea 3,75 veces más rápido, sin revisiones? No lo creo, al menos no al principio.

Teclear es una habilidad que hemos desarrollado durante años de práctica y estudio, mientras que dictar no nos resulta tan familiar. Usamos nuestra voz para casos muy concretos, y hay poco solapamiento en cómo opera el cerebro en ambas instancias. Pero si queremos ser justos, escribir nunca ha sido un proceso completamente lineal (para la mayoría de nosotros, los mortales).

Cambiar Cómo Piensas

En mi caso, estoy muy acostumbrado a escribir, y mi proceso mental al hacerlo es mucho más exhaustivo que cuando dicto. Para que el dictado sea tan efectivo como mi escritura, tendría que cambiar esencialmente mi forma de pensar.

Hay algunas publicaciones científicas que respaldan esto (lo que significa que mi percepción no es totalmente errónea). El artículo "Speech Recognition Technology and Students With Writing Difficulties: Improving Fluency" sugiere que el dictado no solo acelera la entrada de datos; cambia cómo el cerebro compone el texto.

Al eliminar la tarea manual de teclear, se libera "memoria de trabajo" para una ideación de mayor nivel, lo que conduce a borradores más largos y lingüísticamente más ricos. Al comparar ambos, el artículo llegó a la conclusión de que los textos dictados eran sustancialmente más largos y "ricos", conteniendo argumentos más complejos y un discurso explicativo.

El Cuello de Botella de Transcribir

La teoría es que teclear crea un "cuello de botella de transcripción". Cuando eliminas ese cuello de botella mediante la voz, consigues un "volcado de ideas" (brain dump) de mayor calidad. Estas ideas pueden requerir limpieza y ajustes, pero su profundidad general es mayor.

Aun así, existe una ventaja significativa al dictar en la mayoría de los escenarios, y hay muchas ventajas potenciales en términos de velocidad y fluidez comparado con tu proceso de escritura habitual.

Un Flujo de Trabajo Híbrido

Mi forma de trabajar coincide esencialmente con los hallazgos de estos otros documentos, "Revisions in written composition: Introducing speech-to-text to children with reading and writing difficulties", que estudian los patrones de revisión en usuarios de conversión de voz a texto (STT).

Uno de los hallazgos clave es que los usuarios suelen adoptar un flujo de trabajo "híbrido": dictan ráfagas de ideas y luego cambian al teclado para el trabajo de precisión de la edición.

Los Números Reales

A fin de cuentas, la equivalencia no es de 3,75 veces porque también hay muchas correcciones o momentos en los que tengo que volver atrás y repensar lo que intentaba decir para reformularlo de una mejor manera.

Los datos cuantitativos más agresivos provienen del campo médico, donde la documentación eficiente es un problema crítico. Estos estudios son actualmente los más citados en círculos profesionales debido a su impacto económico.

Este artículo, "A multi-country study comparing typed to automatic speech recognition-based medical documentation speeds", tras estudiar el trabajo de miles de médicos, define una cifra para la "velocidad ajustada por errores". Al ajustar por el tiempo requerido para corregir errores en la transcripción, el dictado seguía siendo 2,5 veces más rápido que teclear.