Revisión de Vocalmatic

Vocalmatic es un servicio de transcripción en línea creado por una empresa canadiense Enactics Inc.

Según su sitio, existe para "ayudar a las personas que trabajan con grabaciones de audio a ahorrar tiempo al transcribir su audio y video a texto".

Dada la cantidad de diferentes herramientas de transcripción en línea disponibles, ¿qué hace que esta sea especial?

  • ¿Quieres probar Vocalmatic? Echa un vistazo a la página web aquí

Planes y precios

Cuando se inscribe en Vocalmatic, se le otorgan inmediatamente 30 minutos de tiempo de transcripción, y cuando se agota, se pueden comprar horas adicionales a partir de $ 15 por una sola hora.

Cuantas más horas compre, menos costarán, con 90-100 horas que cuestan un promedio de solo $ 6 por hora.

Esos precios son para usuarios individuales y Enactics ofrece precios flexibles para empresas donde varios usuarios requieren acceso y los volúmenes, presumiblemente, serán altos.

Si tiene un requisito de volumen, la mejor manera de reducir los costos es utilizar un pase diario. Estos permiten el uso ilimitado del servicio durante un día con un límite de tres archivos por hora.

Usar estos pases un solo día cuesta $ 15, tres días $ 17 y siete días son $ 25, y si puede organizar todo su trabajo en bloques, esta es la forma más barata de usar Vocalmatic.

Diseño

Incluso según los estándares de transcripción en línea, Vocalmatic es básico. Pero, a la inversa, lo hace notablemente sencillo de usar incluso para aquellos con habilidades informáticas limitadas.

El sencillo proceso de cuatro pasos comienza cuando usted define si tiene audio, video o exclusivamente para clientes estadounidenses, le gustaría llamar y que sus palabras se transcriban directamente.

La mayoría de los usuarios utilizarán archivos de audio o video y, en el paso 2, estos se cargan en el sitio de Vocalmatic. Los tipos admitidos actualmente incluyen; Archivos de audio mp3, m4a, mp4, flac, ogg, wav, aac, opus, oga, mogg, webm y wma.

El tercer paso es definir de qué nacionalidad es el hablante, y el cuarto paso es decir cómo le gustaría el resultado.

Los idiomas son sin duda un punto fuerte de este sistema, ya que actualmente transcribe inglés, español, francés, alemán, portugués, italiano, holandés, polaco, checo, rumano, chino (mandarín), chino (cantonés), japonés, filipino, vietnamita, árabe. , Persa, hindi, tailandés, coreano, urdu, turco, hebreo, griego, búlgaro, ruso, finlandés, sueco, danés, afrikaans, amárico, armenio, azerí, indonesio, malayo, bengalí, catalán, vasco, gallego, georgiano, gujarati , Croata, zulú, islandés, javanés, canarés, jemer, lao, letón, lituano, húngaro, malayalam, marathi, noruego, serbio, ucraniano, cingalés, eslovaco, esloveno, sundanés, swahili, tamil y telugu.

Por impresionante que sea esa lista, no se reconocen todos los acentos y dialectos de cada idioma.

Una opción de salida predeterminada utiliza un formato simple y la opción SRT está diseñada para aquellos que crean subtítulos para un video.

Con esas selecciones realizadas y el archivo proporcionado, si le queda suficiente tiempo en la cuenta, el sistema comenzará a procesar el archivo en texto.

Se envía un correo electrónico para anunciar que el sistema ha iniciado el proceso y se envía otro una vez que se completa.

El tiempo que demore depende completamente de qué tan ocupados estén los servidores de Vocalmatic, pero en general, descubrimos que estaba cerca del momento de la grabación, o tal vez un poco más.

Una grabación de 19 minutos que procesamos tardó unos 28 minutos en renderizarse, pero otras partes más cortas fueron proporcionalmente más rápidas.

Una vez que se procesa el archivo, puede ir a un editor y ver cómo le fue, y hacer algunos ajustes en el formato y el contenido.

Lo que este sistema no hace es proporcionar ningún formato gramatical. No inserta retornos de carro entre las oraciones, independientemente del espacio en el habla, y no siempre escribe los nombres en mayúscula.

Y coloca el código de tiempo entre fragmentos de transcripción incluso cuando no lo está utilizando para la generación de archivos SRT.

El audio se puede reproducir en el editor de contenido, pero no intenta mostrarle en qué parte de la transcripción se encuentra el audio.

Una vez que esté "satisfecho" con los resultados, el texto se puede exportar como un documento de Word o archivo de texto en el modo predeterminado, y archivos SRT si elige ese modo de salida.

Precisión

En las preguntas frecuentes de Vocalmatic, "Esperamos una precisión del 80 al 90% en un audio claro. Si hay mucho ruido de fondo o si las personas están hablando al mismo tiempo, la transcripción puede tener una precisión inferior al 10% ".

Bueno, en las pruebas limitadas, incluso fragmentos de audiolibros, con el audio más claro posible, no logramos ese nivel de precisión.

Incluso en sus mejores intentos, a menudo repetirá parte de un párrafo o palabras, se equivocará en el nombre de la oración anterior y se llenará de errores la transcripción.

Cuando las grabaciones no son impecables, como nuestras pruebas de discursos históricos, los resultados pueden ser incomprensibles.

Lo que nos pareció más preocupante es que cuando tiene un problema con una palabra o frase, Vocalmatic arroja letras sueltas al azar. En inglés, el idioma que usamos para probar, una letra "y" por sí sola no es una palabra, y tampoco es "m", "k" o "t".

El hecho de que la salida no se ajuste a ningún diccionario o formas gramaticales definidas no parece ser un problema para el software. También carece de comprensión del contexto, ya que interpretó repetidamente son como "Sol".

Cuando tiene en cuenta todas las correcciones y agrega puntos, comas y mayúsculas correctamente, incluso los mejores intentos requieren un ajuste sustancial para que se consideren precisos.

Veredicto final

Este servicio no es barato, tan rápido o muy preciso.

La alegría de tener 30 minutos de tiempo libre se desgasta inquietantemente rápidamente, incluso si la solución es muy accesible y muy fácil de usar.

Una de las ventajas que tiene el tiempo libre para un cliente potencial es que le permite cargar un ejemplo de las grabaciones que probablemente necesite transcribir y ver cómo funciona.

Solo procederíamos si devuelve texto que generalmente representa lo que se dijo en el audio, pero pruebe otras opciones antes de pagar por esta.

En comparación con algunas de las otras opciones, sobre todo Transcribe de Wreally, Trint y Happy Scribe, esto no es lo suficientemente preciso como para que valga la pena el gasto.

Tal vez seamos poco amables y es brillante transcribiendo swahili u otros idiomas, pero basándonos puramente en sus esfuerzos con el inglés, elegiríamos otra cosa.

Articulos interesantes...