El coste de un trabajo de traducción está estrechamente ligado al número de palabras que contiene el mismo. Contar las palabras de un documento es una tarea en principio sencilla, no obstante, a lo largo de mi carrera profesional me he encontrado desde documentos de texto sencillos en los que es fácil realizar el conteo de palabras hasta textos escaneados en formatos de lo más diversos (tiff, pdf, jpg, etc.) en los que ya no es tan sencillo realizar el recuento.
En este artículo, dirigido principalmente a clientes de traductores, voy a tratar de explicar cómo realizar el recuento de palabras de un documento para poder realizar un adecuado presupuesto. Muchos clientes, antes de solicitar presupuesto a un traductor, prefieren realizar ellos mismos este recuento para poder comparar precios y tener una idea aproximada previa de lo que les costará la traducción.
Pueden darse dos casos diferentes: disponer de un documento original en papel (ya sea manuscrito o realizado electrónicamente) o disponer de un documento en formato electrónico.
TE VOY A HABLAR DE...
1. Documento original en papel
Al margen de las traducciones juradas que se realizan sobre documentos oficiales (partida de nacimiento, libro de familia, título universitario, etc.), cada vez es menos habitual encontrarse con documentación en papel. En el caso de las traducciones juradas muchas veces se realiza el presupuesto por página y tipo de documento, y no por palabra.
Dejando al margen este caso, cuando nos encontramos ante un documento en papel existen tres opciones:
- Contar las palabras de manera manual una a una. En el caso de documentos largos es un trabajo demasiado laborioso.
- Contar las palabras por muestreo. Para evitar tener que contar todas las palabras, es posible realizar un cálculo aproximado tomando una muestra representativa de hojas de tu documento. Por ejemplo, tomar al azar dos o tres líneas representativas de cada página, contar la cantidad de palabras de cada línea y sacar un promedio. Después realizar un cálculo promedio del número de líneas por página. Una vez realizado el cálculo promedio de palabras por hoja, sólo quedará multiplicar este promedio por el número de páginas. Sí, ya sé, demasiado complicado. Afortunadamente hace años que no tengo que realizar un recuento de esta manera.
- Utilizar un programa profesional de reconocimiento de texto. El programa informático Abbyy Finereader Engine (http://www.abbyyeu.com/es/) permite realizar el reconocimiento óptico de caracteres de cualquier documento que hayamos escaneado. Funciona bastante bien en el caso de documentos hechos por ordenador y nos permite realizar el recuento de la palabras. Sin embargo, se trata de un programa de pago
2. Documento en formato electrónico
Lo más habitual hoy en día es disponer del documento en formato electrónico. En este caso, tenemos tres opciones para realizar el conteo:
- Herramientas de traducción asistida (CAT). Las herramientas CAT actuales que utilizamos los traductores en nuestro trabajo (Trados, Wordfast, Memsource, etc) permiten realizar el recuento de la mayor parte de formatos de archivos. Puesto que este artículo iba dirigido a clientes finales de traductores, no me extenderé en este apartado puesto que estas herramientas no suelen ser utilizadas por el público en general
- Herramientas específicas para el recuento de palabras. Existen multitud de programas informáticos (no de traducción) para realizar la tarea de contar las palabras, tanto gratuitos (por ejemplo, Translator´s Abacus) como de pago (Finecount). También existen muchas páginas web online que pueden realizar el recuento pero si se trata de un documento confidencial esta no es muy buena opción. Por ello, no me voy a detener en este apartado, sino que iré directamente al siguiente que es el que más interesará al cliente.
- Utilizar el programa origen en que se creó el archivo. Dada la diversidad de programas y formatos de archivos que existen, me centraré en los más habituales:
- Microsoft WORD (Archivos con extensión *.doc, *.rtf, *.txt). Abrir el documento e ir a «Herramientas», y después a «Contar Palabras».
- Microsoft EXCEL (Archivos con extensión *.xls). No se pueden contar las palabras directamente desde EXCEL. Deberá copiarse todo el texto a MS-WORD y contarlo ahí. Para ello abrir el documento, seleccionar todo el texto a traducir en la hoja de cálculo de Excel. Copiar el texto desde el menú de «Edición» de Excel. Ir a WORD y pegar el texto en un documento vacío usando el menú de «Edición». Por último, ir a «Herramientas», y después a «Contar Palabras».
- Microsoft POWERPOINT (Archivos con extensión *.ppt). Abrir el documento e ir a «Archivo» y después a «Propiedades». Luego seleccionar la pestaña central, llamada «Estadísticas». Aparecerá una ventana en la que aparecen ciertas propiedades del archivo, entre otras, el número de páginas, párrafos, líneas y palabras.
- Microsoft ACCESS (Archivos con extensión *.mdb, *.dbf). Abrir documento. Ir a «Herramientas», después a «Vínculos con Office», y después a «Publicar con MS Word». Luego ir a WORD, aparecerá la misma tabla, pero ya en formato *.rtf, es decir, como documento WORD. Por último, ir a «Herramientas», y después a «Contar Palabras».
- QuarkXPRESS (Archivos con extensión *.qxd). Abrir el documento. Ir a «Utilidades», después a «Verificar Ortografía» y por último, seleccionar «Documento». Aparecerá una pequeña ventana y realizará un «Recuento de Palabras».
- Adobe ACROBAT (Archivos con extensión *.pdf). No se pueden contar las palabras directamente desde el Adobe Acrobat o Acrobat Reader. Se deberá copiar todo el texto a MS-WORD y contarlo ahí. Para ello: abrir el documento en Adobe Acrobat. Seleccionar todo el texto que se desea traducir. Copiar el texto desde el menú de «Edición» de Acrobat. Ir a WORD y pegar el texto en un documento vacío usando el menú de «Edición». Por último, ir a «Herramientas», y después a «Contar Palabras». Otra opción, si se dispone de una versión de pago de Adobe ACROBAT PROFESSIONAL es convertir el archivo directamente a WORD.
- Adobe INDESIGN. Para saber cuántas palabras hay en un bloque de texto en InDesign basta con hacer click en un bloque de texto con la herramienta «Texto». Una vez hecho eso, podemos consultar el menú «Ventana», pinchar en «Info» y aparecerá la cantidad de palabras. El problema radica en que si tenemos el texto en diferentes bloques, tendremos que realizar esta operación uno a uno para finalmente realizar la suma de las palabras de todos los bloques. Existe una extensión de InDesign que sí que permite contar las palabras de todo el documento sin tener que realizar el recuento bloque por bloque, pero esta extensión es de pago. Se llama Text Count for Adobe InDesign/InCopy y cuesta 65 euros. Resulta sorprendente que un software de la calidad y del coste de Adobe Indesign no lleve de serie ya incorporada esta función. Imagino que la acabará incorporando.
Ya sé que hay más formatos, pero estos creo que recogen la mayor parte de los tipos de documentos con los que he trabajado. Próximamente escribiré otro artículo similar a este sobre las distintas opciones existentes para contar las palabras de una página web (tanto de los contenidos como del código interno) y poder realizar un adecuado presupuesto al cliente.
Excelente artículo Irena, muchas gracias. Quisiera compartir contigo algunas dificultades que he tendio con la labor de traducción. Hago traducciones en los idiomas Inglés, castellano y portugués. Se me ha presentado problemas con el conteo de palabras en especial cuando hago la conversión de un documento de pdf a word. Resulta que el programa trata también de identificar las palabras de las imágenes pero las transforma en caracteres raros o diferentes que cuenta en el conteo de palabras, aumentando mucho la cotización. Me ha tocado hacer una depuración del documento word lo que me genera un extra tiempo que a veces no es aconsejable. El otro inconveniente es que en ocasiones hay documentos de pdf que al convertirlos a word igualmente cuenta más palabras de lo real porque a veces algunas palabras las separa llegando inclusive a que una sola palabra la cuenta como 7 veces porque sus caractéres no están unidos. Que programas me podrías aconsejar para contar palabras en PDF? que no tenga que convertir a word y evitar los inconvenientes que he presentado, muchas gracias
Sí, es algo problemático contar las palabras de los PDF. Lo mejor es pedir al cliente el archivo original con el que se creó el PDF para poder realizar el conteo (el problema es que el cliente muchas veces no lo tiene tampoco)
Gracias Irena. La verdad ya lo pude resolver a través de uno de los links que enviaste en tu artículo, que es el programa wordcount, a través del cual pude contar las palabras en un archivo pdf, muchas gracias
Puedes contar los PDFs (y muchos otros formatos) online en mi sitio http://www.josenegro.com/wo…
Excelente Porkopek, muy bueno tu sitio, muchas gracias
Millones de gracias por la información en este artículo, me ha ayudado bastante.
Un cordial saludo.
Un excelente artículo, seguro que ayuda a mucha gente. Respecto a la cuenta de caracteres en Word,y desde el punto de vista del público en general, hay un pequeño problema cuando trabajas con muchos documentos diferentes y necesitas contarlos (por ejemplo para facturar por palabra o por caracter), necesitas contar cada vez en cada documento, para evitarlo he desarrollado una sencilla herramienta «CountWord» que permite contar en muchos documentos Word de una vez.
Aquí se puede ver la demo (y también comprarla si os interesa).
http://www.agustingarcia.es…
Hola Agustín, gracias por tu aportación
Un saludo
Irena