A la hora de realizar un presupuesto de localización y traducción de una página web hemos de saber el número de palabras que tendremos que traducir. Esto que es fácil de realizar en el caso de un archivo de Microsoft Office o Acrobat (ver artículo anterior sobre Cómo contar las palabras de un documento), no resulta tan sencillo en el caso de una página web puesto que la misma contiene código interno, tales como las metaetiquetas, títulos, texto alternativo de imágenes, etc, que es casi más importante traducir que el texto propiamente dicho, para posicionar nuestra página web en los principales buscadores.
Una opción para evitar contar las palabras es realizar el presupuesto en base a las horas estimadas que dedicaremos al proyecto pero esto resulta todavía más complicado, sobre todo si tenemos que realizar la traducción directamente en algún gestor de contenidos (WordPress, Joomla, Drupal, etc), con el cual no estemos familiarizados.
Para contar el número de palabras de una web pueden darse dos opciones: que el cliente nos proporcione todos lo archivos a traducir (ya sea en formato html, xml, txt, xliff, etc) o que simplemente nos proporcione la dirección de su página web.
Opción 1: el cliente nos proporciona todos los archivos web
Esta es la opción más sencilla, puesto que si disponemos de todos los archivos del sitio web (ya sea de una página estática o de una dinámica), podremos hacerlo de dos maneras:
- Herramientas de traducción asistida (CAT). Tendremos que introducir todos los archivos en nuestra herramienta de traducción favorita (Trados, Wordfast, MemoQ, Memsource, etc) para realizar el recuento. Estas herramientas realizan un adecuado conteo de palabras puesto que «conocen» la mayoría de formatos de archivos a traducir y cómo tienen que realizar el recuento, puesto que no es lo mismo realizar el recuento de un archivo html que de un archivo de Word.
- Herramientas específicas para contar palabras. Existen muchos programas informáticos (no de traducción) para realizar la tarea de contar las palabras, tanto gratuitos (Translator´s Abacus) como de pago (WebBudget, Finecount). También existen muchas páginas web online que pueden realizar el recuento de archivos pero ninguna de las que he probado me ha convencido. Además, si se trata de documentos confidenciales ésta no es la mejor opción
Opción 2: el cliente sólo nos proporciona su dirección web
Suele ser bastante frecuente que el cliente nos proporcione la dirección de su página web y quiera un presupuesto de traducción de su página web. Le podemos solicitar los archivos de su web pero muchas veces la persona que nos encarga el presupuesto no es el webmaster de la página pero quiere un presupuesto inmediato. En este caso tenemos las siguientes opciones:
- Extraer los archivos de la página web. Existen multitud de programas informáticos que nos permiten extraer todos los archivos de una página web, como por ejemplo, HTTrack, y con posterioridad realizar el recuento con algunos de los programas mencionados en el apartado anterior. No obstante, la opción que mejores resultados me ha dado ha sido la que comento en el apartado siguiente.
- Contar las palabras online. Existen en el mercado diversas alternativas para realizar el recuento de palabras online pero la que considero que es la mejor es la utilización de una aplicación denominada TransAbacus (http://www.transabacus.com/). La gran ventaja de esta aplicación es que permite realizar el conteo de manera online, sin necesidad de extraer el texto o descargar los contenidos de la página web. Además cuenta el texto que no se ve como la descripción y el título.
Esta aplicación nos permite contar los siguientes elementos:
- Body. Es decir, el texto que los usuarios pueden leer en una página web.
- Title. La etiqueta del título que puede verse en la parte de arriba del navegador en cada una de las páginas que visitamos.
- Description. Es el texto que describe las páginas del sitio web de manera resumida. Usualmente los buscadores la muestran en los resultados de una búsqueda bajo el título del enlace.
- Keywords. Es una lista de términos que definen la temática de la página web. Antes era muy usada por los buscadores pero en la actualidad ya no, aunque algunos buscadores rusos como Yandex, sí que las tienen todavía en cuenta.
- Alt text (Texto alternativo). Es el texto que el usuario puede ver cuando pasa el puntero del ratón por encima de la imagen. Los buscadores utilizan este texto en las búsquedas de imágenes que realizan los usuarios.
Las etiquetas Title, Description y Alt text son extremadamente importantes para los buscadores, motivo por el cual deben ser traducidas cuando se realiza la localización de una página web y, por tanto, deben ser contadas a la hora de realizar un presupuesto de traducción (para más información sobre las metaetiquetas puede consultarse el artículo: «La localización y traducción de una página web al ruso: las metaetiquetas«). Además, este programa tiene otras opciones muy interesantes: permite contar la cantidad de palabras de archivos pdf, txt y rtf enlazados en la web, y dispone de la opción «Raw Count», que permite que TransAbacus ignore frases repetidas, entendiendo por éstas, cadenas con guiones, comas o paréntesis. Esta es una opción importante para todos aquellos traductores profesionales que utilizan herramientas de traducción asistida como Trados.
La versión de prueba de este programa permite contar hasta 5 páginas dentro de una web. La de pago no tiene limitaciones pero tiene un coste de unos 35 dólares, aunque vale la pena. Sin embargo, la última versión de prueba de este programa (2.0.2.12) tiene un bug que hace que una vez haya contado las 5 primeras páginas, si volvemos a pulsar en el botón «Count», cuenta otras 5 páginas más y así sucesivamente, de manera que podemos contar las palabras de toda la página web sin coste alguno (en la última versión de noviembre de 2013 este bug ha sido solucionado).
Por último, comentar que a la hora de realizar el recuento de palabras, es muy frecuente que el cliente no quiera traducir ciertos apartados de su página web como por ejemplo el blog, noticias, foros, etc, por lo que deberemos restar el número de palabras correspondientes a este apartado. También es frecuente encontrar clientes que no desean traducir los archivos pdf enlazados que contiene su página web.
Otras opciones: WordPress y Easyling
Para finalizar, añado otras dos opciones de recuento: la primera correspondiente al gestor de contenidos de WordPress y la segunda a una aplicación en la nube de localización y traducción de páginas web.
- WordPress y WPML. WordPress, el gestor de contenidos de sitios web más extendido en todo el mundo, ofrece diferentes posibilidades para traducir una página web (ver artículo: Cómo tener nuestra página web de WordPress en varios idiomas). El plugin de traducción WPML permite realizar el recuento de palabras, para lo cual deberemos tener acceso al backend de la página web.
- Easyling. La empresa Skawa Innovation Ltd con sede en Hungría ha desarrollado una solución de traducción en la nube de páginas web denominada Easyling – 1 click website translation. Se trata de una herramienta de pago (con diversos planes) dirigida tanto a profesionales de la traducción (agencias y traductores) como a particulares y nos permite realizar también el conteo de palabras para la realización de presupuestos. Si nos registramos nos ofrece una prueba gratuita de 30 días con todas las funcionalidades del servicio.
¿Qué opciones utilizáis vosotros para el recuento de palabras de una página web?
Hola,
tengo que hacer un presupuesto de traducción de la página Web de una empresa y necesito saber el número de palabras. Lo he intentado siguiendo los pasos que propones, pero la versión transabacus gratuita actual sólo cuenta las 5 primeras páginas.
Es posible que lo pueda contar por otra vía. Normalmente no hago este tipo de trabajos y no quiero comprar el programa.
Muchas gracias.
Hola Anna,
Puedes copiar y pegar los textos de cada una de las páginas de la web en un archivo Word y contar las palabras allí, teniendo en cuenta que es una tarea un poco tediosa y que es fácil que te dejes textos por copiar. También le puedes pedir al cliente si puede enviarte todos los textos en algún archivo.
Saludos
Irena
Primero felicitarte por la Web. Muy útil y bien constrída.
Muchísimas gracias por la tan rápida respuesta. La verdad que lo de ir pegando en un documento Word es muy laborioso y creo que un poco imperfecto. También me he puesto en contacto con el informático de la empresa para pedirle a él esta información. Espero que me diga algo. Yo os he escrito porque he visto los comentarios tan interesantes que se hacían en vuestra página sobre el programa transabacus y cuando lo he utilizado me ha pasado eso. Los comentarios los hacían hace unos años y ahora ya no se puede usar gratuítamente para contar toda una Web. Sólo quería saber si había otro programa que sí diera la opción de contar todas las páginas de una Web sin coste.
Muchas gracias por tu interés.
Hola Irena,
He llegado a tu blog buscando información sobre cómo contar las palabras de una web, ya que he recibido mi primera petición de presupuesto en este sentido y me ha parecido muy interesante y de gran ayuda.
Una consulta: sabes si una vez compras Transabacus debes renovar la licencia anualmente o se compra una vez y ya está.
Muchas gracias por todo.
Begoña Esteban
Hola Begoña. La licencia solo se paga al principio, no hay que renovarla. Eso sí, solo la podrás registrar y utilizar en un ordenador. Si quieres utilizar el programa en otro ordenador deberás primero desinstalar la licencia y luego instalarla en otro ordenador. Un saludo y gracias por tu comentario.
gracias por tu consejos, voy a tener hacer mejor mi propia pagina web
¡De nada!
Recomiendo esta herramienta, que cuenta caracteres, palabras y densidad de palabras
Contador de caracteres.
A mi me ha sido útil.
Un saludo.
Hola Danna. No la conocía. Interesante herramienta para conocer, entre otras cosas, la densidad de palabras claves cuando se redacta un artículo. Gracias por el aporte.
Saludos
Irena