Internet y el Español

En \”Internet y el Español\”, su último libro, José Antonio Millán, lingüista y editor digital, intenta cuantificar la importancia de la lengua española en la Red en función de diversos criterios. Para Millán, la expansión del lenguaje viene dada sobre todo por sus usuarios. Por ello, para potenciar su desarrollo, hay que cuidar factores como la penetración de Internet, la de PCs (España dispone de 14 PCs por cada 100 habitantes, por 23 de la media europea y 46 de la estadounidense, según datos del anuario de la Unión Internacional de Telecomunicaciones), reducir las elevadas tarifas de acceso o flexibilizar las todavía rígidas estructuras financieras. Sin ello, no será posible disfrutar de una cultura digital de \”calidad\”. Pero los instrumentos de medición de la importancia de una lengua no están del todo afinados, menos aún cuando todavía está por definir en qué consiste la cultura digital, una mezcla de componentes muy distintos.

La dificultad de acotar el tamaño de una lengua

El primer problema al que se enfrenta quien se imponga como tarea establecer el tamaño de una lengua en Internet es encontrar las herramientas necesarias para hacerlo. Los buscadores, especialmente adaptados a las especificidades de la lengua inglesa, no son capaces de rastrear todos los sitios en castellano, ni tampoco de indizar eficazmente sus contenidos.

Clave:GG=Google, FAST=FAST, AV=AltaVista, INK=Inktomi, WT=WebTop.com,
NL=Northern Light, EX=Excite.

(a) Google, por motivo de su peculiar estructura, puede alcanzar páginas que nunca ha visitado, por lo que pese a disponer de únicamente 705 millones de páginas indexadas su alcance real es de 1.300 millones de páginas
(b) En el caso de Inktomi, la compañía separa entre sus 110 millones de documentos \”Lo mejor de la Red\” y los 390 de \”El resto de la Red\”. Pese a ello, la mayoría de sus clientes busca en ambas bases de datos.

Los estudios realizados hasta la fecha parecen indicar que ningún buscador cubre más del 50% de los contenidos existentes en la Red. A comienzos de 2000, un informe elaborado de forma conjunta entre Inktomi y el NEC Research Institute establecía el número de nodos en casi 5 millones, mientras que el número de páginas superaba ya los 1.000 millones, de las cuales el 86,55% eran en inglés, por tan sólo un 2,36% del francés.

Por su parte, otro estudio, este de BrightPlanet, señala que la Red invisible (la que permanece fuera del alcance de los buscadores) tendría una extensión 500 veces mayor que la visible. Su tamaño total sería de 550.000 millones de documentos, en su mayoría páginas dinámicas.

Además, las herramientas de búsqueda no son capaces de identificar todos los documentos relacionados con los aspectos específicos de una lengua o cultura pero que están escritos en otra (p.ej. las páginas de información turística de España destinadas a extranjeros).

En cualquier caso, como señala Millán, el estudio más completo -las cifras son a menudo dispares- es el realizado por Funredes en septiembre de 2000 y publicado el 31de marzo de 2001. En él se estudia la presencia de cinco idiomas latinos (castellano, francés, italiano, portugués y rumano) en Internet y se compara su situación con la del idioma inglés.

En él se establecen dos conclusiones importantes: la disminución del tamaño relativo del inglés (dado el crecimiento del contenido en otras lenguas) y el crecimiento moderado del español (superior al francés, aunque, curiosamente, inferior al portugués).

Cruzando estos datos con los del número de navegantes por país, Millán encuentra otra conclusión interesante: el porcentaje de páginas/internautas se mantiene entre el 0,79% del portugués y el 1,21% del inglés o, lo que es lo mismo, a mayor número de navegantes, mayor número de páginas: \”La Red la hacen sus usuarios, no sólo las empresas y las instituciones\”, en palabras del lingüista.

¿Valen lo mismo peras que manzanas?

En cualquier caso, y como bien señala Millán, hay que ser capaces de medir la calidad de la información. No son lo mismo las obras literarias y culturales en el dominio público (no sujetas a derechos de autor), o las obras de referencia, que la información contenida en una página privada.

Por otra parte, no basta con conocer el número de páginas para dar cuenta de la fortaleza de una lengua en la Red, ya que ésta no tiene valor por sí misma, sino que también es necesario conocer el número de veces que se accede a esas páginas. Para ello es necesario disponer de datos como el número de navegantes efectivos o de páginas vistas por navegante. Sin embargo, no hay que olvidar otros factores adicionales que pueden arrojar luz sobre el peso relativo de una lengua, como el número de dominios nacionales (que representan una cierta voluntad de permanencia y que a menudo tienen detrás el respaldo de una compañía, pero que en España no son más que un par de docenas de miles, dada la dificultad existente para registrar un dominio \”.es\”), la utilización de los servicios (en algunos, como los chats, España es un país líder) o la tasa de renovación de las páginas (de nada sirve tener terabytes de información si luego no se renueva).

Por eso, cuando el Ministerio de Ciencia y Tecnología establece (finales de 1999) como objetivo en el Plan Info XXI alcanzar el 15% de los contenidos totales de la Red en tan sólo tres años, hay que preguntarse antes: ¿qué contenidos?