BAQUIA

Hacia el idioma de la globalización

En la Era de la Globalización nuestro vecino habita al sur de Vietnam. La potencia de Internet amplifica nuestro mensaje haciéndolo llegar a cada rincón del planeta. Pero que nuestra voz se escuche muy lejos no es suficiente: se tienen que entender nuestras palabras allá donde lleguen.

En la Era de la Globalización hay un idioma, el inglés, que saca pecho frente a todos los demás. Se impone tanto por su número de hablantes como por su enorme potencia económica. Además, un gran porcentaje de la producción científica y técnica nace en territorio anglosajón (o lo producen en inglés nativos de otros países, expatriados o no, que saben que en su idioma sus textos no tendrán el mismo eco) y los términos que genera penetran casi sin resistencia en todas las culturas.

No se concibe el profesional de la \’Nueva Economía\’ que no sea, cuando menos, bilingüe; y que entre los idiomas en los que es capaz de comunicarse no esté el inglés. La conquista planetaria del inglés lucha contra las corrientes nacionales que tratan de potenciar la cultura y el idioma propios, con las academias que apuntalan su lenguaje para preservarlo del barbarismo, con las mezclas idiomáticas que provoca la emigración, con los gigantes asiáticos (China e India) que sólo con su población sitúan su idioma entre los más hablados del planeta… El inglés domina con holgura, pero en su idioma no se acaba el mundo.

En Internet el peso específico del inglés se multiplica. Hasta un 80% del contenido de las páginas de la Red está escrito en la lengua de Shakespeare, dato que choca con el porcentaje (alrededor del 50%) de internautas anglófonos. Pero como quiera que nadie está dispuesto perder el tren de la Nueva Economía, los gobiernos realizan esfuerzos más o menos importantes para que sus países estén presentes en la red de redes, para que existan contenidos no ya en su idioma, sino producidos por y para su cultura.

Al interés cultural por el que cada nación potencia su idioma en la Red, se une el auge imparable del comercio electrónico, que impulsa la apertura de los mercados y fomenta la necesidad de vender en varias lenguas. Las cibertiendas que pretenden saltarse las fronteras deben presentar el escaparate de forma que se entienda allí donde quieren llegar. Esto ocurre en un doble sentido: los negocios de cualquier país con ansias de expansión deben transformar sus contenidos, mayoritariamente al inglés, para darse a conocer, y las empresas estadounidenses no pueden obviar el poder de las lenguas minoritarias a la ahora de conquistar nuevos territorios.

Todo esto conduce a una imperiosa necesidad: adaptar lingüística y culturalmente los contenidos para penetrar en cualquier mercado. Con el inglés se llega muy lejos… pero ninguna tienda de la Red debería despreciar llegar a territorio francófono, germano, hispano o chino.

Las máquinas y el lenguaje

Una vez que las palabras se han convertido en números (ceros y unos), ¿por qué no dejar que las máquinas nos echen una mano con el lenguaje? No se trata de que escriban por nosotros; pero con las palabras —y la información que conforman: textos, noticias, estudios, bases de datos, libros, etc.— se pueden hacer muchas cosas: almacenar, buscar, tratar, clasificar, recuperar… Todas estas tareas que se realizan sobre los textos requieren una dedicación y un tiempo que se reduce espectacularmente con la ayuda de una computadora. Que, además, aumenta la efectividad y precisión de dichos trabajos.

Detrás del lenguaje existe una industria. Un negocio cuyo valor consiste en traducir, interpretar, adaptar culturalmente los contenidos (textos, iconos, programas, etc.) para hacerlos universales. Cuya fuerza estriba en pasar por encima de barreras idiomáticas. Esa industria que se mueve alrededor de la Lengua no aparece frecuentemente en los medios, pero esta ahí y mueve miles de millones de dólares. Medir su tamaño y peso económico es complicado, aunque José Antonio Millán ha realizado un meritorio esfuerzo para cuantificar el sector de la lengua española como herramienta.

La idea de trabajar sobre el lenguaje con ayuda de las máquinas viene de lejos; nace prácticamente a la vez que las primeras computadoras. La lingüística computacional empezó con la traducción automática de mensajes en clave. En muchas ocasiones los ejércitos utilizaban lenguas minoritarias, desde euskera hasta cherokee, para enviar mensajes indescifrables para el enemigo, convirtiendo a los traductores automáticos en una herramienta de guerra imprescindible (sobre todo durante la contienda entre Estados Unidos y Japón en la II Guerra Mundial). A partir de ahí comenzó a evolucionar lo que se conoce como Ingeniería Lingüística, que, según un documento reciente de la Comisión Europea, podría definirse como \”la aplicación de los conocimientos sobre la lengua al desarrollo de sistemas informáticos que puedan reconocer, comprender, interpretar y generar lenguaje humano en todas sus formas\”.

Una industria multidisciplinar

Cuando se habla de industrias de la lengua se está hablando de la aplicación de una serie de disciplinas, lo que se conoce como ingeniería lingüística o tecnología lingüística que, básicamente, comprende:

  • Publicaciones electrónicas
  • Sistemas de gestión de información (manejo y recuperación de información, clasificación automática de documentos, resúmenes automáticos, etc.)
  • Herramientas de escritura (editores de textos, correctores…)
  • Traducción y tratamiento multilingüe del lenguaje (traducción automática y traducción asistida)

El sector de industrias de la lengua es muy amplio, abarca desde las publicaciones electrónicas (diccionarios y enciclopedias en CDROM, que internamente funcionan con un tratamiento automático del lenguaje) a numerosas aplicaciones que se han potenciado con la llegada de Internet, como la recuperación de información precisa en un ciberespacio saturado. Cuando se lanzan búsquedas en Internet o en cualquier base de datos documental, se necesita no solamente lograr la mayor eficacia de esa pesquisa en una sola lengua—lo cual ya implica un tratamiento de ingeniería lingüística para conseguir que a partir las palabras de una consulta se consigan recuperar los documentos pertinentes—, sino que además se plantea la necesidad de que esa recuperación documental se pueda realizar en varias lenguas.

En este momento existen sistemas de recuperación de información bastante evolucionados para una sola lengua, que además de algoritmos estadísticos y métodos de identificación de palabras clave utilizan por detrás redes semánticas o tesauros más complejos para refinar las búsquedas. En Europa en los años 90 se realizó un esfuerzo importante con un proyecto denominado Eurowornet, que consistía en la creación de una red semántica multilingüe, es decir, la descripción del léxico de una lengua legible por un ordenador, incluso el contenido semántico.

Aunque ya se ha avanzado en este campo y existen recursos de redes semánticas multilingües, aún no existe un sistema de recuperación de información que cruce lenguas de forma ágil. Todavía se está trabajando en ello, lo que da la medida del esfuerzo que suponen los desarrollos en la industria de la Lengua; pasan bastantes años entre que se crea un modelo, se pone a prueba ese modelo, se desarrolla la infraestructura y luego se puede montar una aplicación. Es un desarrollo largo; todo lo que implica el tratamiento del lenguaje natural es muy complejo.

Pero la idea de una \’web semántica\’, en la que los ordenadores no sólo son capaces de presentar la información contenida en las páginas web sino que además entienden dicha información, lejos de ser un sueño romántico, es una apuesta de futuro muy real.

Otro ámbito en el que la industria de la Lengua se ha desarrollado se encuentra, de forma más general, en todo lo que es el manejo de información: clasificación automática de documentos, resúmenes automáticos, etc. Este tipo de herramientas son cada vez más necesarias, porque en Internet el cuello de botella es el ser humano: no somos capaces de procesar tanta información como a la que tenemos acceso. De tal manera que cualquier sistema que nos permita ordenar automáticamente la información de acuerdo a unos criterios —desde una clasificación coherente y sensible al contenido que valdría para gestionar una entrada masiva de emails, hasta la clasificación de informes, noticias, etc.— constituye una ayuda indispensable. La clasificación documental está desarrollandose también mediante técnicas estadísticas en conjunción con el conocimiento y tratamiento de los contenidos de los textos.

Las otras dos parcelas en las que se mueve la industria de la Lengua son las herramientas de escritura, en las que se comenzó a trabajar a principios de los 90 con el desarrollo de correctores y editores de texto, y las traducciones (con todas las aplicaciones que ayudan al tratamiento multilingüe de la información), potenciadas enormemente con el nacimiento de la Web.

Internet y los retos del futuro

Definitivamente, dentro de las industrias de la lengua hay un antes y un después de Internet. Basta decir que antes de la popularización de la Red, uno de los principales problemas de las industrias de la lengua era conseguir corpus (textos en formato electrónico) que sirvieran de materia prima para la experimentación, para desarrollar y poner a prueba nuevos sistemas. Internet ha suministrado una inmensa biblioteca, un corpus enorme de textos en múltiples lenguas, y ha impulsado esta industria en un doble sentido: proporcionando material sobre el que trabajar a destajo y creando nuevas necesidades de mercado que ayudan a que se invierta más en investigación y desarrollo de proyectos y en empresas relacionados con la Lengua.

Aunque se avanza cada día en el tratamiento automático de los textos, las herramientas disponibles para el usuario medio dejan mucho que desear. Para comprobarlo, no hay más que intentar leer la traducción que devuelve el BabelFish de Altavista cuando se escriben las primeras líneas de El ingenioso hidalgo don Quijote de la Mancha en inglés:

\”En una aldea del la Mancha, el nombre de la cual yo no tiene ningún deseo de llamar para importar, allí vivido no de largo puesto que uno de esos caballeros que mantienen una lanza el lanza-estante, un viejo buckler, un corte magro, y un greyhound para cursar\”.

Al igual que hay una pregunta \’prohibida\’ en el campo de la lingüística (\”¿Cómo y cuando nació el lenguaje?\” ) a la que sólo se puede responder con teorías indemostrables, la cuestión \”¿Cuándo podremos llegar a una traducción 100% automática de alta calidad y fiabilidad?\” es un poco la pregunta del millón.

Cuando se aborda la traducción de un texto hay que tener en cuenta que existen dos niveles de calidad: el de la comprensión, válido cuando sólo hace falta entender a grandes rasgos lo que dice un texto, y el de la calidad/exactitud lingüística en sí. Para el entorno empresarial, las relaciones comerciales y las relaciones profesionales no es suficiente una calidad de comprensión.

Sesenta años después del nacimiento de la ingeniería lingüística con las primeras traducciones automáticas (en la II Guerra Mundial), no se ha abandonado la fase experimental. A lo largo de ese periodo, numerosas empresas han anunciado novedosos productos para la traducción automática que, una vez puestos a prueba, han demostrado sus carencias. A la hora de pensar si algún día será posible, hay que tener en cuenta la complejidad del lenguaje humano; saber cómo funciona el lenguaje y poder reproducirlo o modelarlo con un ordenador todavía llevará unos cuantos lustros.

Pero no se puede decir que estemos parados. No hay más que comparar los sistemas de los años setenta con los de ahora para comprobar que se han dado pasos importantes. Sobre todo, se ha avanzado en la traducción asistida, en la creación de herramientas que ayuden a traductores humanos. La traducción automática tiene futuro, pero nunca hay que dejar de lado que el lenguaje es algo que está a medias entre el conocimiento y la experiencia. Aunque una computadora acumule todo el conocimiento lingüístico posible, si no se le proporciona experiencia difícilmente va a poder representar o traducir matices, connotaciones, etc. Se trata de conseguir que las máquinas aprendan: que cada texto que pasa por las tripas del ordenador se convierta en una experiencia lingüística enriquecedora para el sistema.

Lo realmente importante es conocer para qué va a ser útil la traducción automática: en este momento sería suficiente determinar cuándo funciona y cuándo no, porque de esa manera se puede establecer para qué casos son más efectivos otros métodos alternativos, como la traducción asistida por seres humanos.

De hecho, desde finales de los 90 se ha impulsado y mucho la traducción asistida: las herramientas y aplicaciones que ayudan al traductor a trabajar más rápido y mejor. El traductor profesional, lejos de sentirse amenazado por las máquinas, ha comprobado que por fin tiene herramientas especializadas para hacer su trabajo más rentable. Entre las dos vías de la industria de la Lengua que tratan la traducción, automática y asistida, se está trabajando más en la segunda porque resuelve problemas a corto plazo, que es lo que pide el mercado. Lo demás, llegará…

La crisis.com no es una vuelta atrás

La recesión, la crisis bursátil y la invalidez de muchos modelos de negocio nacidos para la Red, no significan retroceso que frene al desarrollo de la industria de la Lengua en el inmenso campo del ciberespacio. En la historia hay modas pasajeras y cambios paradigmáticos. Internet es un cambio paradigmático e imparable en los estratos culturales, económicos y sociales. La Red permite unos niveles de comunicación impensables en la historia de la humanidad. Podrá haber periodos de adaptación, momentos más o menos duros, pero no hay marcha atrás.

Sobre esta base, hay que pensar que el negocio de la industria de la Lengua en el espacio Red está muy lejos de su techo. El desarrollo del comercio electrónico seguirá generando la necesidad de contar con herramientas que contribuyan a la comunicación global. Las empresas de EEUU, motor de la economía de Internet, no han dejado aparcada su intención de conquistar mercados que hablen otras lenguas, por lo que está garantizada la inversión en aquellas empresas punteras que estén ahí para ofrecer soluciones de internacionalización, sean o no estadounidenses.

Pedro L. Díez Orzas, CEO y fundador de la empresa española de soluciones integradas para la \’internacionalización web\’ Linguaserve, aporta varios datos para ratificar este hecho.

  • Los estudios y la experiencia demuestran que cuando un usuario se encuentra los contenidos o servicios en su propia lengua y cultura, la intención de compra se multiplica por cuatro. Las empresas estadounidenses, aunque triunfen en su propio mercado, siempre harán la siguiente pregunta: \”¿Qué inversión tengo que realizar para obtener mayor rentabilidad o mayor cuota de mercado\”? Si les salen las cuentas irán adelante, y apostarán en serio.
  • En Estados Unidos hay 30 millones de hispanohablantes. El mercado interno está por primera vez exigiendo un cierto nivel multilingüe, porque hay un grupo social importante, con potencia política y económica, que habla otra lengua y que exige servicios en su idioma. El español que se habla EEUU, al ser producto de grupos hispanos de muy diverso origen, todavía no se ha convertido en una variedad; no existe la variedad \’español de Estados Unidos\’. Por ello, el empresario estadounidense se encuentra con un problema a la hora de adaptar los contenidos al español, y opta por un estándar internacional reconocido, el español que se habla en España. Además, a ese empresario se le puede hacer ver que en función de sus objetivos sí existe una variedad de español que le pueda interesar (caribeño, mexicano, argentino, etc.). Entonces se le abren los ojos y descubre el mercado potencial que suponen los 300 millones de hispanos de Latinoamérica.
  • El comercio electrónico en Europa desde el año 98 ha crecido vertiginosamente, cada vez mueve más dinero y eso es un dato económico que una empresa de EEUU tiene al alcance y no puede obviar. La forma de entrar en Europa con más o menos potencia depende del sector; hay sectores más conscientes que otros de que la calidad y la agilidad son cruciales para que su implantación en Europa sea efectiva. Como quiera que el desarrollo de la industria de la Lengua europea le saca unos cuantos cuerpos de ventaja a la de EEUU, los empresarios estadounidenses son conscientes de que con la misma inversión en una empresa del Viejo Continente reciben mayor calidad. Eso es lo que tratan de promover las empresas europeas que trabajan en la internacionalización, que no quieren dejar pasar la oportunidad de ser los líderes en este sector, aprovechando su superioridad tecnológica en el campo de la Lengua.

Lo importante es resaltar la estrecha relación del binomio lengua-comercio electrónico, como explica Francisco A. Marcos Marín en El Español en el Mundo (Anuario 2000 del Instituto Cervantes): \”Si el comercio electrónico es en realidad más una cuestión de cambio cultural que otra cosa, con nuevos modelos comerciales, el papel de la lengua en él puede ser más importante de lo que parecería a simple vista y, en cualquier caso, es preciso explorar cualquier posible ventaja\”.

Europa y España, en vanguardia

Sin que sirva de precedente, el sector de las industrias de la lengua no presenta el habitual retraso de Europa respecto a EEUU; incluso en muchos aspectos se va a la par o incluso por delante. La desventaja real de cualquier lengua respecto al Inglés en Internet, se compensa de alguna manera con el esfuerzo tecnológico de las empresas no estadounidenses por trabajar con el lenguaje.

Las más importantes empresas que trabajan en tecnología lingüística están en Europa (hasta ahora el líder del sector, Lernout & Hauspie, es europeo), aunque es verdad que todas las empresas europeas con cierto tamaño tienen participación norteamericana. Además, el mercado absorbe industrias de la lengua a través de grandes empresas estadounidenses, como Microsoft, que con su Office lidera ampliamente el mercado. WordPerfect, por ejemplo, optó en su día por comprar una empresa europea para desarrollar los correctores gramaticales y ortográficos, porque lo que se estaba haciendo en EEUU era de menor calidad.

En España se ha trabajado mucho en los últimos 15 años y está en una posición óptima para liderar el sector en lengua española, ya que en Latinoamérica no cuentan con tecnología tan avanzada. La oportunidad que tiene el sector industrial y de investigación español en el mundo de la Lengua (con respecto al español y, cuando hablamos de multilingüismo, con respecto a sistemas de ayuda de traducción del español a otras lenguas), es privilegiada, siempre y cuando se aproveche. Porque las oportunidades llegan y pasan.

Puede ocurrir que sean empresas no españolas las que el día de mañana lideren el tratamiento de la lengua de Cervantes de forma automática, que es exactamente lo que tratan de evitar iniciativas como la de Linguaserve. \”Depende de nosotros, exclusivamente de nosotros, no desaprovechar esta ocasión; debemos ofrecer modelos tecnológicamente muy desarrollados, con niveles de calidad muy altos, a costes muy competitivos\”, afirma Díez Orzas.

Un negocio \’necesario\’

Como se menciona más arriba, hay unas cifras que no cuadran. Casi la mitad de los internautas no son anglófonos y además tiene dificultades para entender inglés. Sin embargo, el 80% de los contenidos en Internet sólo están en inglés. Esto produce un tremendo desajuste: el 45% de los usuarios sólo tienen acceso a un 20% de la Red. El desfase es tan grande que no se puede obviar la imperiosa necesidad de internacionalización de ese 80% de los contenidos de Internet que pasa desapercibido a los ojos de la mitad de los usuarios.

\”Que vayan a la escuela de idiomas o ellos se lo pierden\”, podría pensar algún iluminado que ha estudiado en colegio de pago. Pero las empresas sin estrecheces de miras son conscientes de que ellos también pierden a todos los posibles clientes que no saben qué es lo que venden.

La tarea es tan grande que es difícil determinar por dónde va a comenzar la adaptación de los contenidos a nuevas lenguas. \”Son los hombres los que inventan a los Dioses y no al revés: son los modelos de la economía tradicional los que se implantan en la virtual\”, apunta el CEO de Linguaserve. Serán los sectores que se vayan adaptando mejor a las necesidades de la Nueva Economía, como el turismo o la tecnología, los que tirarán del carro.

El abismo lingüístico de la Red es un problema social y una lucha institucional. Dentro de los tres puntos básicos de la concepción de la Unión Europea está la igualdad de oportunidades para todos los ciudadanos y el respeto por las diferencias culturales. El hecho de que la documentación científica esté sólo en inglés, hace que exista una enorme desigualdad respecto al acceso al conocimiento. El \’problema\’ del multilingüismo en Europa no hace sino jugar a favor de la expansión y consolidación del inglés como idioma global: el 90% de los textos científicos alemanes se publican en inglés, el idioma oficial del Banco Central Europeo, por poner dos ejemplos. Sin embargo, depende muy mucho del desarrollo de la ingeniería lingüística que esta situación cambie.

La tecnología influirá decisivamente en las evolución de las lenguas y, aunque haya idiomas mejor situados que otros en la parrilla de salida de la Sociedad de la Información, \”por numerosos que sean sus hablantes o grande el poder del gobierno que la utiliza, ninguna lengua tiene garantizada su pervivencia\”, según Marcos Marín. Ahí entra en juego el \’componente social\’ de las empresas de tecnología lingüística, que tienen en sus manos algunos de los hilos para mover el destino las lenguas. \”Las lenguas se utilizan para comunicarse, pero además constituyen una forma de ver el mundo. Ahora mismo hay más de 3.000 distintas, y cada año hay lenguas que desaparecen definitivamente: cuando una lengua se extingue, se pierde una cultura y una forma de ver el mundo, lo que es muy grave para el enriquecimiento de la humanidad\”, afirma Díez Orzas.

Al margen de la cuestión económica que envuelve la adaptación de las empresas para adentrarse en nuevos mercados, la industria de la Lengua se mueve rodeada de implicaciones culturales y sociales. El tratamiento automático del lenguaje permite que las sociedades más evolucionadas tecnológicamente compartan con las menos desarrolladas el acceso a la información con mayor igualdad de oportunidades. Porque la tecnología permite que no solamente se puedan manejar eficazmente las lenguas mayoritarias, sino que las minoritarias puedan desarrollar recursos lingüísticos adaptados a sus necesidades —y economías— para no quedarse al margen, para no perecer.

No olvidemos que tras los rudos vocablos \’ingeniería lingüística\’ se esconden técnicas que facilitan la transmisión del saber. Y algo que puede sonar tan virtual como utópico (la \”universalización del saber\”) adquiere tintes pragmáticos si se constatan, por ejemplo, los esfuerzos empresariales e institucionales que recaen sobre el e-learning. Las infinitas posibilidades de la tecnología aplicada a la educación, afectan tanto al contenido, calidad y eficacia de la misma como a su alcance.

Educación, acceso igualitario a la información, libros electrónicos, bibliotecas en la Red, traducciones automáticas, herramientas de lectura/escritura para personas con minusvalías, búsquedas precisas en bases de datos, recuperación inmediata de información, adaptación de contenidos…. Muchas son los tareas que tiene en el horizonte la lengua como industria. El cumplimiento de estos retos está en buena medida relacionado con la adopción de la Red como parte indivisible de nuestras vidas.

Con palabras más precisas lo explica Luis Ángel Férnandez Hermana, director de la revista electrónica en.red.ando, en su articulo sobre el español en la Red Quintos en el campeonato y bajando, que bien puede servir para cualquier idioma:

\”Finalmente, el destino de la lengua como industria, en un mundo donde la información actuará como elemento organizador de la economía, estará unida a su capacidad para expandir Internet hacia los aspectos más cotidianos de la vida ciudadana. Descubrir las nuevas oportunidades, enlazar comunidades cuyos intereses comunes permanecen envueltos en el velo opaco de la falta de interrelación, invadir los terrenos que hasta ahora han permanecido cuidadosamente parcelados por un tipo de conocimiento elitista, son algunas de las tareas pendientes donde los contenidos en castellano apenas han incursionado. En el fondo, se trata de fundir la cultura de lo real en la cultura de lo virtual y vehicular este tránsito a través de la lengua\”.

Temas relacionados:
  • La ingeniería lingüística en España Centro Virtual Cervantes
  • La ingeniería lingüística en la Sociedad de la Información Universitat Autònoma de Barcelona
  • La lengua que era un tesoro José Antonio Millán
  • INDUSTRIAS DE LA LENGUA: Las lenguas de España y la ingeniería lingüística Unión Latina
  • Estudios de Lingüística Española Red IRIS

  • Compartir en :


    Noticias relacionadas

    Recomendamos




    Comentarios