la IA quiere hablar español


Ni sol ni playa, ni aceite de oliva, ni vino. El verdadero activo de España es el español. La lengua de Cervantes es el idioma materno del 6,2% de la población mundial. Alrededor de unos 500 millones de personas lo hablan, solo superado por el chino mandarín. «No puede decirse en qué lugar se habla un mejor español, porque no hay un castellano, sino muchos», decía el escritor colombiano Gabriel García Márquez.

«La riqueza y diversidad lingüística del español son aspectos fascinantes de esta lengua global», responde a esa pregunta sin ‘mojarse’ demasiado ChatGPT, la tecnología de OpenAI. Si como dice Mariano Jabonero, secretario de la Organización de Estados Iberoamericanos: «La lengua determina la posición de un país en muchos lugares y también en la geopolítica».

No sería baladí tener en consideración la influencia de artistas como Bad Bunny, cantante puertorriqueño tan solo superado por el fenómeno Taylor Swift, y cuyo álbum ‘Un verano sin ti’ ha sido el más escuchado en Spotify. El español ha sonado gracias a este artista un total de 13,5 millones de veces. Y es que nuestra lengua materna es un motor económico donde la población mundial que la habla tiene una capacidad de compra de en torno al 10% del PIB mundial.

En España aporta el 16% del valor del PIB y del empleo y, solo en la industria cultural, supone alrededor del 3% del PIB. «La cultura es lengua», apunta Jabonero. La renta per cápita de los hispanohablantes ascendería a casi 21.000 euros, aunque la previsión para las próximas décadas es que mengüe por la irrupción de nuevas tecnologías. Y ello a pesar de que el español es el tercer idioma más hablado en internet y la segunda lengua más usada en las redes sociales. Sin embargo, esas nuevas herramientas tecnológicas se entienden más con la lengua de Shakespeare que con la cervantina.

See also  GLOSAS EMILIANENSES | El códice "robado" del siglo X con los primeros textos en español y euskera que La Rioja reclama al Gobierno

«El español va detrás del inglés, porque, evidentemente, esta tecnología la están desarrollando grandes empresas tecnológicas y son estadounidenses», señala Asunción Gómez-Pérez, miembro de número de la Real Academia Española (RAE), licenciada en Informática por la Universidad Politécnica de Madrid y doctorada en Ciencias de la Computación e Inteligencia Artificial.

Y lo está a pesar de los esfuerzos españoles para intentar no perder el viento de cola de estos nuevos modelos de lenguaje que se presentan como una de las grandes revoluciones en internet. MarIA y LuzIA son los nombres de las apuestas nacionales que intentan plantar cara a Bard, ChatGPT, oSocratic, entre otras. Internet se adentra en una nueva era en la que los «motores de búsqueda no localizan dónde están los contenidos que, aparentemente, mejor encajan con lo que preguntamos», describe Senén Barro, catedrático de Ciencias de la Computación e Inteligencia Artificial y director científico del CiTIUS de la Universidad de Santiago de Compostela.

«Ahora no buscan, construyen una respuesta a partir de enormes cantidades de información», añade. «Sin lengua no hay IA, es su principal materia prima», recordó Jabonero durante su intervención en el Foro El Futuro del Español organizado recientemente por el diario ‘La Rioja’. MarIA ha sido entrenada con 135.733.450.668 palabras procedentes de millones de páginas web recopiladas por la Biblioteca Nacional.

«Es importantísimo los textos que se usan», detalla Gómez-Pérez. «Si solo se usa el Boletín Oficial del Estado hablará como el BOE y si solo lo hace con frases groseras utilizará esas palabras», zanja. En el caso de MarIA fue necesario realizar una criba para eliminar todos los fragmentos de texto que no fueran «lenguaje bien formado» y así entrenar correctamente a la IA. «Tenemos que conservar las lenguas», señala Puyol.

See also  Premier League: Sir Jim Ratcliffe quiere convertir Old Trafford en el 'Wembley del norte'

LEIA como protectora

A pesar de su nombre, George Lucas no se ha vuelto el fiel escudero del español en la inteligencia artificial. LEIA es el acrónimo de Lengua Española e Inteligencia Artificial que tiene como misión proteger y defender el buen uso del idioma en las nuevas tecnologías.

«La IA habla inglés, fundamentalmente, y tenemos que procurar que, poco a poco, el español coja una posición eminente», advirtió Santiago Muñoz Machado, director de la RAE y presidente de la ASALE, en la presentación de este proyecto. «Estamos en un momento crucial en el que tenemos que hacer algo que hicieron nuestros antecesores del siglo XVIII (con los humanos): normativizar la lengua de las máquinas y de la inteligencia artificial», añadió.

Esta iniciativa creada por la Real Academia Española es impulsada inicialmente junto con Telefónica y cuenta, además, con la colaboración de otras importantes empresas tecnológicas como Google, Amazon, Microsoft, X y Meta. Un trabajo conjunto que incluye la colaboración para el desarrollo de sus asistentes de voz, procesadores de texto, buscadores, chatbots, sistemas de mensajería instantánea, redes sociales y cualquier otro recurso, así como para seguir los criterios sobre buen uso del español aprobados por los estándares de la RAE. En su nacimiento también se llegó al compromiso de facilitar que el español esté disponible como lengua de uso de sus productos y servicios, con el fin de que los ciudadanos puedan disfrutar, en esta lengua, de los beneficios que ofrezca la inteligencia artificial.

Related Articles

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button