El digital Racó Català ha cedit al projecte AINA el contingut dels seus fòrums de forma anonimitzada per contribuir al desenvolupament de la intel·ligència artificial en català, en el marc d’aquesta iniciativa liderada pel Departament de Polítiques Digitals de la Generalitat en col·laboració amb el Barcelona Supercomputing Center.

El mitjà destaca que els seus fòrums són “la base de dades més gran a nivell estatal” de contingut en català generat pels usuaris, i permetrà als sistemes d’IA reconèixer indicadors importants com les emocions, els posicionaments o el llenguatge ofensiu.

Racó Digital explica que el contingut dels seus fòrums és “especialment interessant perquè acull diferents registres i dialectes”, a diferència del material cedit al projecte per l’Agència Catalana de Notícies o l’Enciclopèdia Catalana, el qual “reflecteix un català normatiu”.

“Gràcies a l’aportació de Racó Català, els models lingüístics generats dins del marc del projecte AINA ara podran interpretar també el llenguatge propi dels contextos informals i dialectals”, ressalta el mitjà.

Salt qualitatiu i quantitatiu

La intel·ligència artificial i les tecnologies del llenguatge es basen en l’aplicació d’algorismes sobre grans conjunts de dades de qualitat. Fins ara, recopilar aquestes dades per al català, entrenar i avaluar els models, i implementar aplicacions basades en aquestes tecnologies es realitzava mitjançant el voluntariat (com Softcatalà) o grups universitaris.

Amb el projecte AINA impulsat pel Govern aquesta tasca fa un salt qualitatiu i quantitatiu per assolir una veritable infraestructura tècnica per aprofitar els avantatges de l’IA al mateix nivell i potencial que en altres llengües com l’anglès, el castellà o l’alemany.