
CLARIN kao projekt u sklopu EU je akronim za Common Language Resources and Technology Infrastructure. Ovaj projekt ima za zadatak ujediniti sve postojeće digitalne arhive (odnosno baze podataka časopisa, digitalne knjižnice…) u Europi koji sadrže dokumente o jeziku i jezičnim tehnologijama i omogućiti pristup materijalima i alatima (bilo za obradu teksta, govora, multimedije) s društveno-humanističkog područja svim stručnjacima, ali i ne-stručnjacima. Ovim projektom i ovim servisom (koji pruža usluge pristupa materijalima o jeziku i jezičnim alatima) otvara se mogućnost da materijali s društveno-humanističkog područja koji su dosada pripadali nevidljivom webu postanu javno dostupni svima.
Time će zasigurno zagovornici otvorenog pristupa informacijama svim korisnicima u narednim periodima doći na svoje jer sve ide u tom smjeru.
Naravno, tu će se naći i određeni broj nezadovoljnih, posebice časopisi koji su pristup svojim bazama podataka naplaćivali. Od čega će se sada naplaćivati? Paradoksalno je da časopis Oxford Journals ima takvu politiku da naplaćuje pregled jednog članka 28$ kojeg čitamo samo jedan dan (24 sata), a dogođa se da iste te članke možete pronaći pretraživanje tražilice Google. Da se vratim opet malo na otvoreni pristup, zanimljivo je da Kinezi već uvelike prebacuju svoje sustave na Linux okruženja i odbacuju Microsoftovu politiku nimalo besplatnog i otvorenog pristupa.

Projekt Clarin
Treba napomenuti da ovaj projekt zasada ujedinjuje 22 zemlje Europe (među kojima je i Hrvatska čiji su predstavnici na nacionalnoj razini prof. dr. sc. Marko Tadić s Filozofskog fakulteta u Zagrebu i dr.sc. Damir Ćavar s Instituta za hrvatski jezik i jezikoslovlje). Visina budžeta? Govorimo o 4.1 milijun eura za početnu ili inicijalnu fazu razvoja kojih osigurava EU, a koja bi trebala završiti 2010. godine, a konačni troškovi bi iznosili 165 milijuna eura.
Nimalo nevažan dio za spomenuti je da izgradnja ovakvog sustava zahtjeva cijeli niz stručnjaka s područja informacijsko – komunikacijskih tehnologija (inženjera, informacijskih stručnjaka, programera, administratora baza podataka, itd.) jer bez projektiranja sustava odnosno tehničke infrastrukture koja će ‘uskladištiti’ veliki broj materijala u digitalnom formatu, ovaj projekt, naravno ne bi imao previše smisla. Ključne tehnološke postavke su naravno koristiti tehnologije semantičkog weba (W3C konzorcij), ‘data grid’ tehnologije, inicijative kao što su EAGLES/ISLE, TEI, alate kao što je GATE, i sl.