Tagaroo: još jedan primjerak semantičkog weba za blogere i izdavače
Tagaroo je plugin (za WordPress) koji omogućuje automatsku analizu sadržaja posta bloga i na temelju te analize preporučuje relevantne tagove i slike koji mogu nadopuniti sadržaj bloga o kojem pišete. Tagaroo u svakom slučaju svojom funkcijom podsjeća do određene mjere na spomenutu Zemantu. Razlika je u izvorima iz koje dohvaćaju svoje informacije – Zemanta ih pronalazi iz više njih, dok Tagaroo to čini iz jednog izvora – Flickra.
Što uopće podrazumijevamo pod pojmom automatska analiza? Taj postupak zasigurno uključuje korištenje znanja i alata za obradu prirodnog jezika. Sigurno je da se radi o ekstrakciji (analizi, dohvatu) informacija (engl. information extraction) iz određenih nestrukturiranih dokumenata (teksta, sadržaja) koja uključuje prepoznavanje imenskih entiteta (engl. named entity recognition) – vlastitih imena, organizacija, mjesta, valuta, datuma i sl. te pronalazi za prepoznate podatke rezultate fotografija s Flickra što bi bilo pronalaženje informacija (engl. information retrieval).
Tagaroo zapravo omogućuje tagiranje sadržaja vašega posta na način da dodjeljuje metapodatke ili tagove riječima u vašem postu svrstavajući ih primjerice u kategorije vlastito ime, tvrtka, grad, i sl. Na taj način ostvaruje se uvid u kontekst vašega posta. Primjerice ukoliko se u vašem tekstu pojavljuju riječ mouse koja može označavati životinju ili izlaznu jedinicu računala (dok MOUSE napisan velikim slovima označava organizaciju, ista riječ se pojavljuje u imenu recimo Mickey Mouse, koji zapravo predstavlja jedan token, itd.) metapodaci bi trebali razriješiti taj problem višeznačnosti, odnosno utvrditi na što se ta riječ odnosi u vašem tekstu. Ili primjerice odnosi li se riječ Washington u vašem postu na grad, osobu ili saveznu državu? Naravno, ako se Washington odnosi na vlastito ime onda bi zasigurno trebalo pisati recimo George Washington što onda predstavlja jedan token i onda to Tagaroo prepoznaje kao osobu ili ‘person’. I u slučaju hrvatskoga jezika prepoznaje imenske entitete u tekstu i predlaže odgovarajuće tagove.
1 comment
danijel
11.10.2009.e sada si mi uljepšala dan
baš ću testirati ovaj plugin, do sada sam koristio addone za FF pa nisam mogao pisati blogove sa nekih drugih browsera 
hvala…
ps super su ti postovi